瑞士发布Apertus:全球首个完全开源的多语言AI大模型
瑞士顶尖科研机构联合发布完全开源的Apertus AI大模型,提供80亿和700亿参数两个版本,支持1000多种语言训练。该模型以其完全透明的架构设计、多语言处理能力和严格的合规标准,为全球AI研究树立了新标杆。作为公共基础设施型AI的典范,Apertus将推动可信赖、主权化的AI生态发展。
完全开源:AI透明化的里程碑
Apertus模型由洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)和瑞士国家超级计算中心(CSCS)联合开发,其名称源自拉丁语'开放'。与仅公开部分细节的商业AI系统不同,Apertus实现了从架构设计、训练数据到文档说明的完全开源。据项目技术负责人Imanol Schlag介绍,这是目前少数达到此规模且完全开放的LLM之一,首次将多语言性、透明度和合规性作为核心设计原则。模型采用宽松的开源许可,支持研究、教育和商业项目的自由使用。
多语言能力:覆盖千种语言的突破
Apertus的训练过程使用了15万亿个token,涵盖1000多种语言,其中非英语数据占比达40%。特别值得注意的是,模型包含了常被主流LLM忽略的瑞士德语和罗曼什语等小众语言。据苏黎世联邦理工学院教授Martin Jaggi表示,这种多语言设计使Apertus能够更好地服务全球用户,特别是非英语地区的应用需求。瑞士电信(Swisscom)作为战略合作伙伴,已开始在其主权AI平台上部署该模型,强化瑞士的数字主权建设。
合规架构:严格遵循数据保护标准
Apertus的训练过程严格遵循瑞士数据保护法规、版权法以及欧盟AI法案的透明度要求。训练数据集仅限于公开可用信息,并经过过滤去除个人数据,同时尊重网站的退出请求。CSCS主任Thomas Schulthess教授强调,该项目不是传统意义上的技术转化,而是构建长期使用的基础设施。这种合规设计使Apertus成为企业级应用的可靠选择,特别是在对数据安全要求严格的金融、医疗等领域。
应用生态:从研究到商业的完整链路
开发者可通过Hugging Face平台直接下载模型,或通过瑞士电信的AI平台进行访问。在2025年10月5日前的瑞士AI周期间,开发者可参与黑客马拉松测试模型性能。据Public AI Inference Utility负责人Joshua Tan透露,Apertus证明了AI可以像高速公路、水电一样成为公共基础设施。目前模型已支持聊天机器人、翻译工具和教育应用等场景,未来还将针对法律、医疗、气候等专业领域开发定制化工具。
结语
Apertus的发布标志着开源AI进入新阶段,其'由公共机构建设、为公共利益服务'的模式为全球AI治理提供了新思路。正如EPFL教授Antoine Bosselut所言,这不仅是技术成果,更是对开放、可信赖AI基础建设的长期承诺。随着模型家族的持续扩展和专业化工具的开发,Apertus能否成为公共AI基础设施的全球标准,值得业界持续关注。