跳转到主要内容

Tilde AI发布面向欧洲语言的开源大语言模型

Tilde AI发布开源语言模型 促进欧洲语言多样性

拉脱维亚语言技术公司Tilde正式推出TildeOpen LLM——一个专门为欧洲语言设计的开源基础大语言模型,尤其关注使用人数较少的地区性语言。该项目于2025年9月3日发布,标志着欧盟在推动语言公平性数字主权方面取得重大进展。

Image

技术规格与训练过程

这款采用密集解码器架构的30亿参数模型基于宽松的CC-BY-4.0许可协议,支持从拉脱维亚语、立陶宛语到乌克兰语、土耳其语等多种语言。训练工作在欧洲超级计算机LUMI(芬兰)JUPITER上完成,总计消耗了欧盟委员会"大型AI挑战赛"提供的200万GPU小时计算资源。

技术实现采用了受EleutherAI启发的GPT-NeoX脚本,具体包含:

  • 45万次参数更新
  • 约20万亿已处理词元
  • 三阶段采样方法:
    1. 跨语言的均匀分布采样
    2. 对高资源语言的天然分布增强
    3. 最终均匀扫描确保平衡性

关键架构特性包括:

  • 60个网络层与6144维嵌入空间
  • 48个注意力头
  • 8192词元的上下文窗口
  • SwiGLU激活函数
  • RoPE位置编码
  • RMSNorm层归一化

解决语言公平性挑战

传统大语言模型在处理波罗的海语系、斯拉夫语系等欧洲小语种时往往表现不佳,容易出现语法错误和不自然的表达。TildeOpen创新性地引入了"公平分词器",能够:

  • 在词元空间中对所有语言进行均衡表征
  • 通过减少词元数量提升效率
  • 显著改善小语种的推理性能

    该模型还允许组织在本地数据中心或符合欧盟标准的安全云环境中自主部署,既满足《通用数据保护条例》(GDPR)等数据保护法规要求,也解决了外国托管平台涉及的主权顾虑。

    未来发展路线图

    作为基础模型,TildeOpen将衍生出多个专用版本包括:

  • 经过指令微调的变体
  • 增强型翻译模型

    该项目使拉脱维亚成为全球AI发展领域的新兴力量,同时有力推动了语言学多样性的保护工作。

    核心亮点

    🌍 多语言支持: 专注服务欧洲小众语言的独特需求 💻 欧盟本土训练: 依托欧洲超级计算机与先进采样技术 🔒 主权合规: 为组织机构提供符合GDPR的部署方案

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

News

法国Mistral豪掷14亿美元在瑞典建数据中心,押注欧洲AI自主权

法国AI初创公司Mistral正为欧洲技术主权做出最大胆的举措,投资12亿欧元建造瑞典最大的AI数据中心。该设施计划于2027年启用,旨在减少欧洲对美国云服务的依赖,同时用清洁能源驱动下一代AI模型。在ASML和NVIDIA等投资者的支持下,Mistral的豪赌可能重塑欧洲在全球AI竞赛中的地位。

February 12, 2026
AI主权欧洲科技数据中心
阿里巴巴RynnBrain赋予机器人人类般的记忆与推理能力
News

阿里巴巴RynnBrain赋予机器人人类般的记忆与推理能力

阿里巴巴达摩院开源RynnBrain,这项具身智能领域的突破性技术让机器人获得了空间记忆与推理能力。该技术在16项基准测试中超越谷歌Gemini,标志着国内AI发展的重大飞跃。通过公开包括300亿参数MoE版本在内的七个模型,阿里巴巴旨在加速机器人在现实世界的应用落地。

February 10, 2026
人工智能机器人技术开源
智谱AI的GLM-4.7-Flash模型两周内下载量突破百万
News

智谱AI的GLM-4.7-Flash模型两周内下载量突破百万

智谱AI推出的轻量级模型GLM-4.7-Flash在开源社区引发轰动,发布仅14天便在Hugging Face平台实现超百万次下载。这款混合思维模型在基准测试中表现优于竞品,为开发者提供了高效且经济实惠的AI应用解决方案。其快速采用标志着市场对智谱AI平衡性能与实际部署需求策略的高度认可。

February 4, 2026
AI发展开源机器学习
OpenClaw:终于找到名字的龙虾AI
News

OpenClaw:终于找到名字的龙虾AI

这款曾用名为Clawd的开源AI助手经历第三次品牌重塑,在商标障碍和社区反馈后最终定名OpenClaw。尽管命名风波不断,该项目人气飙升,GitHub星标数突破10万的同时保留了其标志性的龙虾吉祥物。作为跨平台本地AI处理器,OpenClaw让用户能管理邮件、日历等事务且所有数据保持私有化。

January 30, 2026
AI开源隐私科技
News

京东云将开源助手Moltbot普及至大众

京东云推出了热门开源助手Moltbot的云端版本,消除了复杂的安装流程。这款原本需要专业技术才能本地部署的工具,如今在京东云平台仅需点击三次即可激活。该服务提供预配置镜像,解决了此前硬件稳定性和网络性能的挑战。此举或将使这款曾专属于开发者的工具实现民主化普及。

January 29, 2026
云计算开源AI助手
蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能
News

蚂蚁集团机器人技术飞跃:开源AI模型提升机器人智能

蚂蚁集团旗下灵波科技将其具身智能模型LingBot-VLA完全开源,标志着机器人技术的重大进步。该模型展现出卓越的跨平台适应性和训练效率,超越了现有框架。同时发布的新LingBot-Depth空间感知模型增强了机器人和自动驾驶车辆对3D环境的理解能力。这些发展或将加速智能机器人在各行业的应用。

January 28, 2026
机器人技术AI创新蚂蚁集团