跳转到主要内容

Grab开发针对东南亚语言的AI模型

Grab用定制AI模型解决语言识别难题

根据最新技术博客,总部位于新加坡的超级应用公司Grab开发了自研视觉语言模型,以解决处理东南亚语言时的不足。这项创新源于现有商业解决方案在Grab业务覆盖的八国非拉丁文字处理上的普遍困境。

Image

图片来源说明:该图片由AI生成

合规性挑战

Grab平台在新加坡、马来西亚、印尼等国家提供网约车、外卖和金融服务,其客户验证流程需要精确的文档处理。传统OCR系统在处理区域文字编写的各类身份证件时表现欠佳。

"我们发现商业模型在东南亚语言上频繁出错",Grab工程师指出,"尽管开源视觉语言模型效率更高,但准确性仍然不足"。

打造专业解决方案

2025年,Grab开始研发自有的视觉大语言模型(VLLM),能够将图像向量化以提取文本。团队选择阿里云的Qwen2-VL2B作为基础架构,原因包括:

  • 适中的模型体积
  • 原生支持东南亚语言
  • 动态适应不同图像分辨率

公司通过以下方式创建专项训练数据:

  1. 从Common Crawl提取区域语言内容
  2. 建立合成数据管道生成不同字体/背景的文本
  3. 应用低秩自适应微调技术

最终模型在处理印尼文档时表现突出,同时持续开发泰语和越南语识别功能。

性能突破

定制解决方案展现多项优势:

  • 准确率超越通用OCR工具
  • 在区域语言能力上优于商业LLM
  • 通过针对性训练保持轻量高效
  • 实现可靠的合规文件处理 "高质量数据的战略运用证明,小型专业模型可以兼顾效果与效率",Grab表示。 随着运营复杂度增加,公司计划进一步开发模型以扩展文档处理能力。 ### 核心要点: 📊 商业模型在东南亚文字上表现不佳促使Grab开发定制方案 🔍 视觉LLM突破提升身份证件/执照处理准确率 🚀 持续开发计划中以支持更多文档类型和语言

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

印度Alpie AI模型引发热议——但它真的源自本土吗?
News

印度Alpie AI模型引发热议——但它真的源自本土吗?

印度新晋AI竞争者Alpie凭借在数学和编程测试中媲美GPT-4o和Claude3.5等巨头的表现引发关注。然而技术分析显示其实际基于中国开源模型构建,引发了关于创新与优化的讨论。Alpie的特殊之处在于能在消费级硬件上高效运行,有望为中小开发者降低AI使用门槛。

January 15, 2026
AI机器学习印度科技
Mugen3D将单张照片转化为惊艳的3D世界
News

Mugen3D将单张照片转化为惊艳的3D世界

一款名为Mugen3D的突破性AI工具正在改变我们创建3D内容的方式。它运用先进的3D高斯泼溅技术,仅需一张图像就能生成极其逼真的模型——以惊人的精确度捕捉纹理、光照和材质。这项创新有望在从游戏到电子商务的各行各业中普及3D创作。

January 12, 2026
AIComputerGraphicsDigitalCreation
News

高通与谷歌联手通过AI革新汽车技术

高通与谷歌正携手解决汽车行业最头疼的问题之一:分散的车载系统。他们新推出的'汽车AI代理'将高通的骁龙数字底盘与谷歌的Android Automotive OS相结合,承诺带来更流畅的开发体验和更智能的功能(如面部识别)。该合作还引入了基于云的开发工具,有望大幅缩短研发时间。这标志着向更统一、更智能的车辆系统迈出了重要一步。

January 9, 2026
automotive-techAIsmart-cars
News

博世豪掷25亿欧元押注智能汽车AI技术

在2026年国际消费电子展上,汽车巨头博世宣布计划到2027年投资超25亿欧元用于AI研发,重点开发智能座舱和更安全的自动驾驶系统。这家德国供应商正谋求从硬件专家转型为软件领导者,预计其技术部门销售额到2030年代中期可达100亿欧元。

January 7, 2026
BoschAI自动驾驶汽车
MiniMax IPO热潮:香港投资者热捧中国AI先锋
News

MiniMax IPO热潮:香港投资者热捧中国AI先锋

中国人工智能技术新锐MiniMax以惊人的投资者热情完成了香港首次公开募股。此次发行获得1209倍超额认购,筹集资金超过2530亿港元。在阿里巴巴和阿布扎比投资局等重量级投资者的支持下,MiniMax将于1月9日上市,有望成为有史以来增长最快的上市公司之一。

January 6, 2026
AIIPOHongKongMarkets
NVIDIA首席执行官在CES 2026盛赞开源AI突破
News

NVIDIA首席执行官在CES 2026盛赞开源AI突破

在CES 2026上,NVIDIA的黄仁勋力推开源AI发展,将DeepSeek-R1誉为杰出成功案例,引发轰动。这位科技领袖展示了全新Vera Rubin芯片的同时,宣布了开源训练数据的计划。黄仁勋阐述了AI正在变革产业的四大关键领域,并预测这些变化将定义未来的技术范式。

January 6, 2026
AIOpen SourceNVIDIA