跳转到主要内容

百度PaddleOCR-VL领跑全球OCR排行榜

百度PaddleOCR-VL称霸全球OCR排行榜

10月16日,百度飞桨团队发布了其最新视觉语言模型PaddleOCR-VL,迅速成为光学字符识别(OCR)领域的焦点。该模型在权威基准测试OmniDocBench V1.5中获得92.56分,超越DeepSeek-OCR等对手,稳居全球第一。

Image

制霸Huggingface趋势榜

截至10月21日,Huggingface的趋势模型榜被OCR模型包揽:

  • 🥇 PaddleOCR-VL(飞桨)
  • 🥈 DeepSeek-OCR
  • 🥉 NanonetOCR

PaddleOCR-VL已连续保持榜首位置达五天之久,巩固了其作为最受关注开源OCR模型的地位。

先进功能

该模型支持109种语言,擅长解析复杂文档结构,包括:

  • 文本
  • 表格
  • 公式
  • 图表

还具备文档语义结构重建能力,不仅能识别字符,更能理解文档上下文。这使得它在科研论文、发票处理和知识抽取等应用中极具价值。

行业协作

深度求索团队在研究论文中致谢PaddleOCR,透露使用其标注数据作为训练素材。这反映出一个更广泛的趋势:包括百度、深度求索和上海AI实验室在内的顶尖机构正通过开源OCR模型推进AI大规模训练的基础能力建设。

当前这场"OCR军备竞赛"不仅关乎准确率,更是为了加速AI在全球范围内解析图文的能力。

核心亮点:

  • PaddleOCR-VL在OmniDocBench V1.5获评92.56分
  • 蝉联Huggingface趋势榜榜首达5天
  • 支持109种语言及复杂文档解析
  • 行业协作凸显其在AI数据标注中的关键作用

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

通义千问AI模型阵容升级,重磅新品强势登场
News

通义千问AI模型阵容升级,重磅新品强势登场

阿里巴巴Qwen团队对其开源AI模型家族进行了重大升级。此次扩展推出了三款针对不同性能需求的新模型,从复杂推理任务到轻量级应用一应俱全。同步发布的还有阿里云推出的Qwen3.5-Flash API托管服务,支持高达100万token的上下文长度。

February 25, 2026
AI模型开源云计算
News

Claude Opus 4.6免费开放:ZenMux升级开启强大AI之门

ZenMux最新更新将Claude Opus 4.6纳入其免费层级两周,为用户提供前所未有的尖端AI能力体验。这款由Anthropic驱动的模型拥有百万级token记忆和多智能体协作等惊艳特性,在编程与分析任务中超越竞争对手。虽然免费版本存在部分限制,但对开发者和好奇者而言,这是无需付费即可试驾高端AI的黄金机会。

February 6, 2026
AI模型Claude OpusZenMux
百度豪掷5亿红包押注AI,文心助手借春节流量破圈
News

百度豪掷5亿红包押注AI,文心助手借春节流量破圈

随着马年临近,百度通过其雄心勃勃的春节营销活动掀起波澜。这家科技巨头投入5亿元资金,试图在节日流量高峰期间将用户导向文心助手AI平台。早期数据显示成效显著——超过5000万次AI功能调用和2亿月活跃用户。这标志着百度从纯AI研究向主流应用的战略转型。

February 5, 2026
BaiduAI AdoptionDigital Marketing
Stepfun全新AI模型为数字助手注入速度与智能
News

Stepfun全新AI模型为数字助手注入速度与智能

Stepfun发布了专为驱动数字助手打造的轻量级开源AI模型Step3.5Flash。该解决方案响应迅捷,在编程和复杂计算等关键领域性能媲美闭源方案。开发者现可通过GitHub和HuggingFace等多个平台获取这款'智能体大脑'。

February 2, 2026
AI模型开源技术数字助手
腾讯新翻译技术,口袋里的专业翻译
News

腾讯新翻译技术,口袋里的专业翻译

腾讯发布了HY-MT1.5,这是一项突破性的翻译系统,将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译,非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈,能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026
机器翻译AI模型移动技术
小米延长MiMo AI免费试用期,为用户提供更多体验时间
News

小米延长MiMo AI免费试用期,为用户提供更多体验时间

小米为AI爱好者提供了更多时间来体验其强大的MiMo-V2-Flash模型。原定于2025年12月底结束的免费试用期已延长20天,至2026年1月20日。这款开源模型拥有3090亿参数,在推理和编码任务中表现突出。虽然目前仍保持免费访问,但小米正准备很快推出付费选项。

December 31, 2025
小米AI模型科技新闻