百度PaddleOCR-VL领跑全球OCR排行榜
百度PaddleOCR-VL称霸全球OCR排行榜
10月16日,百度飞桨团队发布了其最新视觉语言模型PaddleOCR-VL,迅速成为光学字符识别(OCR)领域的焦点。该模型在权威基准测试OmniDocBench V1.5中获得92.56分,超越DeepSeek-OCR等对手,稳居全球第一。

制霸Huggingface趋势榜
截至10月21日,Huggingface的趋势模型榜被OCR模型包揽:
- 🥇 PaddleOCR-VL(飞桨)
- 🥈 DeepSeek-OCR
- 🥉 NanonetOCR
PaddleOCR-VL已连续保持榜首位置达五天之久,巩固了其作为最受关注开源OCR模型的地位。
先进功能
该模型支持109种语言,擅长解析复杂文档结构,包括:
- 文本
- 表格
- 公式
- 图表
还具备文档语义结构重建能力,不仅能识别字符,更能理解文档上下文。这使得它在科研论文、发票处理和知识抽取等应用中极具价值。
行业协作
深度求索团队在研究论文中致谢PaddleOCR,透露使用其标注数据作为训练素材。这反映出一个更广泛的趋势:包括百度、深度求索和上海AI实验室在内的顶尖机构正通过开源OCR模型推进AI大规模训练的基础能力建设。
当前这场"OCR军备竞赛"不仅关乎准确率,更是为了加速AI在全球范围内解析图文的能力。
核心亮点:
- PaddleOCR-VL在OmniDocBench V1.5获评92.56分
- 蝉联Huggingface趋势榜榜首达5天
- 支持109种语言及复杂文档解析
- 行业协作凸显其在AI数据标注中的关键作用


