跳转到主要内容

百度发布PaddleOCR-VL,树立OCR技术新标杆

百度PaddleOCR-VL重新定义文档处理标准

百度正式发布其PaddleOCR-VL——一款尖端的多模态文档解析模型,为光学字符识别(OCR)技术设立了新的性能基准。这款开源模型在权威的OmniBenchDoc V1.5评估中以92.6分的成绩位居世界领先地位,展现出在文本识别、表格提取、公式解析和阅读顺序预测四大关键领域的卓越能力。

技术突破

这款0.9B参数的模型通过创新架构实现了高效能与高性能的结合:

  • 集成NaViT动态分辨率视觉编码器ERNIE-4.5-0.3B语言模型
  • 在单块A100 GPU上实现每秒处理1881个Token(比dots.ocr快253%)
  • 支持包括阿拉伯语和中文等复杂文字在内的109种语言

Image

性能指标

PaddleOCR-VL提供了前所未有的准确度:

  • 文本编辑距离:0.035
  • 公式识别(CDM):91.43
  • 表格提取(TEDS):93.52
  • 阅读顺序错误率:0.043

这些指标证明了其在历史档案数字化和手稿处理等挑战性应用中的可靠性。

Image

创新架构

该模型的两阶段方法彻底改变了文档理解方式:

  1. 版面检测与阅读顺序预测
  2. 输出结构化文本、表格和公式

这种方法使其能够像人类一样理解包括财务报告和学术论文在内的复杂文档,同时保持逻辑连贯性。

Image

实际应用

该技术满足了跨行业的关键需求:

  • 政府文件管理系统
  • 企业知识检索平台
  • 学术研究信息提取
  • 历史档案保存项目

轻量化设计使其特别适合在资源受限的环境中部署。

关键亮点:

  • 🏆 OmniBenchDoc V1.5测试世界领先(92.6分)
  • ⚡ 超高效处理速度达1881 Tokens/秒
  • 🌍 支持包括复杂文字在内的109种语言
  • 🧠 类人类的文档版面理解能力
  • 🔓 开源特性促进广泛采用

喜欢这篇文章?

订阅我们的 Newsletter,获取最新 AI 资讯、产品评测和项目推荐,每周精选直达邮箱。

每周精选完全免费随时退订

相关文章

百度AI业务2025年突破400亿元大关
News

百度AI业务2025年突破400亿元大关

百度最新财报显示其AI业务增长迅猛,2025年AI相关总收入达400亿元。这家科技巨头在云计算(增长34%)、自动驾驶(网约车业务增长200%)和AI原生营销服务(收入增长301%)领域表现尤为突出。凭借文心大模型和不断扩展的全球布局,百度持续巩固其中国AI领军者的地位。

February 26, 2026
ArtificialIntelligenceTechEarningsChineseTech
News

三星Galaxy AI通过集成Perplexity变得更智能

三星正通过将Perplexity的搜索功能深度集成到Galaxy AI中,将智能手机AI提升至新高度。用户现在只需简单的'Hey Plex'语音指令即可召唤高级搜索功能,标志着向更开放、多智能体AI系统的转变。这一战略举措使三星在与苹果和谷歌等竞争对手的对抗中占据优势,为用户提供更多AI助手的选择和灵活性。

February 24, 2026
GalaxyAIArtificialIntelligenceSmartphoneTech
News

OpenAI推出新版ChatGPT Pro Lite:半价享更强性能

OpenAI正以每月100美元的中端订阅计划ChatGPT Pro Lite革新其服务选项。该版本在价格仅为Pro版一半的同时,提供比Plus计划强3-5倍的深度思考能力。此举适应用户对高性价比AI工具日益增长的需求。开发者Tibor Blaho在ChatGPT网页代码中发现新层级的线索,显示其提升了推理限制,但可能不包含部分Pro版专属功能。

February 23, 2026
OpenAIChatGPTAISubscriptions
News

DeepMind先驱者以大胆AI初创企业开辟新航程

AlphaGo背后的远见者David Silver已离开DeepMind,创立了名为Ineffable Intelligence的雄心勃勃企业,旨在重新定义人工智能。凭借开创性自主学习系统的计划及近10亿美元种子资金,Silver的举动或将重塑我们对机器智能的认知。

February 22, 2026
ArtificialIntelligenceTechInnovationMachineLearning
苹果的下一步:三款可能改变我们与技术交互方式的AI可穿戴设备
News

苹果的下一步:三款可能改变我们与技术交互方式的AI可穿戴设备

苹果似乎正大力押注AI驱动的可穿戴设备,据报道有三款引人注目的设备正在研发中。该系列包括无屏幕智能眼镜、一款低调的AI别针或吊坠,以及配备摄像头的AirPods——所有这些设计都能与iPhone和升级版Siri无缝协作。这些设备旨在比以往任何时候都更自然地将数字助手融入我们的日常生活。

February 18, 2026
AppleWearableTechArtificialIntelligence
Moonshot AI在上一轮融资仅数周后再获7亿美元巨额融资
News

Moonshot AI在上一轮融资仅数周后再获7亿美元巨额融资

Kimi聊天机器人创造者Moonshot AI即将完成新一轮超7亿美元的巨额融资——距离其5亿美元融资仅过去一个月。闪电般的筹资速度凸显了投资者的热情,该公司估值已突破100亿美元。在阿里巴巴和腾讯等科技巨头的支持下,Moonshot持续在这个竞争激烈的人工智能领域打破纪录。

February 18, 2026
MoonshotAIAIFundingKimiChatbot