百度发布PaddleOCR-VL，树立OCR技术新标杆欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

百度发布PaddleOCR-VL，树立OCR技术新标杆

百度PaddleOCR-VL重新定义文档处理标准

百度正式发布其PaddleOCR-VL——一款尖端的多模态文档解析模型，为光学字符识别（OCR）技术设立了新的性能基准。这款开源模型在权威的OmniBenchDoc V1.5评估中以92.6分的成绩位居世界领先地位，展现出在文本识别、表格提取、公式解析和阅读顺序预测四大关键领域的卓越能力。

技术突破

这款0.9B参数的模型通过创新架构实现了高效能与高性能的结合：

集成NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型
在单块A100 GPU上实现每秒处理1881个Token(比dots.ocr快253%)
支持包括阿拉伯语和中文等复杂文字在内的109种语言

性能指标

PaddleOCR-VL提供了前所未有的准确度：

文本编辑距离：0.035
公式识别(CDM)：91.43
表格提取(TEDS)：93.52
阅读顺序错误率：0.043

这些指标证明了其在历史档案数字化和手稿处理等挑战性应用中的可靠性。

创新架构

该模型的两阶段方法彻底改变了文档理解方式：

版面检测与阅读顺序预测
输出结构化文本、表格和公式

这种方法使其能够像人类一样理解包括财务报告和学术论文在内的复杂文档，同时保持逻辑连贯性。

实际应用

该技术满足了跨行业的关键需求：

政府文件管理系统
企业知识检索平台
学术研究信息提取
历史档案保存项目

轻量化设计使其特别适合在资源受限的环境中部署。

关键亮点：

🏆 OmniBenchDoc V1.5测试世界领先(92.6分)
⚡ 超高效处理速度达1881 Tokens/秒
🌍 支持包括复杂文字在内的109种语言
🧠 类人类的文档版面理解能力
🔓 开源特性促进广泛采用

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

百度AI业务2025年突破400亿元大关

百度最新财报显示其AI业务增长迅猛，2025年AI相关总收入达400亿元。这家科技巨头在云计算（增长34%）、自动驾驶（网约车业务增长200%）和AI原生营销服务（收入增长301%）领域表现尤为突出。凭借文心大模型和不断扩展的全球布局，百度持续巩固其中国AI领军者的地位。

February 26, 2026

ArtificialIntelligenceTechEarningsChineseTech

News

三星Galaxy AI通过集成Perplexity变得更智能

三星正通过将Perplexity的搜索功能深度集成到Galaxy AI中，将智能手机AI提升至新高度。用户现在只需简单的'Hey Plex'语音指令即可召唤高级搜索功能，标志着向更开放、多智能体AI系统的转变。这一战略举措使三星在与苹果和谷歌等竞争对手的对抗中占据优势，为用户提供更多AI助手的选择和灵活性。

February 24, 2026

GalaxyAIArtificialIntelligenceSmartphoneTech

News

OpenAI推出新版ChatGPT Pro Lite：半价享更强性能

OpenAI正以每月100美元的中端订阅计划ChatGPT Pro Lite革新其服务选项。该版本在价格仅为Pro版一半的同时，提供比Plus计划强3-5倍的深度思考能力。此举适应用户对高性价比AI工具日益增长的需求。开发者Tibor Blaho在ChatGPT网页代码中发现新层级的线索，显示其提升了推理限制，但可能不包含部分Pro版专属功能。

February 23, 2026

OpenAIChatGPTAISubscriptions

News