百度PaddleOCR-VL领跑全球OCR排行榜欢迎来到AI DAMN！发现最震撼的最新AI新闻、最酷的AI产品和最前沿的AI项目。从ChatGPT到最新模型，我们精选让你惊呼'太牛了！'的AI发展动态。涵盖机器学习、深度学习等前沿技术，每日更新最精彩的人工智能世界。

发现

语言

账户

百度PaddleOCR-VL领跑全球OCR排行榜

百度PaddleOCR-VL称霸全球OCR排行榜

10月16日，百度飞桨团队发布了其最新视觉语言模型PaddleOCR-VL，迅速成为光学字符识别（OCR）领域的焦点。该模型在权威基准测试OmniDocBench V1.5中获得92.56分，超越DeepSeek-OCR等对手，稳居全球第一。

制霸Huggingface趋势榜

截至10月21日，Huggingface的趋势模型榜被OCR模型包揽：

🥇 PaddleOCR-VL（飞桨）
🥈 DeepSeek-OCR
🥉 NanonetOCR

PaddleOCR-VL已连续保持榜首位置达五天之久，巩固了其作为最受关注开源OCR模型的地位。

先进功能

该模型支持109种语言，擅长解析复杂文档结构，包括：

文本
表格
公式
图表

还具备文档语义结构重建能力，不仅能识别字符，更能理解文档上下文。这使得它在科研论文、发票处理和知识抽取等应用中极具价值。

行业协作

深度求索团队在研究论文中致谢PaddleOCR，透露使用其标注数据作为训练素材。这反映出一个更广泛的趋势：包括百度、深度求索和上海AI实验室在内的顶尖机构正通过开源OCR模型推进AI大规模训练的基础能力建设。

当前这场"OCR军备竞赛"不仅关乎准确率，更是为了加速AI在全球范围内解析图文的能力。

核心亮点：

PaddleOCR-VL在OmniDocBench V1.5获评92.56分
蝉联Huggingface趋势榜榜首达5天
支持109种语言及复杂文档解析
行业协作凸显其在AI数据标注中的关键作用

喜欢这篇文章？

订阅我们的 Newsletter，获取最新 AI 资讯、产品评测和项目推荐，每周精选直达邮箱。

每周精选完全免费随时退订

News

通义千问AI模型阵容升级，重磅新品强势登场

阿里巴巴Qwen团队对其开源AI模型家族进行了重大升级。此次扩展推出了三款针对不同性能需求的新模型，从复杂推理任务到轻量级应用一应俱全。同步发布的还有阿里云推出的Qwen3.5-Flash API托管服务，支持高达100万token的上下文长度。

February 25, 2026

AI模型开源云计算

News

Claude Opus 4.6免费开放：ZenMux升级开启强大AI之门

ZenMux最新更新将Claude Opus 4.6纳入其免费层级两周，为用户提供前所未有的尖端AI能力体验。这款由Anthropic驱动的模型拥有百万级token记忆和多智能体协作等惊艳特性，在编程与分析任务中超越竞争对手。虽然免费版本存在部分限制，但对开发者和好奇者而言，这是无需付费即可试驾高端AI的黄金机会。

February 6, 2026

AI模型Claude OpusZenMux

News

百度豪掷5亿红包押注AI，文心助手借春节流量破圈

随着马年临近，百度通过其雄心勃勃的春节营销活动掀起波澜。这家科技巨头投入5亿元资金，试图在节日流量高峰期间将用户导向文心助手AI平台。早期数据显示成效显著——超过5000万次AI功能调用和2亿月活跃用户。这标志着百度从纯AI研究向主流应用的战略转型。

February 5, 2026

BaiduAI AdoptionDigital Marketing

News

Stepfun全新AI模型为数字助手注入速度与智能

Stepfun发布了专为驱动数字助手打造的轻量级开源AI模型Step3.5Flash。该解决方案响应迅捷，在编程和复杂计算等关键领域性能媲美闭源方案。开发者现可通过GitHub和HuggingFace等多个平台获取这款'智能体大脑'。

February 2, 2026

AI模型开源技术数字助手

News

腾讯新翻译技术，口袋里的专业翻译

腾讯发布了HY-MT1.5，这是一项突破性的翻译系统，将强大的AI能力带到了移动设备上。轻量级的1.8B版本在占用极少内存的同时提供近乎即时的翻译，非常适合智能手机。而更强大的7B模型则擅长企业级复杂翻译任务。这些模型的特别之处在于它们结合了海量训练与人类反馈，能够处理从技术术语到文化差异的一切问题——同时还能保持文档格式不变。

January 5, 2026

机器翻译AI模型移动技术