商汤科技发布“每日新”融合大模型,超越DeepSeek V3
商汤科技正式推出了其新的“每日新”融合大模型,这标志着人工智能领域的一次重大飞跃。这一先进模型在多模态信息处理和深度推理方面展现了显著能力,在两个权威评估排名中名列前茅。
“每日新”模型在SuperCLUE机构的《2024年中国大模型基准评估年度报告》中获得高分,与DeepSeek V3并列以68.3分共享榜首。该模型在OpenCompass进行的多模态评估中也表现出色,明显超越了GPT-4o。

“每日新”融合大模型的一个突出特点是其整合各种类型信息的能力,包括文本、图像和视频。这一原生多模态训练的进步为行业开辟了新的可能性。在SuperCLUE评估中,该模型在人文学科和科学评估中均取得了最高分,人文学科全球排名第一,得分81.8。在科学类别中,该模型在计算维度上以78.2的分数位列中国第一。

“每日新”模型的先进能力使其能够同时处理复杂信息流。它可以高效处理模糊文本、分析数据图表并提供深入推理。这些特性使得该模型在自动驾驶、视频交互、办公教育、金融和工业制造等多个领域的实际应用中尤为有效。

在开发过程中,商汤科技利用了包含文本和图像的大型数据集,使得不同模态之间能够建立互动连接。这一合成技术增强了模型对多模态信息的理解能力,使其更能适应各种商业场景。公司还开发了一整套跨模态任务,为“每日新”融合大模型的训练提供了坚实的基础。通过采用创新的训练方法,商汤科技的模型有望满足用户的多种需求,并促进应用实施与模型迭代的良性循环。
重点
- 商汤科技的“每日新”融合大模型表现出色,在人文和科学评估中均排名第一。
- 该模型特别擅长处理多模态信息,在自动驾驶、金融和教育等领域展现出强大的能力。
- 商汤科技的创新训练方法为继续在各行业应用中的成功奠定了基础。
