商汤科技迈向多模态大模型的新纪元

aiuc • 10小时前 • AI资讯 • 阅读 5

在过去的两年里，人工智能领域的关注点逐渐转向了大模型的技术发展，而商汤科技作为一家成立不到十年的公司，凭借其在计算机视觉领域的技术积累，正迅速转型，迎接这一浪潮。尽管在2023年之前，商汤主要聚焦于视觉模型，但随着 DeepSeek R1的发布，市场的重心开始向自然语言处理和大规模参数模型倾斜，商汤的策略也随之调整。

商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”，展现了强大的综合能力，与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。商汤不仅成功弥补了文本模型的差距，更在多模态领域厚积薄发，标志着其在国内大模型市场中越来越重要的地位。

图源备注：图片由AI生成，图片授权服务商Midjourney

值得注意的是，商汤在构建其多模态模型的过程中，采用了独特的思维链构建方法。通过将文本、图像、语音和视频数据融合，商汤的日日新 V6能在同一上下文中进行有效的推理，达到1+1>2的效果。这一创新不仅提升了模型的理解与生成能力，也使得多模态之间的协同作用更加显著。

当前，尽管市场上出现了众多多模态模型，能够同时处理多种数据模态的产品依然屈指可数。商汤的日日新 V6凭借其在多模态数据融合方面的成功，逐渐显示出其在未来人工智能竞争中的强大潜力。

本文由「aiuc」编辑整理，文章链接：https://www.aiuc.net/55642

该文观点仅代表作者本人，平台仅提供信息存储空间服务。

商汤科技迈向多模态大模型的新纪元

相关推荐

发表回复