多模态模型
-
GPT-4o图像生成功能现已集成至自定义GPTs
2025年4月26日 AIbase报道:OpenAI近日宣布,其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。这一更新标志着用户创建的…
-
字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分…
-
OpenAI发布两款多模态推理模型o4-mini、满血版o3
在今天凌晨1点的技术直播中,OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势,不仅能同时处理文本、图像和音频,还可作为智能体自动调用…
-
阿里通义团队开源 R1-Omni:多模态模型实现音视频信息透明化
[db:摘要]
-
阿里云魔搭首发上线阶跃星辰最新开源的两款多模态模型
[db:摘要]
-
苹果推出全能视觉模型4M-21 可处理21种不同模态
[db:摘要]