多模态模型

AI资讯

GPT-4o图像生成功能现已集成至自定义GPTs

2025年4月26日 AIbase报道：OpenAI近日宣布，其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。这一更新标志着用户创建的…

aiuc
4天前
0080
AI资讯

字节跳动推出Vidi多模态模型，引领超长视频理解与编辑新潮流

字节跳动宣布推出全新多模态模型Vidi，专注于视频理解与编辑，首版核心能力为精准的时间检索功能。据AIbase了解，Vidi能够处理视觉、音频和文本输入，支持长达一小时的超长视频分…

aiuc
2025年4月23日
0080
AI资讯

OpenAI发布两款多模态推理模型o4-mini、满血版o3

在今天凌晨1点的技术直播中，OpenAI正式推出其最新且最强大的多模态模型o4-mini和满血版o3。这两款模型具备独特优势，不仅能同时处理文本、图像和音频，还可作为智能体自动调用…

aiuc
2025年4月17日
0080
AI资讯

谷歌AI Studio重磅更新：全新Gemini-2.0-flash-live-001正式上线

[db:摘要]

aiuc
2025年4月10日
0080
AI资讯

阿里推出全新多模态模型 Qwen2.5-VL-32B：兼顾视觉语言与数学推理

[db:摘要]

aiuc
2025年3月25日
00100
AI资讯

阿里通义团队开源 R1-Omni：多模态模型实现音视频信息透明化

[db:摘要]

aiuc
2025年3月12日
0070
AI资讯

阿里云魔搭首发上线阶跃星辰最新开源的两款多模态模型

[db:摘要]

aiuc
2025年2月21日
0090
AI资讯

小而强！微软发布小型模型LLaVA-Rad，实现精准放射学报告生成

[db:摘要]

aiuc
2025年2月10日
00110
AI资讯

多模态模型新突破：李飞飞团队统一动作与语言，不仅超懂指令，还能读懂隐含情绪

[db:摘要]

aiuc
2024年12月18日
00120
AI资讯

亚马逊推出全新 Nova AI 模型系列：包括文本、图片和视频生成

[db:摘要]

aiuc
2024年12月4日
0080
AI资讯

颠覆 Stable Diffusion！智源重磅发布 Emu3，图像、文本、视频全拿下！

[db:摘要]

aiuc
2024年10月21日
0050
AI资讯

星标破万！面壁智能小钢炮模型MiniCPM-V2.6登顶GitHub

[db:摘要]

aiuc
2024年8月13日
0060
AI资讯

苹果推出全能视觉模型4M-21 可处理21种不同模态

[db:摘要]

aiuc
2024年6月25日
0080

1 / 2
1
2
下一页