SALMONN框架:拓展大型语言模型通用听觉能力

[db:摘要]

SALMONN框架通过整合不同听觉编码器和激活调整阶段,取得了竞争性的通用听觉性能。其多模态架构为大型语言模型提供了直接理解和处理通用音频输入的能力,展示了在多种任务中的竞争性性能。

本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/22186

该文观点仅代表作者本人,平台仅提供信息存储空间服务。

(0)
aiucaiuc
上一篇 2023年11月29日
下一篇 2023年11月29日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注