大语言模型(LLM)
-
字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈
字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Tr…
-
GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线,免费开放
清华大学 KEG 实验室(THUDM)研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线,且完全免费向全球用户…
-
Persona Engine开源发布,AI虚拟助手与Live2D融合打造交互新体验
近日,Persona Engine(人格引擎)项目正式开源,凭借其融合大语言模型(LLM)、Live2D、自动语音识别(ASR)、文本转语音(TTS)以及实时语音克隆(RVC)等前…
-
Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。作为一款专为 Intel Arc GPU 和集成显卡优化的 AI…
-
MCP生态崛起,六行代码打造智能AI代理
[db:摘要]
-
王兴:美团已开发内部大模型LongCat 投资数十亿元GPU资源
[db:摘要]
-
AMD发布GAIA开源项目 助力本地大语言模型高效运行
[db:摘要]
-
CMU 团队推出元强化微调:提升大语言模型推理能力的新范式
[db:摘要]