大型语言模型(LLM)
-
字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,…
-
微软MarkItDown MCP,可把Word、Excel等转换成markdown格式
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升…
-
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B…
-
LMArena正式成立公司,致力于提供中立的AI评估平台
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。LMArena …
-
DroidRun正式开源,LLM驱动Android手机自动化控制新突破
近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日…
-
谷歌发布69页白皮书:如何通过提示工程优化AI模型
[db:摘要]
-
OpenAI推出AI Agent评测基准PaperBench
[db:摘要]
-
英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理
[db:摘要]
-
韩国AI芯片初创公司FuriosaAI拒绝Meta 8亿美元收购
[db:摘要]