大型语言模型(LLM)

AI资讯

字节跳动推出 QuaDMix：大型语言模型预训练数据质量与多样性的统一框架

近日，字节跳动宣布推出其全新的数据选择框架 QuaDMix，旨在提升大型语言模型（LLM）预训练的效率和泛化能力。众所周知，模型的训练效果受基础数据集的质量和多样性影响很大。然而，…

aiuc
3天前
0070
AI资讯

微软MarkItDown MCP，可把Word、Excel等转换成markdown格式

在数字化时代，如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今，微软推出的 MarkItDown MCP（Model Context Protocol）将文档处理提升…

aiuc
2025年4月21日
0060
AI资讯

字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队宣布开源 ChatTS-14B，这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型（LLM）。以 Apache2.0许可协议发布，ChatTS-14B…

aiuc
2025年4月21日
00110
AI资讯

LMArena正式成立公司，致力于提供中立的AI评估平台

近日，备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司，名为 Arena Intelligence Inc.，以便为未来的项目改进提供更强大的资源。LMArena …

aiuc
2025年4月18日
0080
AI资讯

DroidRun正式开源，LLM驱动Android手机自动化控制新突破

近日，一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型（LLM）实现自然语言指令控制Android手机，为用户提供了前所未有的自动化体验。从社交媒体管理到日…

aiuc
2025年4月17日
00100
AI资讯

谷歌发布69页白皮书：如何通过提示工程优化AI模型

[db:摘要]

aiuc
2025年4月11日
00140
AI资讯

推理性能再飞跃!DeepSeek推创新技术SPCT，让大模型更懂人心

[db:摘要]

aiuc
2025年4月9日
00100
AI资讯

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

[db:摘要]

aiuc
2025年4月9日
0070
AI资讯

OpenAI推出AI Agent评测基准PaperBench

[db:摘要]

aiuc
2025年4月3日
00110
AI资讯

英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理

[db:摘要]

aiuc
2025年3月31日
00100
AI资讯

告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%!

[db:摘要]

aiuc
2025年3月31日
0070
AI资讯

韩国AI芯片初创公司FuriosaAI拒绝Meta 8亿美元收购

[db:摘要]

aiuc
2025年3月25日
0080
AI资讯

小模型助力法律行业，LexisNexis 推出 AI 助手 Protégé

[db:摘要]

aiuc
2025年3月21日
0060

1 / 2
1
2
下一页