首页
AI资讯
AI教程
变现指南
AI工具
登录
注册
Aiuc
首页
数学推理
数学推理
AI资讯
360智脑团队成功复现Deepseek强化学习效果,发布开源模型Light-R1-14B-DS
[db:摘要]
aiuc
2025年3月14日
0
0
6
0
上海AI实验室打破数学推理极限,不蒸馏R1也能超越DeepSeek,RL新突破引爆业界
上海AI实验室:强化学习引领数学推理新突破 在人工智能领域,强化学习作为一种机器学习技术,近年来取得了显著的进展。尤其是在深度学习模型如 Transformer、BERT 等的加持…
aiuc
AI资讯
2025年2月17日
0
0
8
0
AI资讯
阿里云发布全新数学推理模型Qwen2.5-Math-PRM,7B 版本超越 GPT-4o
[db:摘要]
aiuc
2025年1月16日
0
0
10
0
AI资讯
被虐哭!Epoch AI推出数学新基准FrontierMath 顶级AI模型解题数不超2%
[db:摘要]
aiuc
2024年11月29日
0
0
8
0
AI资讯
苹果AI研究团队发现大模型推理短板 一句话就把OpenAI o1干废了
[db:摘要]
aiuc
2024年10月12日
0
0
6
0