这项由NVIDIA公司Wei Du、Shubham Toshniwal等研究团队开展的突破性研究于2025年12月发表在arXiv预印本平台,论文编号为arXiv:2512.15489v1。该研究构建了迄今为止最大规模的数学推理数据集Nemotron ...
这项由NVIDIA公司Wei Du、Shubham Toshniwal等研究团队开展的突破性研究于2025年12月发表在arXiv预印本平台,论文编号为arXiv:2512.15489v1。该研究构建了迄今为止最大规模的数学推理数据集Nemotron-Math,包含高达7500万条数学解题推理轨迹,让AI模型在数学竞赛中达到了前所未有的100%满分成绩。
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
本报记者李相如近期,全球数学界正悄然上演一场变革,几大标志性事件引发学界的持续关注和热议国产大模型DeepSeek-V3.2-Speciale在国际数学奥林匹克竞赛(IMO)、国际信息学奥林匹克竞赛(IOI)等顶级赛事中斩获金牌级成绩;菲尔兹奖得主陶哲轩借升级后的谷歌Gemini。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!数据质量决定了模型智能的上限,而DataFlow将数据准备从手工作坊升级为了自动化工 ...
顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异,但在真正高难度问题面前仍未满分,显示出推理能力仍有提升空间。与此同时,AI推理能力和强化学习的进步让增长速度几乎翻倍,成本大幅下降,许多模型已能在消费级硬件上运行。
具体来说,CANN 不再是一个巨大的单体软件,而是被拆解为多个功能正交的组件。分层解耦的思路贯穿了全栈:从底层的硬件驱动到中间的运行时,再到上层的编译器和加速库,每一层都实现了物理上的松耦合。
请媒体朋友们不要报道我们,让我们有更长久的时间可以收集整理数据。我们最怕捧杀了,您让我们保持低调,就是对中文算法圈做了大的贡献! 中文互联网上最古老最神秘(没有之一)的MOP里屋社区于2023.1.1庄重宣布: 在英明神武的猫扑管子带领下,决心发挥社区 ...
先说57岁著名数论学家小野健的“离职”。据说,促使他决定离开象牙塔的一个原因,是在一次研讨会上受到的冲击:他发现自己在直觉与抽象思维上的领先优势,正在被AI迅速缩小。而小野健加入的初创公司Axiom ...