机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward,optimizer step ...
结果让人大跌眼镜,WeDLM-8B在生成质量上直接超过了Qwen3-8B,平均得分高了2.1个点。 速度方面更离谱,对比vLLM部署的AR模型,WeDLM在数学推理任务上快了3倍,要是遇到低熵场景,比如生成固定格式的文本,速度能飙到10倍以上。
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果