腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...
大语言模型(Large Language Model,以下简称「大模型」),顾名思义,是人工智能(AI)依赖大量的语言素材进行分析,再整合出来的计算模型。目前全球最先进的大模型,例如ChatGPT或DeepSeek,已经可以像人一样生成自然语言,并和我们进行日常交谈,给予我们意见,甚至是情绪支持。但这是否代表这些大模型已如同人一样,拥有认知能力与社会价值观?科学界对此仍存有争议。 首先,大模型本身 ...