寒武纪今日宣布,基于自研NeuWare软件生态与vLLM框架,已完成对深度求索公司最新大模型DeepSeek-V4的“Day 0”适配,适配代码同步开源。这是寒武纪连续第二次在DeepSeek新模型发布首日便推出国产芯片适配方案。
针对DeepSeek-V4全新结构,寒武纪通过自研高性能融合算子库Torch-MLU-Ops,对Compressor、mHC等模块专项加速;并运用BangC编程语言编写稀疏/压缩Attention、GroupGemm等热点算子的极致优化Kernel,充分释放硬件底层潜力。此前双方通过软硬件协同优化,已实现业界领先的算力利用率。
DeepSeek-V4预览版同步上线并开源,拥有百万字超长上下文,Agent能力与推理性能表现突出。DeepSeek-V4原生运行于寒武纪芯片,对中国AI产业具有里程碑意义。
最近更新日本岩手县山火持续蔓延 资讯
两部门推出16条金融举措促进房地产市场平稳健康发展 12-24 08:01:59
河南睢县:山药丰收农户忙 12-10 09:14:02
2025外资投资机构成都行启动仪式举行 签约总金额超150亿元 12-10 09:11:48
孩子发热、咳嗽、咽痛就是流感? 医生建议及时就医明确病因 11-28 15:06:14
方文强、刘文曲官宣结婚 曾合作《最好的我们》 12-20 10:16:54
巴西学者:我在中国生活很舒服、很安全,期待巴中深化合作丨世界观 12-10 09:14:43