DeepSeek-V3.2-Exp模型正式发布并开源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
最新快讯
深成指跌超 2%,沪指跌 0.53%,市场下跌个股超 3,200 只
ChainCatcher
2025-10-14 14:03:40
Ethstorage 宣布主网正式上线
ChainCatcher
2025-10-14 14:02:21
汇丰银行:美元可能再度走弱,预计明年初触底
ChainCatcher
2025-10-14 13:55:41
纳斯达克 100 指数期货跌幅扩大至 1%,标普 500 期货下跌 0.75%
ChainCatcher
2025-10-14 13:44:46
$SOON 创历史新高,被 Bithumb 评为本周 Issue Coin
ChainCatcher
2025-10-14 13:41:44