DeepSeek-V3.2-Exp模型正式发布并开源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
最新快讯
数据:ETH 当前全网 8 小时平均资金费率为 0.0036%
ChainCatcher
2025-10-01 00:17:05
数据:BTC 当前全网 8 小时平均资金费率为 0.0033%
ChainCatcher
2025-10-01 00:17:03
KGeN 完成 1350 万美元新一轮融资,Jump Crypto 等领投
ChainCatcher
2025-10-01 00:07:57
Yotta Labs 获得美国国家科学基金会资助,推进去中心化 AI
ChainCatcher
2025-10-01 00:00:47
Yield Basis 在 Legion 首轮预售募集 1.95 亿美元,超募 98 倍
ChainCatcher
2025-09-30 23:56:47