DeepSeek-V3.2-Exp模型正式发布并开源
2025-09-29 18:12:55
分享至

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对 DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大 EP 并行方案部署,基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
最新快讯
数据:过去 24 小时全网爆仓 4.19 亿美元,主爆多单
ChainCatcher
2025-10-08 23:16:48
贝莱德 IBIT 连续 7 周购买比特币,总计买入约 54,423 枚
ChainCatcher
2025-10-08 23:10:04
美元指数 DXY 短线走高 10 点,现报 98.84
ChainCatcher
2025-10-08 23:00:40
THENA 发布路线图,未来将上线 THE Launchpad
ChainCatcher
2025-10-08 22:47:05
MetaMask 宣布通过 Hyperliquid 推出钱包内的永续交易功能
ChainCatcher
2025-10-08 22:24:59