华为的 Ascend 910C 完成对 DeepSeek 1.6 万亿参数模型的后训练,使用 1,000+ 张 GPU

cunshang2026-06-06 11:42:46theblockbeats

根据 Beating,来自深圳河套学院、哈尔滨工业大学(深圳)、深圳大数据研究院、华为以及 Deepcity AI 的联合团队已宣布已在国产 AI 基础设施上成功完成 DeepSeek-V4-Pro 的全参数后训练。该模型拥有 1.6 万亿参数。这标志着第三方组织首次在中国硬件上完成如此规模模型的全参数后训练。

团队借助由 1,000 多颗华为 Ascend 910C 芯片构成的集群,通过优化的分布式负载均衡克服通信瓶颈。在 1,500 步的训练过程中,系统持续无中断运行,实现模型 FLOPs 利用率(MFU)超过 30%,并使关键算子效率提升 14%,达到工业级性能标准。


Solana 跌破 75 美元支撑位,链上数据表明需求偏薄

Solana(SOL)在链上数据揭示该水平之下需求偏薄后,跌破了$75-$77的支撑区间。分析师AliCharts表示,URPD(UTXORealizedPriceDistribution,UTXO已实现价格分布)分析显示在$77到更低价格水平之间的已实现供应相对...

链上订单簿交易所 Kuru 宣布完成 200 万美元种子轮融资

Monad区块链的链上订单簿交易所Kuru宣布完成200万美元种子轮融资,由ElectricCapital领投,BrevanHowardDigital、CMSHoldings、PivotGlobal、Breed和VelocityCapital参投。此次融资将用于扩展团队并为Monad测试网上...

BitGo 报告:超半数美国前 25 大银行试点数字资产业务,代币化市场或于 2033 年达 23 万亿美元

BitGo发布的《CryptoInfrastructureforBanks》报告指出,数字资产正加速进入主流金融体系。全球加密资产持有者约7.16亿人,月活跃用户估计为4,000万至7,000万;稳定币月度结算规模已超过1万亿美元。报告称,美国前25...

以太坊现货 ETF 上周单周净流入 6.38 亿美元,无一净流出

根据SoSoValue数据,上周交易日(美东时间9月8日至9月12日)以太坊现货ETF上周单周净流入6.38亿美元,无一净流出。上周单周净流入最多的以太坊现货ETF为富达(Fidelity)ETFFETH,周度净流入3.81亿美元,目前FETH历...

津巴布韦将包括锂和镍在内的 14 种矿产指定为关键矿产,并要求国家持有股权份额

津巴布韦政府近日发布了一项矿产分类政策,将14种矿产品(包括锂、镍、钴和石墨)指定为关键矿产,纳入股权控制并实施出口限制。该政策通过指定的特殊目的载体(SPVs)建立了强制的最低国家股权持有要求。该框架禁止...

上一篇:特朗普在 6 月 5 日赦免一名前共和党国会议员,涉及 $23B 合并内幕交易
下一篇:加州男子在与重大盗窃相关的比特币绑架计划中认罪