英伟达和麻省理工学院发布 Lightning OPD 框架,使模型蒸馏效率提升 4 倍,同时消除 GPU 内存问题

chuiyan2026-05-12 19:24:14theblockbeats

据报道,NVIDIA 和 MIT 的研究人员发布了 Lightning OPD(Offline On-Policy Distillation),这是一种用于大语言模型的新后训练框架,可消除在训练期间保持教师模型运行的需求。通过在离线环境中预先计算教师模型的对数概率,该框架将训练效率提升 4 倍,同时释放所有 GPU 资源用于学生模型训练。

在 8 张 NVIDIA H100 GPU 上的测试中,Lightning OPD 成功蒸馏出 Qwen3-30B-A3B-Base(一个 300 亿参数的 MoE 模型),并在 AIME 2024 基准测试中取得 71.0 分;而标准 OPD 在相同硬件上则会内存耗尽。对于较小的 Qwen3-8B 模型,该框架仅需 30 GPU 小时即可达到 69.9 分。

SoSoValue:2024–2025 年加密市场出现明显结构性分化

据SoSoValue,2024–2025年加密市场出现明显结构性分化。现货比特币ETF获批后,合规资金主要集中于BTC,削弱了资金向以太坊及山寨币赛道的外溢效应。数据显示,BTC两年上涨约90%,而Layer2、GameFi等叙事型赛道...

DoorDash携手Tempo在40多个国家推出稳定币支付系统

4月22日,DoorDash于4月21日宣布与Tempo达成合作,Tempo是一家区块链支付平台,计划在40多个国家为外卖配送司机、商家和客户推出稳定币支付选项。此次合作旨在加快支付周期,降低国际转账成本,并为所有参与方提供更...

美总统候选人 Vivek Ramaswamy 宣布接受比特币捐款,最多可捐6600 美元

美国共和党总统候选人VivekRamaswamy宣布接受比特币捐款,这是继小罗伯特肯尼迪之后成为第二位正式接受比特币竞选捐款的总统候选人。Ramaswamy选择了BitPay的支付服务来接受比特币捐赠,最多可为其捐赠6600美元,捐...

Bitget 将捐赠 1,200 万港元,支持香港大埔火灾救援及重建工作

Bitget宣布将捐赠1200万港元支援香港大埔宏福苑火灾受灾家庭及社区重建。捐款分配如下:香港仁济医院—500万港元,用于协助处理紧急医疗支援、受伤人士治疗相关费用,以及为受影响家庭提供必要的健康与康复支持。香...

DDC Enterprise 宣布其公司金库比特币持仓已达 1008 枚

纽交所上市公司DDCEnterprise宣布其公司金库比特币持仓已达1,008枚,最新一笔购入为120枚BTC,平均购入成本为108,384美元。该公司CEO表示目标在今年年底累计至10,000枚BTC。...

上一篇:BNB 链 RWA TVL 于 5 月 12 日创下 $4 十亿的历史新高
下一篇:高盛合伙人将美国股市估值与 2000 年泡沫进行对比,并建议在 5 月 12 日拥抱反弹