Google 开源 DiffusionGemma 模型:在 H100 上每秒 1000+ 个 Token,速度提升 4 倍

buding2026-06-11 08:53:06theblockbeats

据 Beating 监测,Google 发布了一个名为 DiffusionGemma 的开源文本生成模型,它使用基于扩散的机制,通过并行块来生成文本,而不是以逐 token 的方式顺序生成。该 26B 参数模型在混合专家架构下,每次前向传递只激活 38 亿参数,实现了本地 GPU 推理 4 倍的速度提升。

在单块 NVIDIA H100 GPU 上,DiffusionGemma 的吞吐量超过每秒 1000 tokens,而消费级 RTX 5090 则超过每秒 700 tokens。经过 4-bit 浮点量化后,该模型所需显存低于 18GB。DiffusionGemma 权重现已在 Hugging Face 开源,并得到 MLX、vLLM、Unsloth 以及 NVIDIA NeMo 的支持。


稳定币市场份额:USDT 上升至 65.89% ,USDC 下降至 23.02%

据CoinGecko,稳定币市场份额一年变化统计显示,USDT从47.4%上升至65.89%,USDC从34.5%下降至23.02%,BUSD从11.8%下降至4.21%,DAI从4%下降至3.66%,TUSD从0.8%上升至1.62%。USDC市场份额的下滑主要是受硅谷银行爆雷...

富兰克林邓普顿提交以太坊现货 ETF 19b-4 文件

根据一份公开文件,芝加哥期权交易所(CBOE)已代表富兰克林邓普顿(FranklinTempleton)提交了以太坊现货ETF19b-4文件。此前,富兰克林邓普顿已向美国证券交易委员会(SEC)提交了以太坊现货ETFS-1申请文件。...

FSN 子公司 Fingerlabs 与 Mantle Network 建立战略联盟,并获得 Mantle EcoFund 的投资

韩国上市公司FSN子公司Fingerlabs宣布与MantleNetwork建立战略联盟,并获得MantleEcoFund的投资,推出“Xclusive”平台来重新定义基于粉丝的内容分发,以及推出“BTSHwaYangYeonHwa”的衍生剧《Begins≠Youth》,...

彭博 ETF 分析师:比特币现货 ETF 5 日净流入 15 亿美元,单日资金流入创近期高位

彭博ETF分析师EricBalchunas表示,比特币现货ETF过去5日累计净流入15亿美元,昨日单日再录得大额资金流入,为近期最大规模之一。他指出,此轮资金流入覆盖几乎全部首批10只现货ETF,呈现出“广度与深度”兼具的特征...

以太坊创始人 Vitalik Buterin 今日在日本开发者大会上公布最新路线图

据@_FORAB整理,以太坊创始人VitalikButerin今日在日本开发者大会上公布最新路线图:短期内将提升以太坊主网(L1)Gas限额,实现扩容并保持去中心化,涉及工具包括ZK-EVM、Block-levelaccesslists等;中期聚焦L2间的...

上一篇:亚马逊于 6 月 10 日获得 175 亿美元延迟提款定期贷款,以资助 AI 基础设施
下一篇:塞勒捍卫策略:针对稀释指控的股份出售