微软发布七款 AI 模型,声称在 Claude 和 Nano Banana 方面占优
微软周二在其年度 Build 活动中发布了七款新的 AI 模型,宣称它们在盲测以及图像编辑基准测试中优于 Anthropic 的 Claude Sonnet 4.6 和谷歌的 Nano Banana 2。该发布体现了微软试图在前沿 AI 开发者领域确立自身地位,而不仅仅是 OpenAI 最大的支持者和基础设施提供商。此消息发布之际,领先 AI 开发者之间的竞争持续加剧,Anthropic 和谷歌近期也分别发布了自家的旗舰模型。
MAI-Thinking-1 在盲测中优于 Claude Sonnet 4.6
根据微软 AI 首席执行官 Mustafa Suleyman 的说法,微软的旗舰文本基础模型 MAI-Thinking-1 在由独立评估者进行的盲测中,相比 Anthropic 的 Claude Sonnet 4.6 更受青睐。该模型在 AIME 2025 上的得分为 97%,该基准用于衡量高级问题解决与推理能力。Suleyman 表示,该模型在 SWE Bench Pro 上的结果让它“在最艰难的编码基准之一上,与 Opus 4.6 并驾齐驱”。微软也宣称,MAI“取得了最高胜率,在质量方面击败 GPT-5.5,同时成本低 10 倍。”
“今天非常激动地宣布七个新的世界级 MAI 模型,”Suleyman 在 X 上写道。“它们代表了我们所认为的 AI 新时代,旨在让你保持掌控并走在前沿。”
微软在编码、图像、语音等类别推出另外六款 AI 模型
微软推出了 MAI-Code-1-Flash,这是一款为 GitHub Copilot 和 Visual Studio Code 打造的轻量级编码模型。公司还发布了 MAI-Image-2.5 及其 Flash 版本,微软称它在图像编辑任务上优于谷歌的 Nano Banana Pro。MAI Transcribe-1.5 是一款转录模型,支持 43 种语言;MAI-Voice-2 是一款语音生成模型,能够在 15 种语言中生成听起来自然的声音,并可通过一段短音频样本来适配说话者。
在宣布新模型的博客文章中,Suleyman 表示:“这是技术领域的非凡时刻,用于训练前沿模型的算力增加了万亿倍。现在我们预计在未来三年内还将再迎来另一个千倍的增长,这反过来意味着更先进的能力,并持续推出越来越有效的 AI。”
Anthropic 和谷歌发布竞争性模型
上周,Anthropic 宣布推出 Opus 4.8,公司称该模型在基准测试中更快、更聪明,并带来新的功能。周二,Anthropic 宣布扩大其 Project Glasswing,为 150 家公司提供以网络安全为重点的 Mythos 模型访问权限。在 5 月的 Google I/O 上,谷歌发布了 Gemini Omni,这是一种多模态 AI 模型,将 Gemini 与 Veo、Nano Banana 和 Genie 媒体生成模型结合在一起;同时还有 Gemini Spark,这是一款基于云的 AI 代理,旨在管理跨应用和工作流的任务。
Suleyman 写道:“开发者和企业一直在呼唤一种符合他们条件、并且在他们掌控之下运作的 AI。我们将其视为朝着实现这一目标迈出的重要一步。”
FAQ
微软周二在 Build 活动中宣布了什么?
微软在 Build 活动中发布了七款新的 AI 模型,包括 MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5、MAI Transcribe-1.5 和 MAI-Voice-2,并称它们在各种基准测试中优于 Anthropic 的 Claude Sonnet 4.6 以及谷歌的 Nano Banana 2。
MAI-Thinking-1 在基准测试中的表现如何?
根据微软 AI 首席执行官 Mustafa Suleyman 的说法,MAI-Thinking-1 在 AIME 2025 上得分为 97%,并在由独立评估者进行的盲测中,相比 Claude Sonnet 4.6 更受青睐。
迈克尔·塞勒呼吁就 STRC 半月度分红进行股东投票,为全球 24,000 家证券中的首次
根据X上的迈克尔·塞勒,MicroStrategy的创始人兼执行董事长正在敦促股东就是否投票将永久优先股STRC设为全球唯一的半月度分红证券,覆盖大约24,000种产生分红的证券。若获得批准,该提案将在数字信贷领域建立“100...
Gevulot 宣布推出首个面向生产环境的通用 ZK 网络 FirestarterGevulot宣布推出Firestarter,声称是首个面向生产环境的通用ZK证明网络。Firestarter专为简化和加速证明生成而设计,与现有解决方案相比,其成本降低超过95%,同时提升了ZK证明的速度和效率,使开发者和组织能够以更...
David Bailey 提议用比特币支持特朗普“Gold Card”移民计划据Bitcoincom报道,BTCInc.CEODavidBailey提议通过比特币为特朗普政府的“GoldCard”计划提供资金。该计划允许富裕人士支付约500万美元(或以比特币支付)以获得美国居留权。Bailey指出,许多新兴市场的精英希望移居...
币安发文详细回应近期热点币安发文详细回应近期热点:USDC短暂停止提现是因为PAX/BUSD与USDC之前的转换需要通过美国纽约一家银行的美元账户,且在银行的营业时间才能进行,导致了转换延迟;12月12日至14日之间,平台净提款就达到了60亿美金,...
Greekslive:2.7 万张 BTC 期权和 22 万张 ETH 期权到期据Greekslive,2.7万张BTC期权到期,PutCallRatio为1.03,最大痛点100000美元,名义价值27.6亿美元。22万张ETH期权到期,PutCallRatio为1.36,最大痛点2300美元,名义价值5.7亿美元。目前比特币中短期限RV已经跌破35...