Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题

zhongguodianxin2026-05-09 19:27:04theblockbeats

Google DeepMind 发布了 AI 共数学家(AI co-mathematician),一种多智能体数学研究助手,在 FrontierMath 第 4 级基准上实现 47.9% 的准确率,超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录(39.6%)。该系统解决了 48 道题中的 23 道题,包括 3 道此前所有模型都无法解答的问题。该系统基于 Gemini 3.1 Pro 构建,采用分层架构:项目协调员智能体向子智能体分发任务,由子智能体分别负责文献检索、编码与推理,并在提交前由多个审阅智能体对证明进行验证。

Epoch AI 进行了盲测,确保 DeepMind 团队看不到题目,每道题允许进行 48 小时的计算。在实际应用中,数学家 Marc Lackenby 使用该系统解决了《Kourovka Notebook》中的一个未决猜想,展示了其实际研究价值。目前,该系统正处于测试版阶段,仅向少数数学家开放。

巴拉圭警方挫败加密矿场盗窃案,三名中国籍嫌犯被遣返

巴拉圭警方在科罗内尔·博加多镇挫败一起针对加密矿场服务器的盗窃企图,抓获四名中国籍嫌疑人,其中三人被驱逐出境,另一人因重伤入院,仍被羁押。嫌疑人试图非法进入矿场受限区域,盗取挖矿设备。四名嫌疑人声称自...

特朗普媒体(DJT)宣布完成 25 亿美元私募融资,拟建立比特币金库

据streetinsider,特朗普媒体(DJT)已与约50家机构投资者完成私募协议,将发行约15亿美元普通股及10亿美元可转债,融资总额约25亿美元,预计于5月29日交割。本次募资的资金将主要用于建立比特币金库。Cryptocom与An...

Huobi 公示平台冷热钱包资金余额,称将其作为长期公开事项

据Huobi官方公告,Huobi公示平台冷热钱包资金余额,称将其作为长期公开事项。Huobi先行展示部分主要资产储备情况:BTC32K、ETH274K、USDT820M、TRX9.7B,本次公布总资产折35亿美元左右,并附资产储备币种网络与个数...

韩国金融监督院正在调查 Coinone 交易所关于 MOVE 上市及价格剧烈波动的相关情况

据韩媒MTN报道,韩国金融监督院正在调查Coinone交易所关于MovementCoin上市及价格剧烈波动的相关情况。12月9日,MovementCoin价格在短短16分钟内从215.3韩元暴涨至99.85万韩元(约4.6万倍),随后迅速回落至5300韩元...

Lloyd’s of London 将推出可以通过以太坊区块链支付的保险单

英国保险市场伦敦劳合社Lloyd’sofLondon将推出可以通过以太坊区块链支付的保险单,将允许客户使用USDC或原生加密货币支付,或完全在链上投保。此次加密货币保险承销商Evertas是劳合社的承保人,已与基于智能合...

上一篇:OpenAI 的奖励系统无意中在包括 GPT-5.4 在内的 6 个模型上对思考链进行评分
下一篇:国务院批准关于 5 月 9 日矿产资源法实施条例