Google 的 Vision Banana:统一视觉模型在分割与 3D 几何方面的表现优于任务特定模型
4月23日,Google 研究人员(包括何凯明和谢赛宁)发布了一篇论文,介绍 Vision Banana,这是一种通用型视觉理解模型,通过对该公司 Nano Banana Pro (Gemini 3 Pro Image) 图像生成模型进行轻量指令微调而创建。关键创新将所有视觉任务的输出统一为 RGB 图像,使得在不需要任务特定架构或损失函数的情况下,通过图像生成即可实现分割、深度估计和表面法线预测。
在语义分割方面,Vision Banana 在 Cityscapes 上比专门模型 SAM 3 高 4.7 个百分点;在指列表达式分割(referring expression segmentation)方面,它超过了 SAM 3 Agent。不过,在实例分割(instance segmentation)方面,它落后于 SAM 3。对于 3D 任务,度量深度估计在四个标准数据集上取得了 0.929 的平均准确率,超过 Depth Anything V3 的 0.918;推理时仅使用合成数据,无需真实深度信息或相机参数。表面法线估计在三个室内基准测试上达到了最先进的结果。
微调过程仅将少量视觉任务数据混入原始图像生成训练,从而保留了模型的生成能力——在生成质量测试中,其性能与原始 Nano Banana Pro 相当。论文提出,视觉中的图像生成预训练与语言中的文本生成预训练相类似:模型在生成过程中学习图像理解所需的内部表征,而指令微调只是释放这种能力。
纽约州总检察长办公室要求对 Gemini 和 DCG 的诉讼索赔额提升至 30 亿美元美国纽约州总检察长办公室(OAG)寻求扩大对加密货币公司Gemini和DCG提起的反欺诈民事诉讼,要求索赔30亿美元。该诉讼最初于10月份提起,要求赔偿11亿美元。纽约州总检察长LetitiaJames称,经过持续的调查,发现DCG、D...
Binance 用户获准重启 8000 万美元比特币被盗诉讼据BloombergLaw报道,佛罗里达州第三上诉法院周三裁定,一名称在Binance平台遭盗取约8,000万美元比特币的用户可重启州级诉讼,认定初审法院关于“对Binance缺乏司法管辖权”的结论有误。原告指控Binance未能及时冻结...
以太坊开发者于本周二在 Sepolia 测试网上成功部署 Fusaka 升级以太坊开发者于本周二在Sepolia测试网上成功部署Fusaka升级,这是继两周前Holesky测试后的第二次测试。Fusaka将引入PeerDAS数据验证方法,允许验证者只处理部分数据而非完整"blobs",有望降低带宽需求和机构用户成本...
Binance.US:BCH 提现故障系技术问题,现已恢复正常Binance.US发推解释近期BCH提款故障问题,并表示Binance.US维持1:1储备。此前故障是由于存款结转系统出现了技术问题,导致客户的BCH存款地址未自动结转。目前,其团队修复了问题,存款、热钱包和冷钱包运行已恢复正...
Ripple 总裁:预计到 2026 年底,约 50% 的 500 强企业将持有加密资产敞口Ripple总裁MonicaLong发文表示,预计到2026年底,约50%的《财富》500强企业将持有加密资产敞口,并实施涵盖代币化资产、链上国债、稳定币及可编程金融工具的正式战略。她认为,加密行业正从试点走向生产阶段,2026年...
Immutable X 在 ApeCoin 论坛上发布 AIP Idea:成为ApeCoin DAO 的 Layer 2 扩展合作伙伴
以太坊L2ImmutableX于5月27日在ApeCoin论坛上发布AIPIdea:希望ImmutableX成为ApeCoinDAO的Layer2扩展合作...
韩金融监督院对 PG 企业虚拟资产持有情况的调查:拥有虚拟资产的有 6 家,Do Kwon 旗下 Chai Corporation 零持有
据韩媒MoneyToday报道,韩国金融监督院最近对电子支付结算代理(PG)企业的虚拟资产(加密货币)持有情况进...
Kaiko 研究:Coinbase 在 LUNA 崩溃期间交易量创下其历史次高;FTX 5 月市场份额首次超过 Coinbase
据Kaiko研究,Coinbase在Terra的UST崩盘后的抛售中的交易量为其历史次高,仅次于519期间;FTX的市场份额在5...
获 Paradigm 和 Coinbase Ventures 投资的中东最大加密交易所之一的 Rain Financial 已在近期行情低迷时裁减了数十名员工
据知情人士透露,中东最大的加密货币交易所之一RainFinancialInc.已经在近期加密货币的低迷中解雇了数十名...