阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

tingqianren2026-04-27 15:33:42t

4月27日,阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。

双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。

该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。

Elon Musk 重塑品牌将 Twitter 标志性的蓝鸟标志换成 X 符号,导致大量仿盘

ElonMusk计划重塑品牌将Twitter标志性的蓝鸟标志换成X符号,导致大量仿盘,数种标有“X”的代币上线DEX且涨幅异常。专业交易员表示,这种乐观情绪之所以存在,是因为BTC和ETH等主流代币正在经历低波动期,迫使一些市...

Accumulus 向香港证监会提交虚拟资产交易平台牌照申请

香港证监会已更新虚拟资产交易平台申请者名单,AccumulusGBATechnology(Hongkong)Co.,Limited(中文名称:云账户大湾区科技(香港)有限公司)已于12月6日提交虚拟资产交易平台牌照申请,旗下虚拟资产交易平台名称为Ac...

Four Meme 回应平台疑似攻击事件:称为正常费用收集行为,资金安全

针对FourAi指出的FourMeme发射平台疑似受到攻击的消息,SlowMist

新型胶原蛋白产品以1,999元起上市,中国生物医美市场持续扩张

4月23日,信阳(SY.US)和金博生物科技(920982.BJ)于4月22日宣布了一项战略合作。金博的新胶原蛋白产品“唯妍美肌ColPact”将独家供给信阳青少年门诊。信阳基于该产品推出“奇迹胶原蛋白”,用于面部和头皮抗衰老,售...

内华达州针对 Kalshi、Polymarket 的交易禁令风险上升

据Decrypt,联邦法官已将内华达州针对Kalshi及Polymarket母公司Blockratize的相关案件发回州法院审理,认为内华达监管方主张主要基于州法,且《商品交易法》(CEA)并未对相关州博彩法主张构成“完全排除”。这意味...

TAG:AI Agent
上一篇:三星电机股价因强劲的AI服务器需求飙升93%
下一篇:随着汽油价格上涨,现代美国电动汽车3月销量激增40%