新浪网

AI“群体智能”正在兴起,多个小模型合作解题超越GPT-4o mini

资讯滚动

关注

确定不再关注此人吗

转自:上观新闻

大模型和智能体(Agent)的兴起,让“群体智能”这一人工智能研究领域焕发了新的活力。3月30日,通用群体智能学术论坛在上海举行,多位专家学者交流了他们的研究进展。上海人工智能实验室青年科学家白磊介绍,他和同事正在探索小模型“群而增智”的尺度定律,已在多个解题任务上,初步实现了9B(90亿)参数以内开源小模型群体赶超闭源模型GPT-4o mini,展现出多个AI模型或智能体“合作”的应用潜力。

群体智能这个研究领域,源于动物学家对蚂蚁、蜜蜂等社会性昆虫群体行为的研究。为了把昆虫的群体智能“移植”到机器中,科学家开始研发具有自组织性的机器人群体,通过去中心化的分布式控制等方法,希望让机器人群体也能具有像昆虫群体一样的分工协作本领。

北京航空航天大学教授吴文峻介绍,群体智能技术迄今经历了三代演化:2016年前,主要研究基于仿生控制的无人机器集群;2016—2022年,研究多智能体的深度强化学习;2023年至今,研究基于大模型的通用智能体认知协作和社会群体智能。

说到智能体,公众已不陌生。3月6日,贴上“全球首款通用智能体”标签的Manus智能体发布,引发众多网民关注。智能体是指能感知环境并采取行动,以实现特定目标的代理体,它可以是软件、硬件或一个系统,具备自主性、适应性和交互能力。目前,基于大模型的智能体尚未成熟,Manus的用户评价也是毁誉参半。然而,上海科学家已先行一步,开始研究多个智能体的分工协作,希望实现超越AI个体智能的群体智能。

群体智能源于动物学家对蚂蚁等昆虫群体行为的研究。(AI制图)

要实现这个目标,技术难度和不确定性很大。白磊告诉论坛听众,在多智能体辩论这条技术路线上,他们采用4个基础模型和5种代表性多智能体辩论方法,在编程、数学、通识问答等9个基准数据集上开展了对比实验,结果发现在91.1%的情况下,多智能体辩论不能超越如今推理大模型普遍采用的思维链(CoT)方法。

虽然目前很难超越思维链,但白磊依然看好群体智能,认为它是实现通用人工智能(AGI)的一条技术路线。“创造力是人工智能发展的终极目标,有了创造力,人工智能就可以自主发现新的科学理论。科学群体智能具有自主发现的潜能,我们正在开展这方面研究。”

令人欣喜的是,上海人工智能实验室利用群体智能技术,让9B参数以内开源小模型群体在MATH500(数学推理水平测试集)、GPQA(生物学、物理学和化学测试集)、finQA(金融领域数值推理测试集)等多个学科领域的测试得分超过了OpenAI公司开发的GPT-4o mini。

上海人工智能实验室还在复杂化学反应条件优化、药物研发实验结果反馈优化等科研场景中,用多智能体系统获得了较传统方法更好的结果。白磊介绍:“在化学反应条件优化实验中,我们的群体智能方法在第4轮实验中就收敛至最佳,而传统方法在第9轮实验中还没收敛,优化效率提升了50%。”在这项对比研究中,反应预测智能体、统筹智能体、化学专业智能体等多个智能体分工协作,展示出“AI科研团队”的群体智能水平。

原标题:《AI“群体智能”正在兴起,多个小模型合作解题超越GPT-4o mini》

栏目主编:黄海华

来源:作者:解放日报 俞陶然

热门评论点击查看更多

Niubility教研室 0
三个臭皮匠顶个诸葛亮,大模型催生智能只是个起点。大模型孕育小模型,模型越多规模越大,群体智能就可能出现,构建起另一个智能世界,这一步对智能发展来说可能比人类过去千年的积累还重要
广东佛山
回复TA
厨房辣妹inator 0
未来的发展方向是值得期待的
广东佛山
回复TA
YogaMasterMing 0
科技改变生活
四川
回复TA

众多新闻客户端用户正在参与精彩热评,快快加入吧!

好的评论会让人崇拜
查看24条评论
特别声明:以上文章内容仅代表作者本人观点,不代表 新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与 新浪网联系。
洛杉矶奥运会乒乓球金牌增至6块617万
赵勇担任中国女排主帅386万
医托骗1.68米女子正常腿断骨成X腿380万
李在明宣布参选韩国总统375万
欧盟对美加征25%关税349万
苹果紧急往美国运iPhone348万
查看全部实时热点
请输入评论内容

说说你的看法

打开APP

举报成功

举报

请您选择举报的原因
意见/建议 反馈入口
  • TOKEN
  • 标题/昵称
  • 反馈内容

已反馈成功~

意见/建议 反馈入口
  • TOKEN
  • 标题/昵称
  • 反馈内容

已反馈成功~