AI“群体智能”正在兴起,多个小模型合作解题超越GPT-4o mini

资讯滚动
转自:上观新闻


大模型和智能体(Agent)的兴起,让“群体智能”这一人工智能研究领域焕发了新的活力。3月30日,通用群体智能学术论坛在上海举行,多位专家学者交流了他们的研究进展。上海人工智能实验室青年科学家白磊介绍,他和同事正在探索小模型“群而增智”的尺度定律,已在多个解题任务上,初步实现了9B(90亿)参数以内开源小模型群体赶超闭源模型GPT-4o mini,展现出多个AI模型或智能体“合作”的应用潜力。
群体智能这个研究领域,源于动物学家对蚂蚁、蜜蜂等社会性昆虫群体行为的研究。为了把昆虫的群体智能“移植”到机器中,科学家开始研发具有自组织性的机器人群体,通过去中心化的分布式控制等方法,希望让机器人群体也能具有像昆虫群体一样的分工协作本领。
北京航空航天大学教授吴文峻介绍,群体智能技术迄今经历了三代演化:2016年前,主要研究基于仿生控制的无人机器集群;2016—2022年,研究多智能体的深度强化学习;2023年至今,研究基于大模型的通用智能体认知协作和社会群体智能。
说到智能体,公众已不陌生。3月6日,贴上“全球首款通用智能体”标签的Manus智能体发布,引发众多网民关注。智能体是指能感知环境并采取行动,以实现特定目标的代理体,它可以是软件、硬件或一个系统,具备自主性、适应性和交互能力。目前,基于大模型的智能体尚未成熟,Manus的用户评价也是毁誉参半。然而,上海科学家已先行一步,开始研究多个智能体的分工协作,希望实现超越AI个体智能的群体智能。

要实现这个目标,技术难度和不确定性很大。白磊告诉论坛听众,在多智能体辩论这条技术路线上,他们采用4个基础模型和5种代表性多智能体辩论方法,在编程、数学、通识问答等9个基准数据集上开展了对比实验,结果发现在91.1%的情况下,多智能体辩论不能超越如今推理大模型普遍采用的思维链(CoT)方法。
虽然目前很难超越思维链,但白磊依然看好群体智能,认为它是实现通用人工智能(AGI)的一条技术路线。“创造力是人工智能发展的终极目标,有了创造力,人工智能就可以自主发现新的科学理论。科学群体智能具有自主发现的潜能,我们正在开展这方面研究。”
令人欣喜的是,上海人工智能实验室利用群体智能技术,让9B参数以内开源小模型群体在MATH500(数学推理水平测试集)、GPQA(生物学、物理学和化学测试集)、finQA(金融领域数值推理测试集)等多个学科领域的测试得分超过了OpenAI公司开发的GPT-4o mini。
上海人工智能实验室还在复杂化学反应条件优化、药物研发实验结果反馈优化等科研场景中,用多智能体系统获得了较传统方法更好的结果。白磊介绍:“在化学反应条件优化实验中,我们的群体智能方法在第4轮实验中就收敛至最佳,而传统方法在第9轮实验中还没收敛,优化效率提升了50%。”在这项对比研究中,反应预测智能体、统筹智能体、化学专业智能体等多个智能体分工协作,展示出“AI科研团队”的群体智能水平。
原标题:《AI“群体智能”正在兴起,多个小模型合作解题超越GPT-4o mini》
栏目主编:黄海华
来源:作者:解放日报 俞陶然
举报成功