AI“群体智能”正在兴起，多个小模型合作解题超越GPT-4o mini

转自：上观新闻

大模型和智能体（Agent）的兴起，让“群体智能”这一人工智能研究领域焕发了新的活力。3月30日，通用群体智能学术论坛在上海举行，多位专家学者交流了他们的研究进展。上海人工智能实验室青年科学家白磊介绍，他和同事正在探索小模型“群而增智”的尺度定律，已在多个解题任务上，初步实现了9B（90亿）参数以内开源小模型群体赶超闭源模型GPT-4o mini，展现出多个AI模型或智能体“合作”的应用潜力。

群体智能这个研究领域，源于动物学家对蚂蚁、蜜蜂等社会性昆虫群体行为的研究。为了把昆虫的群体智能“移植”到机器中，科学家开始研发具有自组织性的机器人群体，通过去中心化的分布式控制等方法，希望让机器人群体也能具有像昆虫群体一样的分工协作本领。

北京航空航天大学教授吴文峻介绍，群体智能技术迄今经历了三代演化：2016年前，主要研究基于仿生控制的无人机器集群；2016—2022年，研究多智能体的深度强化学习；2023年至今，研究基于大模型的通用智能体认知协作和社会群体智能。

说到智能体，公众已不陌生。3月6日，贴上“全球首款通用智能体”标签的Manus智能体发布，引发众多网民关注。智能体是指能感知环境并采取行动，以实现特定目标的代理体，它可以是软件、硬件或一个系统，具备自主性、适应性和交互能力。目前，基于大模型的智能体尚未成熟，Manus的用户评价也是毁誉参半。然而，上海科学家已先行一步，开始研究多个智能体的分工协作，希望实现超越AI个体智能的群体智能。

群体智能源于动物学家对蚂蚁等昆虫群体行为的研究。（AI制图）

要实现这个目标，技术难度和不确定性很大。白磊告诉论坛听众，在多智能体辩论这条技术路线上，他们采用4个基础模型和5种代表性多智能体辩论方法，在编程、数学、通识问答等9个基准数据集上开展了对比实验，结果发现在91.1%的情况下，多智能体辩论不能超越如今推理大模型普遍采用的思维链（CoT）方法。

虽然目前很难超越思维链，但白磊依然看好群体智能，认为它是实现通用人工智能（AGI）的一条技术路线。“创造力是人工智能发展的终极目标，有了创造力，人工智能就可以自主发现新的科学理论。科学群体智能具有自主发现的潜能，我们正在开展这方面研究。”

令人欣喜的是，上海人工智能实验室利用群体智能技术，让9B参数以内开源小模型群体在MATH500（数学推理水平测试集）、GPQA（生物学、物理学和化学测试集）、finQA（金融领域数值推理测试集）等多个学科领域的测试得分超过了OpenAI公司开发的GPT-4o mini。

上海人工智能实验室还在复杂化学反应条件优化、药物研发实验结果反馈优化等科研场景中，用多智能体系统获得了较传统方法更好的结果。白磊介绍：“在化学反应条件优化实验中，我们的群体智能方法在第4轮实验中就收敛至最佳，而传统方法在第9轮实验中还没收敛，优化效率提升了50%。”在这项对比研究中，反应预测智能体、统筹智能体、化学专业智能体等多个智能体分工协作，展示出“AI科研团队”的群体智能水平。

原标题：《AI“群体智能”正在兴起，多个小模型合作解题超越GPT-4o mini》

栏目主编：黄海华

来源：作者：解放日报俞陶然