学子风采丨必赢官网博士生李金膛荣获第二届世界科学智能大赛一等奖
近日,上海科学智能研究院与复旦大学联合主办、阿里云天池协办的第二届世界科学智能大赛圆满落幕。必赢官网博士生李金膛在我校陈亮老师、陈武辉老师的指导下,凭借扎实的专业基础和创新实践能力,从24个国家和地区的1085个机构的12687名选手中脱颖而出,获得了大赛总决赛逻辑推理赛道的一等奖(此赛道唯一一个)。
李金膛(左一)于大赛颁奖典礼
李金膛于总决赛答辩现场
比赛介绍
第二届世界科学智能大赛由上海科学智能研究院与复旦大学联合主办,阿里云协办,以科学智能为风向标,秉持AI赋能千行百业的理念,聚焦五大赛道科技和产业前沿的深入探索。指导机构为上海市科学技术委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教育委员会。
作为科学智能(AI for Science)领域的全球前沿赛事,大赛不限国籍、地域、单位,面向全球人才进行选拔,共设立生命科学、地球科学、物质科学、社会科学、逻辑推理等五大赛道。大赛共吸引了来自24个国家和地区的12687名选手参赛,20多位来自上海顶尖高中的高中生首次组团参赛,赛事具有极强的多元性和挑战性。
本次赛事五大赛道中的逻辑推理赛道是唯一一个以“大模型”为主题的竞赛赛道,该赛道主要考验参赛选手通过解决复杂的逻辑推理题,测试大型语言模型的逻辑推理能力。赛题设置上,采用了多样化的逻辑题,涵盖了多种关系和推理规则,覆盖了不同难度的逻辑推理任务,强调了逻辑推理在AI领域的重要性。比赛的研究成果将有助于评估和改进模型的逻辑推理能力,对于开发更智能、更有效的人工智能系统具有重要意义。
大赛总决赛合影
大赛获奖名单
获奖成果介绍
学院参赛选手李金膛在导师的指导下,在比赛过程中设计并实现了《基于数据合成与模型微调的大模型逻辑推理能力增强》方案,旨在打破大模型“随机鹦鹉”的桎梏,赋予大模型更强大的逻辑推理能力。
创新点:本方案基于通义千问模型,采用多阶段的Easy-to-Hard数据合成方法,模拟人类学习的由简单到困难的思路,逐阶段构造多样化的训练数据。数据生成阶段,训练数据的标签,引入了“Chain-of-Thought”思维链模式,生成多样化的推理路径,逐步对齐推理Scaling Law。训练阶段,采用了LoRA对通义千问32B模型在合成数据集上进行参数高效微调。推理阶段,使用了4bit低精度量化,并结合vLLM框架进行推理加速,最终达到准确性、效率和显存利用率的统一。
学生获奖感想
首先,比赛的复杂性使我更加深入地理解了逻辑推理在大型语言模型中的应用挑战,让我清晰地认识到如何构建有效的推理路径,以及设计多样化数据来引导模型准确理解逻辑关系的重要性。其次,通过在不同数据集上多次微调模型,我在模型训练与集成优化方面积累了丰富的实践经验,帮助我更好地理解模型在不同训练条件下的表现差异。总体而言,这次比赛不仅显著提升了我的专业技术能力,也使我更加深刻地认识到,逻辑推理是人工智能迈向更高认知能力的关键领域,仍有许多值得探索的空间。