"Science of AI :人工智能的科学基础研讨会"在沪举行,共探智能理论根基与未来路径
上海教育新闻网 程媛媛 2026-04-24 09:57:57
本网讯(记者 程媛媛)人工智能浪潮奔涌向前,技术应用日新月异,但其背后的科学根基与理论本源亟待系统探寻。4月22日,由上海交通大学人工智能学院主办的“Science of AI:人工智能的科学基础研讨会”在上海交大徐汇校区人工智能学院举行。来自高校院所、科研机构的专家学者聚焦人工智能数理基础、理论框架与人才培养等核心议题,共探智能科学底层逻辑,共筑人工智能可持续发展的坚实科学根基。

本次论坛以“人工智能的科学基础”为主题,指出虽然人工智能已取得显著成果,但科学基础的薄弱导致学科发展多次出现起伏,因此亟需推动人工智能学科从工程化走向科学化,促使相关技术从凭经验、靠试错的低效模式,转向由基本原理指导的发展方向,以在未来5至10年人工智能能建立起坚实的科学基础,实现更高质量的发展。
上海交通大学副校长蒋兴浩在致辞中强调,人工智能的发展既要重视应用实践、释放技术创新价值,更要夯实自身科学体系、筑牢发展根基。站在建校130周年与人工智能学院成立两周年的交汇点上,深入探讨人工智能的科学基础,既是回应国家战略、培育新质生产力的必然要求,也是破解技术瓶颈的核心命题。
在主旨报告环节,中国科学院院士、清华大学计算机科学与技术系教授胡事民作“大模型的评测基准和自主生态”报告。他表示,我国大模型研究取得进展,开源领域已领先国际,但多模态推理能力仍有短板。在自主生态方面,其团队研发的“计图”框架具备速度快、适配国产芯片效率高的优势,通过元算子机制不仅可快速适配芯片,还能实现生态迁移,大幅提升国产芯片在大模型推理等场景的性能。在大模型评测上,团队构建了多学科评测基准,发现模型存在多模态能力不足、几何推理受尺度率影响小、模型“偷懒”等问题。为此,他们开源多模态数据集与8B参数模型,为国产大模型发展提供基础资源与技术支撑。
北京大学智能学院信息科学中心教授王立威作“大模型时代机器学习理论”报告。他表示,当前大模型理论研究主要围绕样本效率、任务泛化、知识学习与发现三大核心方向展开。思维链提示(CoT)为何能大幅提升大模型的推理能力:大模型的Transformer结构在不使用思维链时,很难直接一步给出数学题、逻辑推理等任务的正确答案。而加入思维链后,模型可以按步骤分步推导、逐词生成答案,即便参数规模固定,也能完成复杂推理,甚至可以解决P完全类问题。这从理论上解释了思维链的核心价值,也为理解与优化大模型的推理能力提供了关键依据。
在主题报告环节,上海交通大学人工智能学院教授严骏驰分享了团队大模型优化研究成果JTok模块。上海交通大学人工智能学院副教授谢伟迪分享了OmniStream 4D流式视觉基础模型,破解视觉领域“一个任务一个模型”的碎片化困境。上海算法创新研究院研究员杨泓康分享了大模型“慢思考”与“主动感知”的前沿研究。上海交通大学人工智能学院助理教授夏纫秋分享了高可信AI领域的研究成果,聚焦自主探索的形式化数学推理。
在“人工智能时代的人才培养”圆桌论坛环节,与会专家探讨了AI研究从“作坊式”向“工业化”转变的趋势、校企及国家实验室协同育人的模式,以及如何有效平衡科研、教学与创业。当前,风险投资正向前沿基础领域前置,高校需破除常规,鼓励学生探索与试错,培养冒险精神,注重跨学科能力,在课程与论文评价体系需革新以适应快速变革的时代,真正做到解决真实问题,塑造精神内核。
在“Science of AI”圆桌论坛环节,中国科学院院士、西湖大学讲席教授、国家自然科学基金委员会交叉科学部主任汤超,北京大学博雅特聘教授、北京中关村学院常务副院长董彬,中国科学技术大学数学科学学院教授陈景润,中国科学院理论物理研究所副研究员陈锟,上海交通大学自然科学研究院/数学科学学院教授许志钦围绕训练模型的参数统计分布、智能与意识的涌现机制、物理智能的实现以及大模型机制可解释性等方面进行探讨,在方法论上需要发展新的理论框架,甚至可能引发物理学基础的革新,在解决路径上应结合严谨的科学训练,通过设计可控实验、观察现象、提出假设再验证的实证科学方法,逐步构建理解智能的新科学体系。
会议最后,中国科学院院士、上海交通大学人工智能学院首席顾问鄂维南表示,人工智能在理论层面已取得巨大进步,只是相关成果尚未被普遍了解,但从另一个角度来说,这恰恰是一个可以深入界定研究方向、组建相关研究团队的宝贵机会,但从根本而言,这项事业的推进最终必须依靠年轻人,需要年轻人主动作为、引领前行。
学校供图