为什么“表征”决定了AI4S模型的上限?《AI4S实战派》首课复习

张开发
2026/4/10 9:40:11 15 分钟阅读

分享文章

为什么“表征”决定了AI4S模型的上限?《AI4S实战派》首课复习
作为多学科、系统化的AI4S工程实战宝典《AI4S实战派》栏目立足开放生态、持续演进致力于“手把手”带你率先跑通科学大模型将复杂、多学科的AI模型转化为能跑、能用、能创新的生产力工具帮助科研人员和开发者零门槛上手加速科学新发现。AI4SAI for Science科学智能正日益成为一种主流科研范式掌握相关能力也成了科研工作者的关键课题。近日上海科学智能研究院上智院 SAIS、复旦大学、魔搭社区、Datawhale联合策划的《AI4S 实战派》栏目正式启航。作为一套多学科、系统化的AI4S工程实战宝典《AI4S实战派》立足开放生态、持续演进致力于“手把手”带你率先跑通科学大模型将复杂、多学科的AI模型转化为能跑、能用、能创新的生产力工具帮助科研人员和开发者零门槛上手加速科学新发现。首个课程模块《AI4S第一课》聚焦通识覆盖表征学习、扩散模型、自回归、神经求解器、智能体等主题将通过5次直播为你打下扎实基础。于3月5日开展的第一期邀请到了浙江大学百人计划研究员、前微软亚洲研究院高级研究员、RD-AgentGitHub 1.3w Star项目核心作者——方榯楷。他在直播中拆解了AI理解万物的底层技术——表征学习。今天我们来一起温故知新视频回放可以点击https://aistudio.ai4s.com.cn/partner/research-plaza/research-plaza-web/sais-community/course/2041392055095648256AI4S 一场AI和Science的“双向奔赴”AI4S是什么方榯楷的回答是这不是单向的技术赋能而是一个双引擎驱动的循环。AI for Science——用AI的计算能力解决蛋白质折叠、材料发现等复杂的科学黑盒问题。Science for AI——利用物理学的第一性原理能量守恒、对称性重新构建AI的架构使其更稳健、可解释。两者相加他认为是完整的AI4S。一个典型案例是AlphaFold 3。如果说AlphaFold 2是AI4S的里程碑那么AlphaFold 3则是AI和Science双向奔赴和融合的绝佳案例在方法层面研究团队受热力学启发引入了原本用于图像生成的扩散模型架构在结果层面首度使用AI深入解决领域科学难题实现了从单一蛋白质到所有生命分子相互作用的跨越。为什么我们现在必须关注AI4S因为主流科学关注的是物质和物质之间的关系转化。AI的介入让科研从人力试错转向智能预见帮助科学家在海量可能性中快速锁定最优解。当互联网文本数据已近枯竭未来的AI需要通过科学模拟器根据第一性原理合成无限的高质量数据去解锁下一个智能临界点。为什么“表征”决定了模型的上限在AI4S的通用任务流程中存在三个核心挑战1.表征问题——如何将3D坐标、分子拓扑图或网格张量“翻译”成AI懂的语言2.建模问题——如何通过函数逼近寻找性质能量、硬度等的映射3.约束问题——如何将物理定律“编码”进模型方榯楷给出了一个判断很多人迷信更深层的Transformer但在科学场景中表征决定了模型的上限。如果你将分子的3D结构简单粗暴地拍扁成2D图像处理无论模型多强都会因为丢失结构性质而导致预测崩塌。表征是AI理解物理世界的“第一性原理”。什么样的表征才是“好表征”不是所有的映射都能称为好的表征。方榯楷拆解了衡量表征质量的四大黄金准则1. 距离保持——保持现实逻辑现实中性质相近的物体映射到隐空间后其向量距离也必须相近。两把结构相似的椅子在隐空间里应该靠在一起。如果一把椅子映射后的距离反而离一个苹果更近——这个表征就发生了“距离崩塌”模型无法理解事物的相似性。2. 连续性——拒绝规律“突变”好的表征空间应该是平滑的。在隐空间里缓慢移动向量坐标对应的现实事物也应产生连续变化而不是无意义的“闪现”。在流体力学实验中当你在隐空间缓慢拖动滑块流场图像应像水流一样自然演变。3. 可插值与可操作性——探索“中间地带”在隐空间里对两个向量加权插值结果应对应现实中介于两者之间的产物。这意味着我们可以通过对已知材料的向量插值让AI预测出一种尚未被发现的新型中间态物质。4. 不变性——尊重第一性原理科学对象拥有独特的对称性。一个化学分子无论在空间中如何旋转、平移或翻转它本质上还是同一个分子。优秀的表征必须保持这种物理性质的对称。如果旋转一下分子AI就不认识了——这种表征在科学场景下是失败的。表征技术的演进如何获取这些表征技术路径经历了从人工驱动到数据驱动的进化1.有监督学习——经典范式但依赖昂贵的实验室标注且缺乏泛化性。2.自监督学习SSL——学习数据的“数字全息图”具体包括掩码自编码器像完形填空一样随机遮盖75%的流场变分自编码器VAE实现从确定性映射到连续概率分布的跃迁自回归预测下一秒的物理场状态扩散模型从混沌中还原物理真实。实战演示16维向量捕捉流体之魂理论讲完方榯楷带来了一个直观的实操演示。以流体力学中的经典现象——卡门涡街为实验对象数据场景采用64×128的流体图像包含8000余个数据点要求仅用16维隐空间向量实现高维非线性物理规律的压缩与复原。结果有多精准重构——输入一张测试集流场图AI在16维空间转了一圈后输出两张图几乎一模一样均方误差MSE达到10⁻⁴。智能修复——对原始图像挖掉一大块或添加大量噪声AI依然能通过16维隐空间“脑补”出干净、完整的物理图像。性能对比——深度表征学习在处理这种复杂物理规律时对传统统计方法如PCA形成了降维打击。目前方榯楷已将课程配套代码开源至GitHub仓库包含数据集、流场自编码器及VAE的 Notebook。https://github.com/xuangu-fang/AI4S-101/结语“看清”世界及逆向设计表征学习是AI4S的第一性原理——它将复杂的自然精髓浓缩为可计算的向量。但方榯楷强调这只是起点。通过表征学习与生成式建模VAE或扩散模型的耦合我们不仅能让AI尝试“读懂”某些世界更能进行逆向设计比如在隐空间里设定性能需求高强度、特定带隙、在对应的坐标采点、通过解码器将其还原为真实的物理结构等。 预告下一期扩散模型与 AlphaFold 3如果你已经学会了如何给万物发放“数字身份证”那么接下来的挑战将更加硬核且浪漫我们如何从噪声中“雕刻”出生命结构3月12日本周四19:30上海科学智能研究院视频号上该课程模块第二期重磅开启——《从混沌中雕刻生命扩散模型与AlphaFold 3》的主题课程上浙江大学百人计划研究员章敏将深度拆解AlphaFold 3的底层逻辑看生成式模型如何进化并试图打开预测万物的“上帝视角”。

更多文章