
天地学的法度模子 ΛCDM(Lambda-Cold Dark Matter,天地常数-冷暗物资模子)还是见效运行了几十年,直到连年来,跟着对大质地中微子、修改引力、暗能量演化等域的盘问约束入,物理学驱动怀疑,ΛCDM 可能并不完满。而在法度模子除外,每观看个新物理假说,就要重新开垦套精度天地模拟,计较老本其昂。
近日,普林斯顿大学(Princeton University)与弗拉特艾恩盘问所(Flatiron Institute)的物理学建议了处分案:参考大说话模子的预西宾-微调法,先用低价的法度天地学模子西宾 AI,再用少许且愉快的新物理模拟工夫对其进行微调。效果示,这种计谋照实不错大幅镌汰计较老本。但同期,盘问东谈主员还发现了种名为“负挪动”的气候:若是新物理的信号碰劲与旧表面的某个参数度相似,AI 反而学得慢、阐扬差。
这是否说明,在基础物理中,AI 学到的旧知识,反而成了它发现新物理的阻拦?
新物理模拟虽好,破费算力却真实昂
ΛCDM 模子不错评释从天地推广到星系散播的大法度天地不雅测气候。但在粒子物理实验中阐发领有质地的中微子,其具体质地于今仍是法解答的谜题。此外,引力在大法度上是否严格谨守广义相对论、暗能量的动态演变等前沿课题,齐促使物理学将眼神投向法度模子除外的“新物理”鸿沟。
改日几年,四阶段(Stage-IV)的大型巡天技俩,如暗能量光谱仪(DESI)、欧几里得空间千里镜(Euclid)、薇拉·鲁宾天文台(Vera C. Rubin Observatory)等,将产生前所未有范围的精度数据,有望恢复上述未解之谜。
不外,要从不雅测数据中索要“新物理”的信号,物理学还需要将真实数据和多半的天地学模拟进行比对,即基于模拟的断(SBI)。然而,包含新物理的模拟频繁比法度 ΛCDM 模拟愉快,需要的算力也呈量增长。
图 | 不同天地学模子模拟出的同天地区域(着手:EurekAlert)唐山铁皮保温施工
先西宾,再微调
为了尽可能压缩老本,同期不影响新的科学发现,盘问东谈主员鉴戒了生成式 AI 的“预西宾-微调”计谋:模子先在海量通用文本上学习,再字据特定任务微调,在天地学域构建种梗概跨物理模子复用知识的“基础模子”。
盘问团队使用的是由多国科学归拢开垦的堂吉诃德天地学模拟数据集(Quijote simulations):其中包含 44,100 次 N 体天地学模拟,为机器学习西宾缱绻。盘问东谈主员先用三万多个法度天地学模子(ΛCDM),对神经蚁集进行强度预西宾,这阶段,蚁集开垦起了关连天地大法度结构演化的经典物理知识。
随后,盘问东谈主员将预西宾模子挪动至包含新物理特征的精度模拟中,连续进行微调。这三种“越法度模子”的场景永别为大质地中微子(M_ν)、Hu–Sawicki 花式的修改引力 f(R)、原初非斯(包含 local 和 equilateral 两种类型)。
团队成员阿德里安·拜尔(Adrian E. Bayer)称,这种法与东谈主类由浅至的学习经由致:先读本初学讲义开垦举座框架,随后仅需研读少数前沿论文,即可快速顺应新的物理定律。反之,若是径直让 AI 次消化愉快、复杂的新物理模拟,率反而不。
十倍率擢升,架构是重要
效果示,在三种新物理场景下,挪动学习计谋有较好阐扬,在大质地中微子的场景下,使用挪动学习的蚁集,仅需原法不到畸形之的新物理模拟西宾量,就能达到疏浚的断精度。修改引力 f(R) 的情况一样如斯,而在原初非斯的履行中,挪动学习简直擢升了蚁集对各个天地学参数的断明锐度。
为考据率擢升径直来自知识结构化复用。盘问东谈主员缱绻了组对照实验,将 ΛCDM 模拟和新物理模拟羼杂,在疏浚数据总量下,铁皮保温施工归拢西宾出个大的神经蚁集模子。效果示,其阐扬远不足两阶段的挪动学习法。
在对比的三种蚁集案中唐山铁皮保温施工,团队发现,阐扬好的是种引入了“哑节点”(Dummy Nodes)的瓶颈结构蚁集。在预西宾阶段,这种架构的输出层就事前缱绻好了些许个空缺输出通谈,为尚未出现的新物理参数预留空间。通谈在阶段不参与亏空函数的计较,参加微调阶段后,可门用于承载和经受新引入的物理参数。
比较之下,径直冻结预西宾权重、只是在结尾拼接可西宾断头的保守案阐扬差。原因在于,这种硬的架构箝制,将蚁集里面表征强行锁在法度模子框架内,阑珊默契新物理所必需的纯真。
负挪动气候:AI 温故却难知新
这种西宾计谋一样存在进犯的劣势。在实验中,盘问东谈主员发现了种“负挪动”气候。在使用种对中微子质地明锐的统计量标志功率谱(marked power spectrum)进行实验时,他们发现,跟着阶段的预西宾进程约束加,蚁集经过二阶段微调后,本色阐扬反而差,重要参数的断精度出现了严重的恶化。
跳跃分析发现,原因来自参数简并。σ₈ 是刻画天地中物资聚首进程的重要参数,它在小法度上会著影响功率谱的花式。而大质地中微子由于解放流应,一样会遏制小法度结构的酿成。两者在不雅测数据中产生的脚迹为相似。永远以来,这种 σ₈–M_ν 简并的存在,是天地学测量中微子质地濒临的中枢阻拦之。
盘问团队借助 SHAP 法对蚁集里面方案进行可视化分析后发现:在预西宾阶段,蚁集学会把小法度上的功率谱变化归因于 σ₈;当微调引入中微子质地后,这些一样的小法度特征片刻有了二种评释。因此,蚁集不得不调换此前开垦起的映射,把部分归因于 σ₈ 的信号重新分拨给 M_ν,再从大法度的信息中“重新学习”σ₈,终致能下落。
为了证实负挪动照实受物理简并的驱动,盘问者将小法度数据从西宾中剔除,只保留大法度信息,而在大法度上,σ₈ 和 M_ν 的物理钤记可分辨。效果示,旦堵截小法度的简并可能,负挪动气候基本覆没,蚁集告成将中微子质地行动个全新、立的要素进行学习。
开脱旅途依赖,智商发现未知
当然说话处理或计较机视觉的任务之间分享多半底层结构,预西宾迢遥有。但在物理学中,不同的物理机制可能会在不雅测数据中阐扬出疏浚的特征。因此,用 AI 探索新物理的经由中,若是盘问东谈主员味追求构建庞大、万能的物理基础模子,就可能冷漠真实进犯的信号。
关于“负挪动”问题,盘问东谈主员给出了几个值得探索的处分向,包括特征空间阐明(把不同法度的物理当解耦)、梯度矫正机制(止新物理的梯度信号被预西宾表征秘密),以及渐进式域顺应等。
四阶段巡天行将开启,濒临行将产生的海量数据,这项盘问为率处理提供了可行案:低价的 ΛCDM 模拟可行动基础模子被大范围复用,新物理模拟的算力需求有望著镌汰。
AI 还是驱动度参与科学发现的经由,但这项盘问领导,AI 也有旅途依赖,要思真实发现“未知”,除了多半积聚已知规矩,还要学会“渐忘”。
参考内容:
https://iopscience.iop.org/article/10.1088/1475-7516/2026/06/026
运营/排版:何晨龙
注:封面/图由 AI 扶助生成联系人:何经理相关词条:设备保温 塑料挤出机厂家 预应力钢绞线 玻璃丝棉 万能胶厂家
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。