在數學家與理論物理學家之間,人工智慧引發了各種反應。有些人認為它與他們的工作無關;有些人則擔心AI可能會侵占他們領域中最具創造性和智力挑戰的部分。然而,來自倫敦數學科學研究所及其他機構的研究顯示,真相更為微妙。

AI並非取代數學科學中的人類創造力,而是增強它。軟體現在能逐行檢查證明,捕捉過去需數月人工審查才能發現的錯誤。它能系統性地尋找反例,測試猜想是否真正成立或在意想不到的情況下失效。AI還能提出論證中的中間步驟,建議有助於銜接已知與待證明結果的輔助結論。

在實驗科學領域,原型的「AI科學家」開始自動化部分發現流程,但仍受限於物理世界的需求:混合試劑、培養細胞、等待反應及處理數據噪音。相比之下,數學與理論物理面臨的瓶頸較少,因為「實驗」成本低、速度快且數位化,數學資料從質數到抽象結構(如流形)的性質都十分乾淨且豐富。

專為數學推理設計的AI系統在過去一年取得穩定進展。位於加州帕洛阿爾托的軟體公司Harmonic開發的Aristotle系統,協助解決了著名數學家保羅·埃爾德什提出的多個問題,這些問題雖易於陳述,卻極難破解。另一家初創公司Axiom Math宣稱其AI工具已找到許多專業數學家尚未解決的研究級問題。同時,OpenAI與Google DeepMind的模型解決了「第一證明計畫」中的多個挑戰,該計畫旨在測試AI系統是否能產生新的可驗證數學結果。

本文將舉例說明近年來該領域的快速進展,概述AI為理論科學家與數學家帶來的機會,並邀請研究者積極運用AI於工作中。

在理論物理與數學中,研究者結合創造性洞察與嚴謹邏輯推理來進行發現,但這一過程尚未完全被理解,且沒有單一解釋能說明突破是如何發生的。為了清晰起見(非提出確定模型),我們將過程分為幾個重疊階段:設定議題、形式化想法、提出猜想以及解決與驗證結果。此框架不完美,但有助於評估AI目前的貢獻、挑戰所在及可能的解決方案。

設定議題。研究中最具人性化的行為之一是決定哪些問題值得提出。這些問題可能來自領域外的現實問題或鄰近學科的接觸,也可能源自領域內理論依其內在邏輯與美學標準演進。這些來源相互交織:具體問題能催生新概念,抽象理論則能重塑並深化原始問題。

現今的AI系統對這種廣泛背景的理解有限,因此缺乏直覺與「品味」:無法感知問題的起源、時效性及其在領域演進結構中的位置。例如,物理學家愛因斯坦在發現光波在經典力學與描述電磁交互的麥克斯韋方程中處理方式矛盾後,發展出特殊相對論。

一個有前景但尚未充分探索的方向是建構AI系統,協助根據研究者選定的標準篩選與優先排序潛在問題。例如,AI可依據這些標準掃描大型數學資料庫(如整數序列線上百科)或預印本資料庫(如arXiv),識別被忽略的連結與領域間的結構相似性。如此一來,AI或能加深我們對科學家如何辨識有利發現方向的理解。

形式化想法。許多重要想法在被精確定義前已成形。經典例子是理論物理學家費曼提出的路徑積分,它透過想像所有可能的發生方式並加以組合來描述量子系統。儘管此概念尚未在嚴格數學意義上完全確立,卻深刻影響現代物理並啟發數學新工具,例如區分不同結型及計數複雜幾何形狀的方法。

將非正式的散文式論證轉換成電腦可處理的形式,通常需大量努力:重建省略步驟、填補看似明顯的空白、明確隱含假設。此過程能深化理解並揭露錯誤。例如,加州大學洛杉磯分校數學家陶哲軒使用證明助理(Lean4)檢查自己論文中的論證時,發現邏輯中一個微妙的缺口,一個看似明確的步驟其實未被嚴謹證明。

即使是最傑出的數學家,也能從要求每個推理步驟明確化的系統中受益。減少形式化所需的人力,將促成更大且品質更高的經驗證數學體系,進而用於訓練更優秀的AI模型。完全自動化形式化是長遠目標。

雖已有顯著進展,但仍需人類參與。例如,倫敦帝國學院數學家Kevin Buzzard領導的Xena計畫,動員大學生系統性數位化本科數學課程中的所有證明。

AI開始協助擴大此類任務。瑞典哥德堡查爾姆斯理工大學的計算機科學家兼數學家Josef Urban,利用大型語言模型形式化拓撲學中的定理,拓撲學研究形狀在拉伸或扭曲時的性質。

提出猜想。猜想是對明確提出問題的合理答案,即看似可能正確但尚未證明的有根據推測。AI現能生成猜想,但其角色仍謹慎且需人類嚴密監督。

這並非計算方法的新領域。早期專門電腦程式如Graffiti與Ramanujan Machine已證明演算法能提出新數學想法,而非僅檢驗既有想法。

例如,Graffiti發現網絡(連結點的簡單圖示)中意外模式,後來在化學中有用,因為分子可視為原子連結方式。Ramanujan Machine提出了基本數學常數的簡單公式。類似方法現正應用於理論物理,協助研究者發掘隱藏模式與精確公式。

實務上,AI生成的猜想多為瑣碎、已知或錯誤,仍由專家決定哪些值得追蹤。例如,2021年AI協助縮小有關數學「結」的代數與幾何結構的廣泛假說至單一嚴謹定義的猜想,後由人類證明。

2022年,利用AI分析橢圓曲線(數論中重要數學對象)大量資料的研究者,注意到某些關鍵性質變化呈現非隨機、類似歐洲椋鳥群聚行為的波浪狀帶狀模式。發掘此類模式或將在多數數學領域帶來變革。

下一步可能是將AI增強的猜想生成與議題設定連結。AI系統可先繪製現有數學知識體系,識別瓶頸、空白與意外平行,然後生成橋接這些缺口的猜想。

解決與驗證結果。2025年,DeepMind發布AlphaEvolve,一種能提出、測試並改進演算法解決方案的編碼代理。專家隨後在67個挑戰中測試它,大多數情況下重新發現已知最佳解,且數次改進之。

AlphaEvolve結合Google AI模型Gemini的生成推理與自動評估候選解的系統,採用「進化搜尋」策略反覆優化最有前景方案。它已展示推進數學知識的能力,例如發現改良的矩陣乘法演算法,該演算法廣泛應用於物理、資料科學與計算機科學。2025年5月,OpenAI宣布利用大型語言模型駁斥了1946年埃爾德什提出的單位距離問題,這或許是機器產生的首個重大數學成果。這些成功值得關注,雖整體技術仍有限,卻顯示進展速度加快。

利用AI檢查或驗證證明是較成熟的應用。證明助理已能逐行檢查複雜論證,其日益豐富的資料庫為AI輔助推理提供結構化基礎。複雜定理的形式驗證顯示這些工具正接近研究前沿的常規使用。

未來進展可能來自專門代理的生態系統——生成者、反駁者、調查者、教育者——彼此互動產生可靠知識。未來AI工具或將更進一步,嘗試不同解題策略並判斷哪些策略能更快、更清晰地完成證明。

現今AI系統能建議證明步驟、發掘隱藏模式及解決競賽級問題,協助數學家完成五年前難以想像的任務。然而,數學與物理的深刻突破常需根本新概念或範式,尚無AI系統能自行創造。當前決定性創新仍由人類完成。真正的希望在於合作。

AI能搜尋龐大空間並揭示意外規律;人類則帶來判斷力、品味及創新思維能力。這種合作已產生新成果。理論非解決問題的組裝線,而是人類理解不斷擴展的地圖。早期工具如計算器與電腦代數系統未曾削弱數學領域,反而提升它。AI亦能如此,延伸我們的認知範圍,如同望遠鏡曾擴展我們的視野。

未來系統必須解釋其洞見,指導進入新領域的研究者,並協助組織日益龐大的知識體系。當前任務是以謹慎與雄心打造這些系統。若它們能使前沿更易導航且更深度互聯,將加速發現,而非取代發現者。

人工智慧如何重塑數學與物理的發現過程人工智慧如何重塑數學與物理的發現過程人工智慧如何重塑數學與物理的發現過程人工智慧如何重塑數學與物理的發現過程人工智慧如何重塑數學與物理的發現過程人工智慧如何重塑數學與物理的發現過程