作者 | Ben Dickson
譯者 | Sambodhi
策劃 | 凌敏
DeepMind 研究人員最近發(fā)表了一篇題為《通過用人工智能引導人類直覺來推進數學》(Advancing mathematics by guiding human intuition with AI)的論文,認為深度學習能夠幫助發(fā)現被人類科學家忽視的數學關系。很快,這篇論文在科技媒體上引起了廣泛的關注。
一些數學家和計算機科學家對 DeepMind 的工作及其論文中所取得的成果表示贊賞,稱其具有突破性。其他人則對此持懷疑態(tài)度,認為這篇論文和它在大眾媒體上的報導,可能夸大了深度學習在數學中的應用。
一種基于機器學習的數學發(fā)現框架
DeepMind 的科學家在他們的論文中提出,人工智能可以用來“協(xié)助在數學研究中發(fā)現最前沿的定理和猜想”。他們提出了一種“通過機器學習的強大模式識別和解釋方法來增強標準數學家的工具包”的框架。
在數學發(fā)現中使用機器學習的框架(由 DeepMind 提供)
數學家們首先對兩個數學對象之間的關系做出假設。為了驗證這一假設,他們使用計算機程序為這兩種類型的對象生成數據。接下來,一種監(jiān)督式機器學習模型算法對這些數字進行計算,并嘗試調整其參數,將一種類型的對象映射到另一種類型的對象。
研究人員寫道:“在這個回歸過程中,機器學習最重要的貢獻在于,只要有足夠的數據,就可以學習到一系列可能的非線性函數?!?/p>
如果訓練過的模型比隨機猜測的表現更好,那么它可能表明這兩個數學對象之間確實存在著可發(fā)現的關系。通過使用不同的機器學習技術,研究人員能夠發(fā)現與問題更相關的數據點,改進他們的假設,生成新的數據,并訓練新的模型。通過重復這些步驟,他們可以縮小合理猜想的范圍,并加速得到最終解決方案。
DeepMind 的科學家將該框架描述為“直覺的試驗臺”,它可以快速驗證“關于兩個量之間關系的直覺是否值得追求”,并為它們可能存在的關系提供指引。
利用這個框架,DeepMind 的研究人員通過使用深度學習得出了“兩項基本的新發(fā)現,一項是拓撲學,另一項是表示論?!?/p>
這項工作的一個有趣之處在于,無需龐大的算力,而算力已經成為 DeepMind 研究的支柱。根據該論文,在這兩項發(fā)現中使用的深度學習模型可以在“一臺只有一個圖形處理單元的機器上”在幾個小時內進行訓練。
紐結與表示
紐結是空間中的一條閉合曲線,可以用各種方式定義。隨著其交叉點數量的增加,它們將會變得更復雜。研究人員想看看他們是否可以利用機器學習來發(fā)現代數不變量和雙曲不變量之間的映射,這是定義紐結的兩種根本不同的方式。
研究人員寫道:“我們假設,在一個紐結的雙曲不變量和代數不變量之間存在一種未被發(fā)現的關系?!?/p>
使用 SnapPy 軟件包,研究人員可以生成“簽名”、1 個代數不變量和 12 個有希望的雙曲不變量,可用于 170 萬個紐結,最多有 16 個交叉點。
接下來,他們創(chuàng)建了一個全連接的前饋神經網絡,這個網絡具有三個隱藏層,每個隱藏層有 300 個單元。他們訓練深度學習模型,將雙曲不變量的值映射到簽名上。他們的初始模型能夠以 78% 的準確率預測簽名。通過進一步的分析研究,他們在雙曲不變量中發(fā)現了一個較小的參數集,可以預測簽名。研究人員完善了他們的猜想,生成了新的數據,重新訓練了他們的模型,并得出了一個最終的定理。
研究人員將該定理描述為“連接紐結的代數和幾何不變量的首批結果之一,它有著很多有趣的應用?!?/p>
“我們預計,在低維拓撲學中,這種新發(fā)現的自然斜率和簽名之間的關系將會有許多其他應用?!毖芯咳藛T寫道:“如此簡單而又深刻的關系,在這個早已被廣泛研究的領域里卻被忽視了,真是太不可思議了。”
論文的第二個結果也是對稱性的兩種不同觀點的映射,它的復雜性遠遠超過了紐結。
在本例中,他們使用了一種圖神經網絡(graph neural network,GNN),以求 Bruhat 區(qū)間圖和 Kazhdan-Lusztig(KL)多項式之間的關系。圖神經網絡的一個好處就是能夠對龐大的、單憑頭腦難以處理的圖進行計算和學習。深度學習將區(qū)間圖作為輸入,嘗試預測相應的 KL 多項式。
同樣,通過生成數據,訓練深度學習模型,并重新調整過程,科學家們能夠得出一個可證明的猜想。
大眾對 DeepMind 數學人工智能的反應
談到 DeepMind 在紐結理論方面的發(fā)現,內布拉斯加大學林肯分校的紐結理論家 Mark Brittenham,在接受《自然》(Nature)采訪時說:“作者用一種很直接的方法,證實了不變量是相關的,這一事實告訴我們,在這一領域中,存在著許多我們尚未充分了解的、非?;镜氖挛??!盉rittenham 還說,DeepMind 的這項技術在發(fā)現驚人的聯系上,比起其他將機器學習應用于紐結的努力,它是很新穎的。
以色列特拉維夫大學的數學家 Adam Zsolt Wagner 也接受了《自然》雜志的采訪,他說,DeepMind 提出的方法可以證明對某些類型的問題有價值。
Wagner 有將機器學習應用于數學的經驗,他稱:“如果沒有這種工具,數學家可能就會花上好幾個星期甚至幾個月去證明某個公式或者定理,而這些公式和定理最后都會被證明是錯誤的?!钡惭a充說,目前還不清楚它的影響會有多廣泛。
持懷疑態(tài)度的理由
繼 DeepMind 的研究成果在《自然》雜志上發(fā)表后,紐約大學計算機科學教授 Ernest Davis 發(fā)表了一篇自己的論文,就 DeepMind 關于結果的框架以及深度學習在普通數學中的應用的局限性提出了一些重要問題。
關于 DeepMind 的論文中提出的第一個結果,Davis 觀察到,紐結理論并不是深度學習優(yōu)于其他機器學習或統(tǒng)計方法的典型問題。
Davis 寫道:“深度學習的優(yōu)勢在于像視覺或者文本這樣的情景,對于每一個實例(圖像或文本)來說,都有許多低級輸入特征,難以對高級特征進行可靠的識別,并且對于任何人來說,把輸入特征和答案關聯的函數都十分復雜,并且輸入特征中沒有一個小子集是完全決定性的?!?/p>
紐結問題只有 12 個輸入特征,其中只有三個是相關的。而輸入特征和目標變量之間的數學關系很簡單。
Davis 寫道:“很難理解為什么有 20 萬個參數的神經網絡會成為首選的方法;簡單、傳統(tǒng)的統(tǒng)計方法或支持向量機更適合?!?/p>
在第二個項目中,深度學習的作用更為重要?!芭c使用通用深度學習架構的紐結理論項目不同,神經網絡被精心設計,以滿足對這個問題更深層次的數學知識。此外,深度學習在預處理數據上比在原始數據上工作得更好,錯誤率大約是 1/40。”他寫道。
Davis 稱,一方面,這些研究結果與那些批評的觀點形成了鮮明的對比,即把領域知識納入深度學習中是非常困難的。他寫道:“另一方面,深度學習的愛好者經常稱贊深度學習是一種‘即插即用’的學習方法,它可以用原始數據來解決手頭的任何問題;這與這種贊譽相悖?!?/p>
在這些任務中,要成功應用深度學習,可能在很大程度上依賴于訓練數據的生成方式和數學結構的編碼方式。這說明該框架可能適用于一小類數學問題。
“尋找生成和編碼數據的最佳方式涉及理論、經驗、藝術和實驗的混合。這一切的重擔都落在了人類專家身上,”他寫道?!吧疃葘W習可以是一種強大的工具,但也不是萬能的?!?/p>
Davis 提醒道,在當前關于深度學習的炒作氛圍中,“存在著一種異常的動機,讓人們關注深度學習在這項研究中的作用,而不只是 DeepMind 的機器學習專家,甚至是數學家。”
Davis 總結說,就像在這篇文章中所提到的,深度學習最好被視為“實驗數學工具箱中的另一種分析工具,而非一種全新的數學方法?!?/p>
值得注意的是,原始論文的作者也指出了他們的框架的一些局限性,例如“它需要生成對象表示的大型數據集的能力,并且模式在可計算的示例中是可檢測的。此外,在某些領域,在這個范式中可能很難學習到感興趣的函數?!?/p>
深度學習與直覺
其中一個爭議主題是,該論文宣稱,深度學習是“引導直覺”。Davis 形容這一說法是“非常不準確的描述,即對數學家在使用這樣的深度學習時,得到了或者期望得到什么幫助?!?/p>
直覺是人類和人工智能的重要區(qū)別之一。這是一種比隨機猜測更好的決策能力,并且在大部分時間里,它可以引導你走上正確的方向。正如迄今為止人工智能的歷史所顯示的那樣,在海量數據中,并沒有預定義的規(guī)則和模式能夠捕捉到直覺。
“在數學的世界中,‘直覺’一詞意味著,一個概念或證明可以建立在人們對熟悉的領域(如數字、空間、時間或運動)根深蒂固的感覺上,或者以某種其他方式‘有意義’或‘似乎正確’,而不需要明確的計算或逐步推理?!盌avis 寫道。
Davis 認為,為了獲得對數學概念的直觀掌握,往往需要通過多個具體的例子來進行,但這并非統(tǒng)計學上的相關工作。換句話說,你不會通過運行數百萬個例子和觀察某些模式重復出現的百分比來獲得直覺。
這意味著,并不是深度學習模型讓科學家直觀地理解他們所定義的概念、所證明的定理以及所提出的猜想。
Davis 寫道:“深度學習所做的,是給他們提供一些建議,告訴他們問題的哪些特征看起來重要,哪些看起來不重要。這并不值得嗤之以鼻,但也不應該被夸大?!?/p>
作者介紹:
Ben Dickson,軟件工程師,也是 TechTalks 的創(chuàng)始人。撰寫有關技術、商業(yè)和政治的文章。
https://bdtechtalks.com/2021/12/13/deepminds-machine-learning-mathematics/
關鍵詞: DeepMind的AI 能指導人類的直覺嗎 deepmind 人工智能