量子理論家理查德·費曼(Richard Feynman)於 1988 年死於癌症。他在黑板上寫下的最後一句話似乎是這樣的:
「我無法創造的東西,我也無法理解。」
在二十一世紀,我們正面臨著與之相反的問題。如果我們能夠創造智能,這是否意味著我們已經理解了智能?
現代人工智能可以用「非凡」一詞來形容。計算機科學家用代碼和電路構建出運行良好的智能。它可以像人類一樣通過自然語言互動溝通,制定策略,用亞伯拉罕·林肯的風格重寫你的電子郵件。人工智能改變了我們與自然世界的關係。我一直認爲作爲物種而言,人類比海豚,黑猩猩更聰明。我們曾經高踞智力頂峯,俯視眾生。然而,很快我們將介於計算機和海豚之間,不再獨佔鰲頭。我們比海豚聰明,但比手機愚笨。正如無神論哲學家尼克·博斯特羅姆(Nick Bostrom)所說:
我們遠非最聰明的生物物種,恰恰相反,我們可能是最愚蠢的生物物種,人類獨有的專利是能夠開發技術,而現在我們開發的技術將會取代我們。[1]
這話說的真傷人。
現代神經網絡不僅在輸出方面相似,而且在結構上也模仿我們。DeepMind(現由谷歌所有和運營)的聯合創始人穆斯塔法·蘇萊曼(Mustafa Suleyman)說,他的目標是:
創建一個能夠模仿並最終超越人類所有認知能力的系統,從視覺和語言到規劃和想像力,最終目標是能夠共情,能夠創造。[2]
又是一記痛擊。DeepMind 的另一位聯合創始人德米斯·哈薩比斯(Demis Hassabis)讀的博士學位不是計算機科學,而是神經科學。他研究人腦記憶的形成,試圖弄清人們是如何描繪生活中的事件,並將這些事件存儲起來以備日後使用的。哈薩比斯希望從人腦的模式中汲取靈感,製造出一台計算機。
在倫敦的一間小辦公室裡,DeepMind 開始構建各種神經網絡。這種網絡從大腦結構中汲取了大量靈感。由節點或神經元組成的巨大網絡來回傳遞信息,每層神經元執行不同的任務。舉例來說,如果這個神經網絡正在學習閱讀,那麼其中較低層次的神經元會去識別標點符號或單詞之間的空隙。較高一級的神經元會識別單詞,而更高級別的神經元則會理解句子和段落的含義。這些信息會反饋到更高一層,這一層將學會感知語氣、體裁、總體論點、世界觀假設等。一個大型的神經網絡可能有數十億個神經元和數十個層級,由一個極其複雜的網絡連接起來。[3]
但是,程序員怎麼可能有時間去組織和設計數十億或數萬億個小電路呢?現代神經網絡絕就絕在它們不需要這樣做。相反,電路會自行組裝。DeepMind 從一開始就在構建學習機器,將訓練數據輸入神經網絡。語言模型通過預測來學習,然後計算哪些神經元、哪些連接對應預測的成敗。想像一下,我們的語言模型語料庫擁有和國會圖書館一樣多的文本,而語言模型從這裡面逐個字母(確切地說,是逐個符號)地開展工作。它對每一個即將出現的字母進行預測,一次一個,然後調整神經元之間的連接,使猜測越來越準確。
神經網絡是一種通用技術,正越來越頻繁地出現在我們的生活中,而且這項技術的質量也越來越好。就像電力一樣,這種技術最終可能成爲幾乎所有技術的組成部分。未來的某個時候,你可能時時刻刻都需要這種技術的幫助。
有些人對這種模型的反應是:「它們並不智能,只是在預測一串文本中的下一個單詞(或符號)。」還有人說,「它們不智能,因爲只是在數據中尋找相關性。」這些回答聽起來都有道理,也都包含著事實。每個回答都包含了大語言模型如何工作的真實描述,不過,每個回答都微妙地增加了「只是」這個關鍵詞。這兩種回答都忽略了一個重要問題:數量本身就很重要。一百萬只螞蟻能做到的,一隻螞蟻無法做到。足球場上的墨西哥浪潮與一個人舉手示意截然不同。河是溼的,但單個水分子不可能是溼的。正如物理學家馬克斯·泰格馬克(Max Tegmark)所指出的,「只有當許多分子以我們稱之爲液體的模式排列時,才會出現溼潤現象。」[4]
美國諾貝爾物理學獎得主菲利普·安德森(Philip Anderson)有時會聽到物理學家說,其他科學研究領域沒有研究任何基礎性的東西。化學、生物學、地球科學、社會科學和醫學其實只是換湯不換藥的物理學。安德森在他的論文《多即不同》(More Is Differents)中駁斥了這種思維方式:
事實證明,大型複雜的基本粒子集合體的行爲,並不能通過簡單地推斷幾個粒子的特性來理解。相反,這些大型複雜的基本粒子集合體,其每個複雜層次上都會出現全新的特性。[5]
數量本身就會帶來質量區別。
要了解現代神經網絡的運行規模,請看穆斯塔法·蘇萊曼的這段話:
谷歌的PaLM[路徑語言模型]使用了極其多的[計算量]。打個比方,如果在訓練過程中每使用一次浮點運算就需要一滴水,谷歌模型的用量將會填滿整個太平洋。[6]
要知道,大型語言模型並不僅僅是記憶機器。它們不會把互聯網上的信息儲存起來,然後再複製粘貼給你。大語言模型沒有足夠的工作記憶來記憶互聯網。但它們能記住常見的聯繫。大型語言模型肯定會記住「法國首都」和「巴黎」之間的聯繫。它所做的主要工作是提取原則,通常是掩埋得很深的原則,使它能夠以壓縮的形式存儲大量知識。
以數學爲例。如果計算機正在學習加法,它可以開始記憶每對數字的總和。但最終,內存中可能出現的數字組合會非常多,以至於其他功能會被擠掉。更好的辦法是找到一些原理或一組原理,讓機器無需過多記憶就能推導出所有可能的和。這通常被稱爲「領悟」(grokking)。模型一旦掌握了更深層次的過程或原理,就會摸索出各種各樣的東西。當模型摸索到世界的某些真理時,其性能和準確性就會突然躍升,泛化能力也會提高,神經元結構也會發生變化,變得更簡單、更高效。
隨著時間的推移,越來越多的通用模型被訓練出來,它們能夠編寫計算機代碼、識別圖像、用匈牙利語交談,還能做數學作業。認識到這一點後,2023 年,一個微軟團隊認爲,
對這些新模型的能力和認知能力的評估,在本質上已更接近於對人類,而非狹義人工智能模型的能力和認知能力的評估。
經過這樣訓練的通用模型,已經領悟了人類語言及其所代表世界的數百萬個細微原則。這使它有能力完成一些意想不到的事情,比如寫出一個證明有無窮多個質數的證明,而且每一行句尾都押韻。理解這些模型需要自上而下的思維,更接近心理學而非物理學,這種思維需要對機器「大腦」的各個區域進行映射。就像我們使用核磁共振成像(fMRI)機器來觀察人腦的哪些部分在哪些活動中很活躍一樣,我們可以嘗試繪製出各種概念在人工大腦中的存儲方式和位置。
認知科學家侯世達(Douglas Hofstadter)曾在他的普利策獎獲獎著作《哥德爾、埃舍爾、巴赫》(Gödel, Escher, Bach)[7] 和《谷歌翻譯的淺薄》(The Shallowness of Google Translate)等文章中對神經網絡的智力程度持懷疑態度。令人驚訝的是,2023 年,他不僅改變了主意,而且承認自己改變了主意:
我的整個知識大廈、我的信仰體系......當你對世界最核心的一些信念開始崩潰時,這是一種非常痛苦的經歷。尤其當你認爲人類很快就會光芒不再......大家問我:「你說的『很快』是什麼意思?」......我不知道。但我裡面有一個聲音說是五年,有一個聲音說是二十年,還有的說「我不知道,我不知道。」
侯世達憑藉他對神經網絡力量的新認識得出結論:
這也讓我覺得,也許人類的大腦並不像我想像的那麼神祕、複雜、不可捉摸......因此,我覺得自己不再重要。在某種意義上,我覺得,與這些擁有比我多一百萬倍或十億倍的知識、速度比我快十億倍的計算系統相比,我就像個非常不完美、有缺陷的結構。
英國計算機科學家阿蘭·圖靈(Alan Turing)早在 1951 年就預測到了這一切:
如果機器會思考,它可能比我們更聰明,那我們該何去何從?即使我們能讓機器處於從屬地位......作爲一個物種,我們也應該感到無比謙卑。
現在是 2024 年,至少有些人感到非常謙卑。
這些功能強大的新技術給基督徒提出了巨大的問題。
首先,如果我們能夠創造智能,這是否意味著我們已經理解了智能?如果我們已經理解了智能,那麼我們是否已經理解了什麼是人、什麼是意識、什麼是生命?第二,如果我們能夠解釋智能的機制,那麼我們在多大程度上排除了一個相信上帝存在的理由?第三,如果人類是一種二流的智慧形式,那麼他們將在哪裡找到自己的身份?如果認知上我們最終是多餘的,那麼人類還有什麼意義、有什麼獨特之處、有什麼價值呢?
正如我在第一篇文章中所論述的,這些問題需要我們打開聖經去探索。基督徒需要思考這些問題,不只是爲了我們自己,因爲在我看來,世界會變得越來越陌生,我們許多人都會與非基督徒朋友、同學、同事討論這些問題。
本文改編自《按我們的形像製造:上帝、人工智能與你》(Made in Our Image: God, Artificial Intelligence and You)中的材料。
[1] N 博斯特龍(N Bostrom)著《超級智能:路線圖、危險性與應對策略》(Superintelligence: Paths, dangers, strategies),牛津大學出版社,2016 年,53頁。
[2] 蘇萊曼(Suleyman)和巴斯卡爾(Bhaskar),《即將到來的浪潮》(The Coming Wave),8頁。
[3] 神經網絡並不新鮮,也不是 DeepMind 發明的。DeepMind 或 OpenAI 等公司利用現代超級計算機的巨大威力,訓練出比幾十年前更龐大的神經網絡。
[4] 邁克斯·泰格馬克(M Tegmark),《生命 3.0:人工智能時代,人類的進化與重生》(Life 3.0:Being human in the age of Artificial Intelligence),企鵝圖書,2018 年,第 300 頁。
[5] PW.安德森(PW Anderson),「多即不同:破缺對稱性與科學分層結構的本質」(More Is Different:Broken symmetry and the nature of the hierarchical structure of science),《科學》,1972 年 8 月 4 日,177(4047):393。
[6] 蘇萊曼(Suleyman)和巴斯卡爾(Bhaskar),《即將到來的浪潮》(The Coming Wave),66 頁
[7] 侯世達(Douglas Hofstadter)《哥德爾、埃舍爾、巴赫:集異壁之大成》(Gödel,Escher,Bach:An eternal golden braid),20 週年紀念版,基本圖書出版社(Basic Books),2000 年,第 20 頁。
譯:變奏曲;校:JFX。原文刊載於福音聯盟澳大利亞英文網站:Made in Our Image: The Rise of Artificial Intelligence