2025年6月26日 星期四

最近不少人將AI與圖靈再度連結,出現不少文本,應是他冥生與逝世均在六月的關係。雖是科普,但我覺得一些觀念還是要釐清比較好。以下是10年前為科學月刊寫的三篇關於圖靈的最後一篇,那時這波AI熱潮還沒出現,Alpha Go (戰勝圍棋九段的程式) 還要等一年才出場,LLM只是個冷僻的學術縮寫,事實上我個人那時也沒有料到 AI 的大爆發。但計算的基礎原理沒有改變,十年後回頭看這篇文章,也許我現在會樂觀一些,但還不必改寫。如果你問我圖靈測試通過了沒,每問一次,我都會認真地重新思考一次,目前的答案是仍否定的:AI 還沒通過圖靈測試。注意,測試者必須是當代人,不是1950年的人。

********* 11/19/2015 -- 李中志

圖靈的科學地位 — 從破解恩尼格碼,電腦之父,到人工智慧 (三)

圖靈在替英國政府設計ACE成功之後,開始積極宣揚電腦的用途,認為它將改變人類文明的生活與思考方式。當初許多人認為圖靈言過其實,但至今已無人能否定這個看法。電影《模仿遊戲》裡出現一幅圖靈母親的畫作,畫裡小艾倫不顧玩伴的曲棍球比賽,低頭仔細觀察一朵小雛菊,彷彿預告了圖靈日後對數學規律與自然界充滿神秘關係的好奇。基於此好奇與對計算的敏感,圖靈相信看似複雜的自然界現象,如雛菊的花瓣、向日葵子的排列、生物細胞的分裂生長等等,可能由某些簡單的數學公式來描述。這些觀察比當代學者早了十年至二十年,也是日後渾沌理論、碎形理論、生物數學的發展基礎。

這個深信複雜現象必可由簡單的原理掌握的信仰,繼續把圖靈推到對人類心智活動的懷疑論。圖靈拒絕宗教的解釋,不相信人類的思考有獨特的神聖性,他認為或許能透過純機械式的原理來模擬智慧。電影《模仿遊戲》裡反覆詢問「機器會思考嗎?」正反映圖靈晚年力倡人工智慧的努力,但這不是圖靈要認真回答的問題。我們必須把焦點指向圖靈最具爭議的一篇論文:《計算機器與智慧》(Computing Machinery and Intelligence,以下簡記為CMI)。推崇者認為CMI是人工智慧研究的濫觴,反對者則認為是對人工智慧的嚴重誤導,但真正讀過原文的人似乎不多。本文只以CMI一文為主軸,介紹圖靈在該文裡對人工智慧的看法與面對的批評,但人工智慧本身是電腦科學一個龐大的研究主題,不是本文的重點。

CMI發表於1950年《心智》期刊(Mind 49:433-460),但「人工智慧」(Artificial Intelligence)這個詞要等到1955年,由當時在麻省理工學院的麥卡錫(John McCarthy)提出才廣為使用。麥卡錫為電腦科學與人工智慧的先驅者之一,1971年圖靈獎得主。《心智》是本哲學期刊,是圖靈少有的非技術性論文,也是圖靈生前最後一篇具有決定性影響力的論文。正由於CMI不算是技術性文章,閱讀的門檻不高,圖靈的行文用字相當風趣,卻也因此造成閱讀者各取所需,甚至擴大解釋,根據自己的立場以訛傳訛。二手傳播的結果,讓許多讀者對圖靈的理解有點面目全非。

持平而言,CMI引起的爭議問題不在圖靈的想法,而是後人對CMI的誤讀。CMI除了在文末提及當時可能無法想像的機器學習外,並沒有替人工智慧提出任何具體的研究方向,實在談不上誤導。對現代的人工智慧學者而言,他們的學術研究幾乎可以完全忽略CMI,許多新科的博士生甚至不知道CMI的存在。這並不意外,除了圖靈本身並不把CMI當成嚴肅的學術論文外,CMI寫作的年代大部分的電腦理論並不存在,演算法、計算問題的型態、程式技巧、效率分析,都還未成形,圖靈自然無法預測如何運用這些後來發展出來的知識。但把CMI視為人工智慧研究的濫觴並不為過,因為圖靈不只替人工智慧的成功與否設下一個可清楚判斷的門檻,也在電腦問世之後,以CMI成功引起大眾與學界對人工智慧的高度興趣。

圖靈測試

一般大眾對CMI最大的誤解就是「圖靈測試」,不管是測試的形式,還是測試結果所代表的意義,一些廣為流傳的描述和圖靈的想法都有很大的出入。一個普遍但不正確的「圖靈測試」如下:

利用電腦程式模擬與人對話,透過電傳文字(如用簡訊,用意在排除物理上明顯與真人的差異,如外觀、聲調、觸感等)與測試者交談。如果測試者無法辨別交談的對象是電腦還是真人,那代表這電腦能夠思考,人工智慧已經成功。

這個改造過的測試很難斷定比原來的設計更難或更簡單,但「圖靈測試」的原始用意不是為電腦能否思考設下門檻,好像越過了門檻就代表電腦能思考。相反的,圖靈認為「機器(電腦)能否思考?」是個哲學問題,取決於社會對思考與機器的認知,似乎由蓋洛普民調來回答更適合,但沒有科學研究上的意義。為了取代「機器能否思考」這個問題,圖靈設計了一個「模仿遊戲」,更精確地說,一個模擬女人思考對話的遊戲。

圖靈從未使用「圖靈測試」這個詞,也從未清楚說通過這個測試代表什麼。這個「模仿遊戲」如下:

A為一名男士,B為一名女士,C為性別不拘的測試者。A、B與C隔開,C可透過電傳文字與其他兩人(標識為X、Y)交談或提問,但不知何者為A(男)何者為B(女)。A、B的目標是說服C自己是女性,C則要判斷X、Y何者為女性。

A和B是否隔開圖靈沒有特別要求,但兩人處於競爭狀態,沒有合作欺騙C的必要。在這個遊戲裡,C要努力提出關鍵的詰問,經由X、Y的答案來判斷他們的性別;A要努力模仿女士的心態回答問題,讓C誤以為他是女性;B最好的策略則是誠實回答。圖靈接著問,如果把A換成電腦,這個遊戲的結果將會如何?如果這個電腦有充分的計算能力與細心編寫的程式,C被誤導的機會是否能到達由真的男士來模擬?

圖靈在CMI某處不經意地將B換成男士,從電腦與女士之間的競爭,變成電腦與男士之間模仿女士的競爭。性別在模仿遊戲裡引發不少有趣的說法,例如,圖靈可能認為女性細膩的思緒感性多於理性,複雜的問答所展示的人性才是人工智慧的終極挑戰;但也可能相反,認為只有女性的智慧才可能由機器模仿。不過這些說法打趣的性質居多,不是認真的。固然測試者與模擬者的性別對測驗結果可能有不可忽視的影響,有學者對此嚴肅以待,但一般認為圖靈指定的性別並無特別的意義。圖靈真正的意圖是把電腦放在A的位置,由它來模擬人類與真人B競爭,讓C無法辨別真人與電腦。這是學術討論最通用的模型。

圖靈認為在二十世紀結束前,電腦能讓70%的測試者無法在五分鐘內透過交談來正確區別真人與電腦。這點圖靈的確太過樂觀了,至目前為止,甚至可預見的未來,電腦幾乎一點機會也沒有。戰後電腦的軟硬體一日千里,但自1966年ELIZA 完成以來,電腦模擬人類對話幾乎停滯不前。多年來電腦科學在分析自然語言方面的研究成果相當豐富,但一旦應用到模擬對話,電腦對話呈現的品質與科技的成就有完全不對稱的落差。讀者可試試網路上許多Chatbot(chatter robot,交談機器人),必能立刻發現電腦非人性的反應很難掩飾。許多電影裡能交談的機器人,如《雲端情人》(Her, 2013)、《機器姬》(Ex Machina, 2015)等,雖然不試圖掩飾其機器人的身分,但對話內容的複雜度與模擬的情緒反應,仍只能當成是純粹的科幻電影。尤其《機器姬》似乎已展現了存在的意識,電影雖以接受圖靈測試為故事的起點,但劇情的發展與圖靈測試幾乎無關。

圖靈發表CMI後人生陷入低潮,不到四年就過世,六十多年來在圖靈的缺席下爭議不斷。圖靈花了幾乎一半的篇幅在CMI裡列出九大常見的批評,並加以反駁,論述相當簡潔直觀,但談不上有學術論述的嚴謹。臚列如下。

1. 來自神學的批評,認為人類的智慧是獨一無二,神創的。圖靈是無神論者,但他以神學之間彼此的矛盾與過去在科學上的錯誤來反駁。

2. 我們寧可相信機器不能思考,因為如果機器能思考,那後果將很可怕。圖靈認為這是鴕鳥心態,不如面對處理。其實機器不必能思考,也可能很可怕。

3. 數學與機械論先天的不完備性,這點圖靈是當代極少數能徹底了解的學者,但圖靈認為沒有任何證據可以讓我們宣稱人類的智慧是完備的,人類的智慧很有可能也被不完備定律限制。

4. 電腦與機器無論如何不可能產生意識,而自我意識是智慧不可或缺的要素。圖靈以哲學上的唯我主義(solipsism)反駁,既然自我意識的存在唯有自己才能驗證,我們也無法斷定電腦是否有意識。

5. 電腦缺乏人性,如友善、正直、戀愛、喜歡吃草莓、犯錯,等等非理性的行為。圖靈認為「模仿遊戲」沒要求電腦必須真的具有人性,但如果有足夠的記憶體與計算能力,這些是可以在表面上模仿的。

6. 機器的行為沒有意外,也沒有驚喜的創新,一切都是規劃好的。這個批評源自愛達·勒芙蕾絲(Ada Lovelace)對巴貝其(Babbage)計算機的評語。圖靈機理論的計算能力與更早一百年的巴貝其機不可同日而語,但受決定論的限制不變。圖靈半開玩笑地說,因各種原因,電腦跑出的東西常常讓他充滿了驚喜,但史上第一個程式設計師愛達的質疑顯然不是這麼浮面。圖靈還很弔詭的把驚喜的責任歸給人類,就像玩電腦遊戲,一切都是設計好的,但玩遊戲的人充滿了驚喜。

7. 人的神經系統是連續的,不是數位的,但圖靈認為只要能設定我們能忍受的誤差範圍,我們就有辦法在這誤差範圍內模擬連續的神經。

8. 人的行為很難只照一套預定的行為準則進行,電腦則無可避免必須依照一套有限的準則反應,但圖靈同樣認為這只是對人類行為的一項假說,說不定就如「太陽下沒有新鮮事」,人的行為也是完全由一組準則規範。即便人的行為無法以決定論來規範,電腦透過與人互動,非決定論的因子已實質影響電腦的表現。

9. 第九個反對理由是有些人具有超能力如心電感應、念力等,圖靈建議如果這些能力確實影響了測試的結果,只好讓測試在能隔絕超能力的房間內舉行。這節相當唐突,大部分學者認為圖靈只是一時興起抬槓的文字。

有趣的是,圖靈提出「模仿遊戲」的原始動機是想讓大家離開「機器會思考嗎」這個問題,但從他這些自我設定的批評與答覆來看,他其實一直在維護一個開放的空間,讓「機器會思考嗎」這個問題有個正面答案。若再進一步耙梳圖靈的深處信仰,圖靈其實沒有企圖要讓機器賦予意識或人性,相反的,他認為意識或所謂人性可能只是人類自我的幻想,人終究只是一部更複雜的機器。

六十多年來大眾對「人只是一部機器」的信仰有增無減,當代對「強人工智慧(strong AI)」的討論已不在可不可能,而是有無可能在圖靈機理論的限制下展現智慧?如果不可能,計算人類智慧所需要的一個更複雜的計算模型會是什麼?近年量子計算似乎提供了另一個出路,但除了相當局限的運用,量子計算目前的進展似乎仍脫不出圖靈機理論的限制。

上面提到的「強人工智慧」是指以電腦模擬人類的智慧行為,包括對話、認知、意識、情緒的反應等等,也就是圖靈測試企圖辨識的。相對的是「弱人工智慧(weak AI)」,只限定在特殊的用途,利用電腦快速計算與處理大量資料的能力,幫人類做出決策,也就是所謂的「專家系統」,例如幫助醫師診斷的系統、風險分析系統、導航系統,與近來快速進步的汽車自動駕駛,大數據處理,都是「弱人工智慧」的成果。

在1966年問世的ELIZA,算是自CMI發表之後人工智慧的一個階段性成果,然而ELIZA的成功卻帶來錯誤的期盼,之後數年一窩蜂的跟進,但成果了無新意。進入70年代之後,電腦的用途與極限逐漸被研究者掌握,人工智慧研究的主流逐漸轉為上述的「弱人工智慧」,至今不變。CMI的重要性因此逐漸下降,甚至開始出現批判,認為圖靈測試誤導了人工智慧的發展。

批判的聲浪在90年代達到巔峰,認為圖靈測試裡「強人工智慧」的概念讓研究者浪費許多無謂的精力,只是為了通過一個無實際用途的圖靈測試。但這樣的批評者多半不是人工智慧的研究者,有點無的放矢。幾乎所有努力要用電腦模仿真人對話的程式設計師都是業餘的愛好者,學界根本不可能以此為計畫案拿到國家或產業界的輔助。既然如此,何來浪費資源與誤導?正如加州柏克萊大學的史陶特‧羅素(Stuart Russell)所言,沒有任何人工智慧學者是以通過圖靈測試為研究目標。史陶特本身是人工智慧領域裡頂尖的學者,不就前才與物理學家霍金共同簽屬一份公開信,反對具有人工智慧的武器研發。

有趣的是,進入21世紀後,人們又逐漸心平氣和來看圖靈測試。一方面是人工智慧的研究方法與方向已相當成熟,受CMI影響的程度甚微,與電腦剛問世時不同。就如筆者本人,雖不是人工智慧的研究者,但在研究生時期第一次讀到圖靈測試仍然興奮莫名,但很快地,經由師長的指導與自身知識的累積,很快便意識到CMI與圖靈測試並沒有給研究人工智慧一個科學上有意義的操作型定義,圖靈測試只是電腦專業以外值得思考的哲學問題。另一方面則是,隨著認知科學的進展,關於心智的哲學逐漸與實證科學結合,有回到古典理性主義的趨勢,認為語言與符號的處理在思考中有獨占的地位,重新把閱讀與詮釋CMI的興趣帶回哲學與認知科學的學術會議上。更重要,這個趨勢糾正了一個態度:我們不需要知道人類智慧運作的原理,我們還是可以盲目製造幾可亂真的人工智慧。而這個態度正是50、60年代,人們急於運用電腦卻誤入死巷的原因。

雖然毫無疑問,好萊塢必將繼續以圖靈測試生產更多好看的電影,但這畢竟不是研究人工智慧的實況與願景。總結CMI發表後人工智慧這六十多年的歷史,我們的確遠離了圖靈的構想。儘管仍有不少對CMI持強烈批判態度,認為CMI從來就不應該存在,然而如果我們持平回頭去讀CMI,再把自己放在1950年,一個電腦剛問世的好奇時代,外行的大眾認為電腦比愛因斯坦還聰明;內行的人看電腦只是一個指令一個動作的愚笨機器。圖靈的CMI拉近了幻想與現實的距離,它仍像一座明亮的燈塔,雖然不是船隻駛往的方向,但初出迷霧的船隻靠它定出自己的座標、自己的方向。從手機到網購,從氣象到醫學,人工智慧無所不在。謝謝你,艾倫‧圖靈。

(作者為美國伊利諾州立大學電腦科學教授)

参考資料

• Alan Turing. Computing machinery and intelligence. Mind, 59, 433-460, 1950

• Ayse Pinar Saygin, Ilyas Cicekli & Varoi Akman. Turing Test: 50 Years Later. Minds and Machines 10: 463–518, 2000.

• The Turing Test, The elusive standard of Artificial Intelligence. Kluwer Academic Publishers, 2003. James H. Moor edited.

沒有留言: