圖靈測試 - 思想實驗

1950 年，數學家與密碼破譯專家 Alan Turing 提出了一個將定義人工智慧領域的問題：「機器能思考嗎？」

但 Turing 沒有直接處理這個充滿哲學爭議的問題，而是建議用一個更具操作性的東西來取代它——一個測試。

模仿遊戲

想像一位人類詢問者透過文字與兩個隱藏的參與者交流：一個人類和一台機器。詢問者提問，試圖判斷哪個是哪個。兩位參與者都試圖說服詢問者自己是人類。

Turing 認為，如果機器能像人類一樣頻繁地騙過詢問者，我們就應該認為它有思考能力。這個測試不問機器是什麼——只問它能做什麼。

批評者立刻指出 Turing 自己也承認的一點：測試並沒有真正回答機器是否在思考。它回答的是機器能否模仿思考。

但 Turing 認為這是特點，不是缺陷。我們接受其他人類有意識，是基於他們的行為——我們無法直接接觸他們的內在經驗。為什麼要對機器要求比我們對彼此更多的東西？

這個務實的舉措開啟了數十年的 AI 研究，但也埋下了關於行為與理解之間關係的更深層哲學辯論的種子。

Turing 在原始論文中預見了許多反對意見：

大型語言模型讓 Turing 的問題再次變得緊迫。現代 AI 系統能進行許多人難以分辨是否來自人類的對話。我們通過測試了嗎？

還不完全——而且其中的微妙之處揭示了測試本身的局限：

更根本的是，通過圖靈測試可能不代表 Turing 所希望的那樣。令人信服的思考模仿可能根本不是思考——這個擔憂在三十年後被 John Searle 用他的中文房間論證具體化了。