看板 ask-why 關於我們 聯絡資訊
※ 引述《dharma (達)》之銘言: : 圖靈原來寫的那篇文章說:如果一個人(測試者)和看不見的另外一個人以及計算機對話 : ,持續5分鐘,人不被計算機矇騙的機會不超過70%,也就是說,計算機能夠騙人的概率不 : 低於30%,則可以認為計算機是能思維的。這種測試被後人稱為圖靈測試。 Turing test的假設, 機械有30%機率被誤認為是人類, 即可認為該機械具有思維 這假設是否合理都是個疑問 30%怎麼來的? 為什麼不是50%? 我不會算 但估計是考慮到真人也會被誤判為機械的情況(類似統計的a, b error) 然而, 門檻的高低並不是這個假設裡存在的最大問題 而是通過測試則可認為機械具有思維 思維是什麼? Turing test是個文字對話測試 在這裡, 測試的結果表示的是 機械能夠對文字的意義做連結 意思是 能夠用相同語言的文字解釋文字, 其中還包括詞性、語言的用法等 這種能力是否代表思維? 而且由於是純文字, 文字的意義不會牽涉到真實的事物 我質疑Turing test這樣的假設的合理性 但我不否認Turing test有一定的指標性(機械"使用"文字的能力) 因為Turing test所測試的不是低層級的模仿 不是像dharma說的那樣 這不是測試copy & paste的能力 文句必須經過重新組織, 才可能做到欺騙人的地步(例如人類可以創造並理解新辭彙) 否則類似的話題, 只要多重複幾次, 就會出現破綻 不過時代確實進步了 當初Turing想出這個測試時, 或許沒有料到電腦可以模仿人類到如此地步 卻不涉及思維 : 圖靈原文中提到的“機會,是指從大量的測試樣本事例中得到的統計平均值,所以,絕 : 不可能只通過一次或者幾十次實驗,就說超過了圖靈測試中提到的概率。 : 這次英國人做的測試中,有30個裁判同時對計算機進行測試。對於統計出一個事件的概率 : 來說,30個事例還是遠遠不夠的。一般來講,當有趨近於無窮多個事件的時候,才會出現 : 一個可靠的概率值。除了評委數量很有限以外,他們所能提的問題也是很有限的。 這只是個統計問題 統計裡不存在 100% 確定的事 因為你無法做無限多次實驗, 連趨近都不可能 所以退而求其次, CI 99.95% 99.5% 、95%、90% 多少才算滿意? 看應用的領域, 主要就是看你能承受多少%的失誤判斷 30個人測試的結果估計是CI 95% -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.9.101.53 ※ 文章網址: http://www.ptt.cc/bbs/ask-why/M.1405935357.A.1BC.html
xiaoa:btw, 我認為目前最先進的是Honda的Asimov的外插主機 :P 07/21 17:52
dharma:好奇現在的統計檢定,在圖靈那個年代已經有了嘛? 07/22 14:47
dharma:知道統計檢定的大師是誰?我來查查他的年代 07/22 14:48
xiaoa:聽統計學老師講, 統計學和微積分一樣, 份量和年歲 07/22 21:45
ghjkl1478:統計檢定至少在200年前高斯時代就有學生t test了 07/23 00:12
dharma:以圖靈這種當代的超級數理天才 07/23 12:40
dharma:應該是研究過統計檢定,所以他當時設的門檻八成精心考慮過 07/23 12:42