Re: [請益] 目前最像人類表現的電腦領域

作者xiaoa (不事生產)

看板ask-why

標題Re: [請益] 目前最像人類表現的電腦領域

時間Mon Jul 21 17:35:53 2014

※ 引述《dharma (達)》之銘言： : 圖靈原來寫的那篇文章說：如果一個人（測試者）和看不見的另外一個人以及計算機對話 : ，持續5分鐘，人不被計算機矇騙的機會不超過70%，也就是說，計算機能夠騙人的概率不 : 低於30%，則可以認為計算機是能思維的。這種測試被後人稱為圖靈測試。 Turing test的假設, 機械有30%機率被誤認為是人類, 即可認為該機械具有思維這假設是否合理都是個疑問 30%怎麼來的? 為什麼不是50%? 我不會算但估計是考慮到真人也會被誤判為機械的情況(類似統計的a, b error) 然而, 門檻的高低並不是這個假設裡存在的最大問題而是通過測試則可認為機械具有思維思維是什麼? Turing test是個文字對話測試在這裡, 測試的結果表示的是機械能夠對文字的意義做連結意思是能夠用相同語言的文字解釋文字, 其中還包括詞性、語言的用法等這種能力是否代表思維? 而且由於是純文字, 文字的意義不會牽涉到真實的事物我質疑Turing test這樣的假設的合理性但我不否認Turing test有一定的指標性(機械"使用"文字的能力) 因為Turing test所測試的不是低層級的模仿不是像dharma說的那樣這不是測試copy & paste的能力文句必須經過重新組織, 才可能做到欺騙人的地步(例如人類可以創造並理解新辭彙) 否則類似的話題, 只要多重複幾次, 就會出現破綻不過時代確實進步了當初Turing想出這個測試時, 或許沒有料到電腦可以模仿人類到如此地步卻不涉及思維 : 圖靈原文中提到的“機會，是指從大量的測試樣本事例中得到的統計平均值，所以，絕 : 不可能只通過一次或者幾十次實驗，就說超過了圖靈測試中提到的概率。 : 這次英國人做的測試中，有30個裁判同時對計算機進行測試。對於統計出一個事件的概率 : 來說，30個事例還是遠遠不夠的。一般來講，當有趨近於無窮多個事件的時候，才會出現 : 一個可靠的概率值。除了評委數量很有限以外，他們所能提的問題也是很有限的。這只是個統計問題統計裡不存在 100% 確定的事因為你無法做無限多次實驗, 連趨近都不可能所以退而求其次, CI 99.95% 99.5% 、95%、90% 多少才算滿意? 看應用的領域, 主要就是看你能承受多少%的失誤判斷 30個人測試的結果估計是CI 95% -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.9.101.53 ※ 文章網址: http://www.ptt.cc/bbs/ask-why/M.1405935357.A.1BC.html

→ xiaoa:btw, 我認為目前最先進的是Honda的Asimov的外插主機 :P 07/21 17:52

推 dharma:好奇現在的統計檢定，在圖靈那個年代已經有了嘛？ 07/22 14:47

→ dharma:知道統計檢定的大師是誰？我來查查他的年代 07/22 14:48

→ xiaoa:聽統計學老師講, 統計學和微積分一樣, 份量和年歲 07/22 21:45

→ ghjkl1478:統計檢定至少在200年前高斯時代就有學生t test了 07/23 00:12

推 dharma:以圖靈這種當代的超級數理天才 07/23 12:40

→ dharma:應該是研究過統計檢定，所以他當時設的門檻八成精心考慮過 07/23 12:42