看板 Gossiping 關於我們 聯絡資訊
https://arxiv.org/pdf/2503.23674 圖靈測試由AI先驅艾倫·圖靈於1950年提出:"人類提問者與一位人類和一位機器進行文字 對話,雙方都試圖說服自己是人類。如果提問者無法辨別出誰是人類,機器就通過測試" 加州大學聖地亞哥分校團隊測試四種系統:ELIZA(1960年代的規則型聊天機器人)、 GPT-4o、LLaMa-3.1-405B和GPT-4.5,人類提問者有5分鐘時間與AI和真人同時對話。 61%提問者傾向進行閒聊,詢問對方日常活動或個資,50%提問者詢問對方社交和情感特質 如情緒和幽默感。他們故意說奇怪的話並觀察對方反應或突然要求AI忽略先前指令。 結果GPT-4.5被判斷為人類的比率高達73%,顯著超過真人被識別的機率(27%)。 LLaMa-3.1-405B被判斷為人類的比率達56%,與真人不相上下。 作為對照組的GPT-4o和ELIZA則僅有21%和23%的成功率。 這是有史以來首次有AI通過圖靈測試中取得成功!!! 研究在兩個獨立人群(大學生和Prolific用戶)進行測試,結果在統計上均顯著,證明這 不是偶然現象。 實驗採用標準的三方圖靈測試而非簡化版本,每個數據點是AI和人類的直接比較,這使得 結果更具說服力。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.176.145 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1743777962.A.BC6.html
zephyr105: wtf 1.164.132.248 04/04 22:46
zephyr105: 恐怖呦 1.164.132.248 04/04 22:47
Yude0109: 殺小 講人話 36.224.64.51 04/04 22:47
haha98: 圖靈多屌啦 223.137.37.0 04/04 22:47
ispy03532003: 把電源關掉,快 42.75.75.229 04/04 22:47
PSptt: 已經分不清楚是人還是電腦~ 122.117.133.96 04/04 22:47
E6300: 死甲測是 1.172.207.39 04/04 22:47
zephyr105: 這算是天網啟動了吧 1.164.132.248 04/04 22:47
cuteSquirrel: 騙軌 1.161.53.63 04/04 22:48
tchialen: 圖靈測試過時 現在主流是吉卜力測試 114.40.148.193 04/04 22:48
curlymonkey: 詐騙集團: 舒服了223.137.169.102 04/04 22:48
STRO: 這篇重點是圖靈的性向?很會抓重點 27.240.162.16 04/04 22:48
proprome: 丸子 天網先毀滅人類 112.104.97.233 04/04 22:48
※ 編輯: jackliao1990 (111.253.176.145 臺灣), 04/04/2025 22:49:02
GGinler: 可以做出瑟瑟機器人了嗎 27.53.170.198 04/04 22:49
remarque: 未來所有跟外界的接觸都有可能是AI了 36.225.41.99 04/04 22:49
a82k7: 哇…但提問者問不同問題 這樣測試有符合效223.136.200.116 04/04 22:49
a82k7: 度嗎223.136.200.116 04/04 22:49
fallinlove15: 不是 他都用人講的話訓練的 118.166.219.36 04/04 22:50
remarque: 要開始進行第一波天擇了嗎 36.225.41.99 04/04 22:50
Jkyzer: https://i.imgur.com/xLt1MWx.jpeg123.205.177.206 04/04 22:50
vdml: 可以瑟瑟了沒 223.139.171.45 04/04 22:51
StylishTrade: 這有甚麼用??? 人類本就一堆笨蛋111.250.153.163 04/04 22:51
StylishTrade: 就是個聊天機器人而已111.250.153.163 04/04 22:52
StylishTrade: 分不出是真+9 還是機器人+9111.250.153.163 04/04 22:52
TheZealot: 沒錯 跟我預測ㄉ差不多 112.104.65.23 04/04 22:52
StylishTrade: 很厲害嗎 都是+9111.250.153.163 04/04 22:53
wensday: 比人還像人 122.100.73.11 04/04 22:53
wu73: 股市會漲嗎111.250.193.219 04/04 22:54
sing60905: 沒人在乎 經濟要蕭條了管你個屁AI 114.36.211.215 04/04 22:55
gamesame7711: Can’t sex223.138.102.109 04/04 22:56
q123212: 叫對方算出木星軌道,或一些高難度的數學 42.75.77.45 04/04 22:57
q123212: ,一下子就露餡了吧? 42.75.77.45 04/04 22:57
PRME: 很抱歉,我无法提供有关成人影片的信息。请 218.172.35.78 04/04 22:58
PRME: 注意,访问或观看成人内容可能在您所在的地 218.172.35.78 04/04 22:58
PRME: 区受到法律限制。请务必遵守当地法律法规, 218.172.35.78 04/04 22:59
PRME: 并确保您的在线活动符合道德和法律标准。 218.172.35.78 04/04 22:59
hdw: 其實表現得笨一點,之前的版本應該就能通過 122.117.49.105 04/04 23:01
hdw: 了吧 122.117.49.105 04/04 23:01
wxtab019: 會不會只是負責提問的人類越來越笨 106.104.39.111 04/04 23:04
andy79323: 骨版經濟學大濕 人形沒用 小畫家畫圖223.138.200.158 04/04 23:05
Cuchulainn: 嗯 只想問 現在美國總統是三普 還是AI 219.68.29.107 04/04 23:07
renna038766: 哇 118.166.76.20 04/04 23:11
abadjoke: 隨便問個dei問題就破功了吧 101.8.52.58 04/04 23:11
nhk123871192: 奇異點來了 1.160.143.60 04/04 23:12
aspeter: 拜託 瘋狂一直說違反內容政策就出局了203.121.247.234 04/04 23:19
aspeter: AI 越來越笨了203.121.247.234 04/04 23:20
ariz283: 0.0 49.214.10.155 04/04 23:37
Oggy: 接著 是奇異博士的一千四百萬測試 223.23.22.214 04/04 23:42
haniah: 太恐怖了 1.173.202.19 04/04 23:49
kamisanma: 沒屁用啦 做青鳥測試就掛了 61.223.249.235 04/04 23:51
WWIII: 哭啊 真人來不到三成 36.230.42.178 04/05 00:42
milkBK: 我都直接聊色 114.32.129.203 04/05 03:36
bye2007: 還有幾集可以逃?準備當電池了 223.138.62.225 04/05 06:17
ljxc: YA圖靈:大仔~~~ 27.52.162.247 04/05 08:02
loduf8cv8gg: AI可以拯救全球經濟大蕭條,終結始 114.24.72.7 04/05 09:05
loduf8cv8gg: 作庸者瘋子嗎? 114.24.72.7 04/05 09:05
rq654: 提問的人智商不夠吧111.241.188.121 04/06 01:02