看板 GO 關於我們 聯絡資訊
※ 引述《bbbtri (cycling)》之銘言: : ※ 引述《yamiyodare (shantotto)》之銘言: : : AI 的做法是先盡量下的跟高手一樣, 因為高手可能的下法幾乎包含了最佳解. : : AI 從這些候選走法往下找可以節省大量時間空間. : : 透過大量的高手對戰譜訓練出一個迅速模仿高手次一手的 policy network. : AI 可以轉瞬學會所有定石 等於是到地球作戰的外星部隊一次掌握地球的全部地形 : 所以有大局觀可以理解 : 可是, 我不太懂死活要怎麼解?因為死活很複雜啊, 隱藏著豬羊變色的規則和劫活 : 還是其實死活的題型和變化在AlphaGo看來存在上限? 碰到一個死活問題, 如果有高手每一步都提點可能的幾個位置, 自己擺一擺所有的變化, 最後總是能下活吧. : : value network 是型勢判斷, 給予一個特定盤面就能夠迅速回報勝率. : : AI 開出千萬分身自我對練高手的棋路到終局 (最後誰贏電腦可以判斷的夠準) : : 然後回溯盤面, 訓練出一個可以估計任何盤面勝率的 value network. : (不好意思, 插問一下回溯的英文是什麼> <) : 在序盤就要計算到勝率看起來完全不可思議啊!!! : 假設AlphaGo vs AlphaGo'(比本體稍弱)的勝率比是51:49好了 : 那這個比值「從第幾手開始」才會跳動呢? : 感覺上, 答案根本上決定在對局兩造的實力 AlphaGo 先自我對弈三千萬盤出來知道最後的勝負 (電腦有能力自動判斷) 然後把 "中途的盤面" 跟 "最後的勝負" 當成一對丟進類神經網路強化連結. 有點像給人看幾萬張男人 (輸) 跟幾萬張女人 (贏) 的照片. 之後看到沒看過的人, 人可以推論是女人 (贏) 的機率有多高. : : 可以把它想像成很多高手提供次一手的下法, 那就來下下看, 看誰說得對. : : 但要留意, AI 的目標是勝率最高 (反擊手最少), 不是目數最多, 不是棋型最美. : 不太懂value network為什麼是重在反擊手最少呢?可以再說明一下嗎? : 說到反擊, 我是覺得任何反擊都可預期, 只差在「有沒有效率」而已 : 而效率除了涉及手數,目數,還關係到手順, 這點跟收官有最佳順序一樣 : 唯前提是死活的問題要先解決, 因為即使是官子也會受打劫影響 : 你說的反擊手最少, 指的是....? 我的用詞不當, 反擊手指的是可逆轉勝負 (翻盤) 的手段 : 如果目前的AI計算能力已經強到甚至能改變定石、爭奪手順, 那....lol : (定石真的是沒有破綻的嗎?還是只是地球人的破綻?) 定石會進化, 現在的定石跟古定石就不一樣, 秀策遇到貼目也不會尖... 吧 : 宇宙流的相關定石應該很少 : 如果AI要發展宇宙流派, 那也不錯呀~~ : 但那樣的圍棋就不會是我們目前以為的圍棋了而是一盤只有AI能下的棋局 : 看新聞說, Google DeepMind 的目光放在破解人類學習的密碼 : 嗯, 這個是認知科學的腦神經領域啊! : 而用只有電腦可以使用的方式(例如暴力歸納)來破解人腦的學習, 是矛盾不是嗎? 人類也是暴力歸納啊, 就好像我說的男女識別問題. 你沒看過多少人之前判斷錯誤的機會是很高的. 只是電腦更暴力, 很專心又不會累, 可能可以學得比人類更好. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457773033.A.14A.html
BRANFORD: 這個時代 照樣尖的職業棋士很多啊 阿對不起該問阿法夠 03/12 16:59
bbbtri: 可是今天這盤就是劫活 而黑子劫材不夠 也就是死活不是一 03/12 18:02
bbbtri: 個封閉的題目 而是要放到盤面上 呼應盤面的情況來定死生 03/12 18:02
bbbtri: 男女適別對生物來說是天生的 不是習得的 所以不是歸納喔 03/12 18:05
bbbtri: 人如果要使用歸納法 是top-down的high level cognition 03/12 18:07
bbbtri: 但類神經元應該沒獨特性 沒有像神經元這樣專門性的演化 03/12 18:09
yamiyodare: AlphaGo 的 value network 看的就是整個盤面 解死活同 03/12 18:10
yamiyodare: 時照顧大局 局部該死該活由整體勝算決定 03/12 18:10
bbbtri: 以視覺辨識來講 Hubel Wiesel發現的特化剛好啟發CNN研究 03/12 18:12
bbbtri: 這點我剛在看版友提供的CNN介紹時也嚇一跳..... 03/12 18:12
yamiyodare: 男女識別舉例不佳的話 改成貓狗識別好了 03/12 18:22
bbbtri: 可是識別是識別 歸納是歸納 是不同的概念 03/12 18:31
bbbtri: 我只是想說AlphaGo跳過理解而直接下判斷 和人類的習慣不同 03/12 18:32
bbbtri: 所以是暴力歸納 但我還沒搞懂它到底是怎麼做出效率的啊 03/12 18:33