看板 GO 關於我們 聯絡資訊
※ 引述《nnlisalive (nnlisalive)》之銘言: : 我覺得要從程式碼方面下手了 : 首先就是阿發狗所謂的"勝率"是怎計算出來的? : 不外乎用盤面上所得到的資訊轉換成數據 : 再代入勝率函數得到每一點的勝率 : 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點? : 算出來的勝率沒有誤差? 如果有個點勝率是70% : 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏 : 但明明就還沒下完 也不知道對方會怎下 : 所以只要能騙過電腦 讓他一直下到誤判勝率的棋 : 阿發狗就會輸到怎死的都不知道了 : 問題是要怎騙過阿法狗? : 我 不 知 道 ! AlphaGO "勝率"計算大約是 最原始概念 假設現在盤面上AlphaGO有ABCDE五個地方值得下 就對ABCDE這個五位置後續各往後 快速隨機亂下1000盤 一直下到官子結束看最後贏幾盤 假設結果 A位置 贏830盤 輸170盤 B位置 贏750盤 輸250盤 C位置 贏640盤 輸360盤 D位置 贏912盤 輸 88盤 E位置 贏120盤 輸880盤 電腦不會管平均贏了幾目只看輸贏 最後就會選位置D ================================== 當然圍棋"隨機亂下"一千盤參價值可能有限 接下來做的就是讓 "隨機亂下1000盤"變成"快速下出1000盤有參考價值的棋" MCTS圍棋的棋力就建構在 "隨機亂下"階段 有意義的落子選擇還有快速下完那1000盤的棋局質量 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.48.185 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457746522.A.327.html ※ 編輯: saltfish (114.25.48.185), 03/12/2016 09:36:17
nnlisalive: 原來如此 要有價值就是慢 而且夠多盤的機率越準 03/12 09:54
nnlisalive: 這樣看來電腦還是在用窮舉法逼近圍棋之神 03/12 09:55
nnlisalive: 只是這次的窮舉法比較聰明 加進了機率與統計 03/12 09:56
nnlisalive: 圍棋就是變化複雜的特性 正好讓用機率來計算落子的 03/12 09:57
nnlisalive: AlphaGo變得超級強 03/12 09:58
fermib: 這種"窮舉"已經很像人了 是一種經驗累積 只是比較無腦的經 03/12 09:58
clark78118: 這篇錯的 value network is used to reduce 03/12 10:01
clark78118: the depth of the search tree 03/12 10:02
clark78118: AlphaGo透過輸入的棋譜跟自我對戰 學習兩件事 03/12 10:09
clark78118: 1.哪裡可能值得下 2.形勢判斷 03/12 10:10
NaoGaTsu: 簡略化的概念的確如本篇所說 03/12 10:12
NaoGaTsu: AG強的地方在於,他有能力能判斷「哪些位置需要去測勝率 03/12 10:12
clark78118: 他沒有把棋下到end game 而是用形勢判斷 03/12 10:12
傳統象棋人工智慧還有 GNUGO圍棋AI 確實是以形勢判斷 前幾天上網查黃士傑的博士論文ERICA的架構 才發現現在的圍棋MTCS "隨機亂下N盤"確實是做到end game
NaoGaTsu: 」這件事,因此需要消耗大量資源與時間的全盤式隨機落子 03/12 10:13
NaoGaTsu: 以及算完所有分支樹的狀況在AG的考量下不會發生。 03/12 10:14
darkseer: To clark78118: The second rollout phase of each 03/12 10:20
darkseer: simulation begins at leaf node sL and continues 03/12 10:20
darkseer: until the end of the game. 他有算完啦XD 03/12 10:20
darkseer: 只是它不只快速算完,也用了你說的形勢判斷 03/12 10:21
darkseer: 我之前po文的時候自己也沒看懂...剛才才去改@@ 03/12 10:22
darkseer: 原po說這是原始概念也對,paper分析說這部分影響最大 03/12 10:36
darkseer: 我覺得深度學習帶來的新能力是: 可以在極短時間不計算而 03/12 10:38
darkseer: 做出業餘初段等級的直覺判斷。想像如果人類可以用0.01秒 03/12 10:38
darkseer: 做到業餘初段等級的判斷,那加上計算就不得了了。 03/12 10:39
※ 編輯: saltfish (114.25.48.185), 03/12/2016 10:48:03
fgkor123: 有講到是三段等級的 03/12 10:48
fgkor123: 連結,搜 Table 7,剛好看到跑勝率圖 03/12 10:52
darkseer: 感謝,我說業餘初段完全是個隨意估計,抱歉@@ 03/12 11:01
darkseer: 不過我覺得DarkForest在這點還是很難超出職業棋評? 03/12 11:02
fgkor123: 剛對了一下第二盤步數,6446開時,講評也是眾說紛紜 03/12 11:08