看板 GO 關於我們 聯絡資訊
※ 引述《mathbug (天堂的定義)》之銘言: : 1. 據說 AlphaGo用到的Neuro Network深達13層 : 有任何穩定性的報告或是說明嗎? 論文裡有提到它預測的誤差 : 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 : AlphaGo的設計應該是循著第一條路線 : 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 : 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手) : 不曉得這會不會是AlphaGo昨天崩潰的原因? 所謂千萬盤是自我對奕, 不是人類實戰譜, 人類高手實戰譜還沒那麼多. 看它跟小李下的棋路, 是第一種路線多? 還是第二種多? : 3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開 : 重新訓練時只採用第一種壓著打或是完勝的棋譜 : 也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定) 中間攻防輸掉是 AlphaGo 形勢判斷錯誤, 劣勢盤面還以為優勢繼續走損手. 後來左下角的挖被吞吃, 還有點影響到左邊黑棋的死活. 理論上決策樹會假設對方走最好的一手 (被吞吃), 而不是期待對方犯錯. AlphaGo 有很多其他的著手選擇, 下起來都沒有那一手損導致勝率更低. 就算以 AI 的角度, 我也看不懂它在下甚麼. 難不成 AlphaGo 大幅落後時策略改成期待對方應錯翻盤? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458001831.A.6CC.html
goldduck: 不能預期靠對方失誤來做判斷下棋 所以這是很奇怪的事 03/15 08:35
Dialysis: 只要餵給alphago幾萬盤大幅落後的棋局,就會知道其應對了 03/15 08:58
fermib: 可能是AG得模擬棋子裡是有一定程度隨機性的 因為完全下得 03/15 09:15
fermib: 職業棋士一樣只能三段 要有隨機性保持創造力才能到超9段 03/15 09:16
fermib: 但當每一步勝率都很低的時候 隨機性可能會dominate勝率導 03/15 09:16
fermib: 至自殺棋? 模擬時因為兩方都有隨機性 白方幾乎怎麼下都贏 03/15 09:18
fermib: 時 黑方只有等白方模擬的隨機性發生才有勝率 這就是預期白 03/15 09:19
fermib: 方失誤 模擬時隨機性不能高 不然就是兩個俗手在模擬贏不了 03/15 09:20
fermib: 李九段 但又不能太低 會太像舊譜只有三段實力 03/15 09:21
tbrLeBlanc: 看看第四局開局 很懷疑是不是真的有隨機性 03/15 09:44