推 lwei781: 所以會想要改貼目設定去逼AlphaGO看看 03/11 00:25
→ NaoGaTsu: 這解釋蠻合理的。 03/11 00:31
→ jimmy20642: A有80%的可能贏20目,B有90%的可能贏1目,以程式來講 03/11 00:34
→ jimmy20642: 會跑B,但以人來看是一步緩手...小猜想 03/11 00:35
推 broodworld: 小局部MC不是等於窮解嗎 03/11 00:37
推 NaoGaTsu: 同意jimmy20642的推論。 03/11 00:37
→ NaoGaTsu: 小局部能窮解只是正好和勝率解同解? 03/11 00:37
推 liaon98: 收官其實不是重點啊 大家都知道電腦收官超強 03/11 00:38
→ NaoGaTsu: 大家都知道電腦收官超強,但棄子爭先全壓先手收官的想法 03/11 00:38
→ NaoGaTsu: 就很意外了… 03/11 00:38
推 broodworld: 變化擺得完的話,兩解應該收斂 03/11 00:39
→ broodworld: 所以其實落後不多也應該下下看拚一拚? 03/11 00:40
推 a1223356: 越後面電腦計算能力越省力,也會越好是正常的。 03/11 00:40
→ broodworld: 我覺得棄子爭先職棋想得出來,前提要有時間 03/11 00:41
推 NaoGaTsu: 掌控時間也是棋力的一部分啊.... 03/11 00:41
→ tlchen: jimmy20642 講的情況,還要配合目前領先落後,棋局階段, 03/11 00:42
→ tlchen: 然後 AI 再根據哪個是通往最後勝利的最好機會 03/11 00:43
→ tlchen: 若是落後個十目,或許就選 A 了 03/11 00:44
→ tlchen: 然後,大家可能太小看所謂的局部能窮解 03/11 00:45
→ tlchen: 首先,什麼叫局部,對於有棋感的棋手,這當然不是問題 03/11 00:45
→ tlchen: 但對於 AI 來說,多遠算是局部,都沒那麼容易 03/11 00:46
→ tlchen: 所以,局部的問題,是相對容易,但不見得 AI 能算完 03/11 00:47
推 benjamin1169: 你太低估ai了 今天很明顯計算是不同水平的 03/11 01:03
→ Senkanseiki: AI本來就不是把所有變化算完啊,他只是掃了一遍眾多 03/11 01:04
→ Senkanseiki: 變化的勝率而已 03/11 01:04
→ Senkanseiki: 然後他下了勝率最高的那個變化 03/11 01:05
→ Senkanseiki: 棋諺第一句就說勝利不用勝的多了 03/11 01:06
推 arnold3: 對電腦來說 第幾手後就算收關了 03/11 01:09
推 gj942l41l4: 說真的電腦的思考在跑局部最佳解,人類又何嘗不是呢? 03/11 01:13
→ gj942l41l4: 搞不好是人類自己腦中沒run到 而電腦看到輸的可能 03/11 01:14
→ mothertime: 圍棋對電腦來說是減法,每走一步可能性就減少許多 03/11 01:16
推 Senkanseiki: 那可能真的是人類無法理解的領域了,看那天Google如 03/11 01:18
→ Senkanseiki: 果有釋出程式或再開放更多挑戰,看AlphaGo跟職業棋士 03/11 01:18
→ Senkanseiki: 下能不能打出他看到的逆轉,再翻轉當前的圍棋理論 03/11 01:18
→ Senkanseiki: AG雖不能講話,但還是可以下棋讓更多人看見他的思路 03/11 01:20
→ gj942l41l4: 把兩台AlphaGO互打的情況拿出來看 或許就能發現什麼 03/11 01:25
推 Senkanseiki: AG左右互搏可能有太多跟人類不同的理解,還是跟人類 03/11 01:40
→ Senkanseiki: 對弈比較好 03/11 01:40
推 bxxl: 如果有程式碼 就可以讓他顯示每一步的搜尋樹跟評分 03/11 01:40
推 birdy590: 這要和開發團隊合作才有可能 例如從某一手以後雙方交換 03/11 01:45
→ birdy590: 看看 AlphaGo 要怎麼對付自己出的招 03/11 01:46
→ birdy590: 如果人下不活的讓電腦來下能活, 那棋力高低就沒有疑問了 03/11 01:51
推 frank61708: AlphaGo裡面神經網路的訓練目標的確是以勝負結果為主 03/11 03:15
→ frank61708: 因此贏10目還是贏2目對它而言都是一樣的 03/11 03:16
→ frank61708: 它主要想確定的是 它贏棋的"機率" 03/11 03:17
推 SansWord: alphaGo 釋出程式碼也鍛鍊不出現在的強度。 03/11 09:52
→ SansWord: 除非 DeepMind 連train 好的參數都願意公開 03/11 09:53
→ SansWord: 我其實覺得他們可以公開給職棋玩看看和測試 03/11 09:53
→ SansWord: 但會不會干擾現在的 trained result 就不一定了 03/11 09:54
推 poverty: 推40樓。自我否定的否定 是真正的檢驗 03/11 22:09