Re: [討論] 對電腦戰勝人類的看法

作者joy830 (joy)

看板GO

標題Re: [討論] 對電腦戰勝人類的看法

時間Sat Oct 29 23:21:20 2016

: 所有變化都被算完了 : 還會有棋士想研究圍棋嗎? - 雖然人類輸了電腦但不代表圍棋的變化被算盡算盡的話每一手都會是固定的 - 人類輸在對電腦的未知但電腦在職業顧問的幫助下基本上對於人類算某種程度的已知 - 人機大戰過後太少棋手去研究第四局電腦的失誤原因(root cause) 只知道google修正了這項錯誤要擊敗電腦就要從這個失誤開始研究 - 目前只知道電腦以獲勝為優先考量下出每一步我比較想知道若是電腦的每一步的判斷條件從獲勝改成贏最多到底結果會變成怎樣 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.113.41 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1477754482.A.2DA.html

推 kenwufederer: 獲勝跟贏最多應該是一樣的，圍棋不是每次用強就好 10/29 23:25

→ kenwufederer: 而電腦是選擇自己計算中勝率最高的一手 10/29 23:25

→ kenwufederer: 畢竟不可能全部算盡，因此當下贏最多是沒錯的 10/29 23:26

我的意思就是電腦要贏到最多目數不去想獲勝 ※ 編輯: joy830 (118.233.113.41), 10/29/2016 23:30:31

推 yyhsiu: 贏最多很難定義吧 30%贏20目 vs 80%贏10目難道要選第一個 10/30 00:08

→ yyhsiu: 對電腦來說這目標太不明確了，但你可以一開始目標15目 10/30 00:09

→ aaaba: 為何棋手要去研究失誤的真正原因？他又不是RD 10/30 00:13

→ aaaba: 另外，請問為何算盡，每一手就會固定？ 10/30 00:16

→ aaaba: 最後，如何說明人類是輸在對電腦的未知，而不是因為電腦的 10/30 00:23

→ aaaba: 算路本來就更廣更準？ 10/30 00:23

推 ggoutoutder: 問題是狗不敢出來下了只有五盤人機棋譜怎麼研究 10/30 00:33

→ kenwufederer: 電腦下的每一手就是當下最多目的 10/30 00:42

→ kenwufederer: 人類會覺得為什麼不下更強些，但電腦不懂 10/30 00:43

推 underspin: 我是怕有一天真的被電腦暴力破解算進路數的話,雖然大家 10/30 00:44

→ kenwufederer: 贏到最多目本來就是電腦的目標吧 10/30 00:44

→ underspin: 會說不可能,甚麼圍棋的變化是10的多少次方之類的話,但 10/30 00:44

→ kenwufederer: 換個角度想，對手的實力只能讓電腦盤面10目 10/30 00:45

→ underspin: 在幾年前,也沒有人相信電腦能贏人類吧?甚至還有人說要1 10/30 00:45

→ kenwufederer: 所以贏最多這概念只在於人類，不在電腦 10/30 00:46

→ underspin: 要100年,科技進步太快,說不定我們會看到棋被破解的那天 10/30 00:46

推 pilipilifans: 棋手沒辦法研究那個失誤吧...更何況連演算法都沒有 10/30 01:40

→ pilipilifans: 根本無從探討那一手失誤是怎麼來的 10/30 01:41

推 Danielly: 電腦下的不是當下最多目的啊是以該棋步往下期望值最高 10/30 01:58

→ Danielly: 但這期望值高的結果來源有可能是因為這手棋很穩以此為 10/30 01:59

→ Danielly: 基礎往下幾乎都是贏棋所以期望值高但要贏到最多目的棋 10/30 01:59

→ Danielly: 步其實不一定會在以這手棋為基礎的集合裡 10/30 02:00

推 BRANFORD: 贏到最多和勝率最高(風險最低)絕對是兩回事 10/30 04:47

→ aaaba: 而且圍棋規則裡又沒有“要贏到最多目”、“要窮盡所有變化 10/30 07:54

→ aaaba: ”，為何電腦來下，就要被關切有沒有做到這兩點？前者明顯 10/30 07:54

→ aaaba: 違背圍棋十訣裡的想法，後者如果有那種計算資源存在，程式 10/30 07:54

→ aaaba: 寫起來根本小菜一碟，問題是有那種資源的話，圍棋一定不是 10/30 07:54

→ aaaba: 第一個被拿來應用的領域，如同深度學習也是至少四年後才被 10/30 07:55

→ aaaba: 電腦圍棋利用，那時你不如先擔心你的ptt帳號密碼被破解 10/30 07:55

推 letudiant: 中國古棋就有贏最多和窮盡變化的觀念，雖然現在圍棋規 10/30 14:39

→ letudiant: 則和理論不同了，我覺得還算是個有趣的方向 10/30 14:39

→ aaaba: 那古人的結論具體來說是怎樣？還是所謂道可道非常道，不方 10/30 15:24

→ aaaba: 便說得太清楚 10/30 15:24

推 BRANFORD: 中國古棋怎樣窮盡變化的概念?我也很想聽具體的解說 10/30 16:04

噓 forfunmerely: 開賭盤啦我All in不了了之 10/30 16:06

→ sky0302: 周東侯：局中義理之所在務須推移盡變若稍有餘蘊必不能 10/30 16:44

→ sky0302: 酣暢淋漓高手以勝負泥於胸中故往往中止 10/30 16:45

→ aaaba: 翻譯米糕：對局中務必盡量細算，高手往往太拘泥於勝負，無 10/30 17:38

→ aaaba: 關勝負處就不算，這樣很不舒服捏。 10/30 17:38

推 ddavid: 其實「贏最多」真的跟「獲勝」不一樣喔。 10/31 04:37

→ ddavid: 比如說某一手90%贏兩目半，另一手60%贏三目半，20%贏半目 10/31 04:40

→ ddavid: （或你也可以調成都是90%勝但目數分布不一樣就好），那麼 10/31 04:42

→ ddavid: 應該選擇哪一手呢？ 10/31 04:42

→ ddavid: 這其中會微妙地牽扯到「值不值得為了多贏一目放棄1%勝率」 10/31 04:44

→ ddavid: 或甚至「要不要因為有多贏一目的機會，但導致少贏一目的機 10/31 04:44

→ ddavid: 率也上升了」，這都會造成評估函數有所變化，算出來的當前 10/31 04:45

→ ddavid: 最佳解會因而改變，一點點的小變化就可能導致模型整體差異 10/31 04:45

→ ddavid: 很大。 10/31 04:45

推 gamera: t同意。當「獲勝」為目標，一旦勝率超過50％，就會導向儘 10/31 08:45

→ gamera: 快定型收束，把棋盤變小。如果想「贏最多」，會持續亂戰。 10/31 08:47