推 kenwufederer: 獲勝跟贏最多應該是一樣的,圍棋不是每次用強就好 10/29 23:25
→ kenwufederer: 而電腦是選擇自己計算中勝率最高的一手 10/29 23:25
→ kenwufederer: 畢竟不可能全部算盡,因此當下贏最多是沒錯的 10/29 23:26
我的意思就是電腦要贏到最多目數 不去想獲勝
※ 編輯: joy830 (118.233.113.41), 10/29/2016 23:30:31
推 yyhsiu: 贏最多很難定義吧 30%贏20目 vs 80%贏10目 難道要選第一個 10/30 00:08
→ yyhsiu: 對電腦來說這目標太不明確了,但你可以一開始目標15目 10/30 00:09
→ aaaba: 為何棋手要去研究失誤的真正原因?他又不是RD 10/30 00:13
→ aaaba: 另外,請問為何算盡,每一手就會固定? 10/30 00:16
→ aaaba: 最後,如何說明人類是輸在對電腦的未知,而不是因為電腦的 10/30 00:23
→ aaaba: 算路本來就更廣更準? 10/30 00:23
推 ggoutoutder: 問題是狗不敢出來下了 只有五盤人機棋譜 怎麼研究 10/30 00:33
→ kenwufederer: 電腦下的每一手就是當下最多目的 10/30 00:42
→ kenwufederer: 人類會覺得為什麼不下更強些,但電腦不懂 10/30 00:43
推 underspin: 我是怕有一天真的被電腦暴力破解算進路數的話,雖然大家 10/30 00:44
→ kenwufederer: 贏到最多目本來就是電腦的目標吧 10/30 00:44
→ underspin: 會說不可能,甚麼圍棋的變化是10的多少次方之類的話,但 10/30 00:44
→ kenwufederer: 換個角度想,對手的實力只能讓電腦盤面10目 10/30 00:45
→ underspin: 在幾年前,也沒有人相信電腦能贏人類吧?甚至還有人說要1 10/30 00:45
→ kenwufederer: 所以贏最多這概念只在於人類,不在電腦 10/30 00:46
→ underspin: 要100年,科技進步太快,說不定我們會看到棋被破解的那天 10/30 00:46
推 pilipilifans: 棋手沒辦法研究那個失誤吧...更何況連演算法都沒有 10/30 01:40
→ pilipilifans: 根本無從探討那一手失誤是怎麼來的 10/30 01:41
推 Danielly: 電腦下的不是當下最多目的啊 是以該棋步往下期望值最高 10/30 01:58
→ Danielly: 但這期望值高的結果 來源有可能是因為這手棋很穩 以此為 10/30 01:59
→ Danielly: 基礎往下幾乎都是贏棋 所以期望值高 但要贏到最多目的棋 10/30 01:59
→ Danielly: 步其實不一定會在以這手棋為基礎的集合裡 10/30 02:00
推 BRANFORD: 贏到最多和勝率最高(風險最低)絕對是兩回事 10/30 04:47
→ aaaba: 而且圍棋規則裡又沒有“要贏到最多目”、“要窮盡所有變化 10/30 07:54
→ aaaba: ”,為何電腦來下,就要被關切有沒有做到這兩點?前者明顯 10/30 07:54
→ aaaba: 違背圍棋十訣裡的想法,後者如果有那種計算資源存在,程式 10/30 07:54
→ aaaba: 寫起來根本小菜一碟,問題是有那種資源的話,圍棋一定不是 10/30 07:54
→ aaaba: 第一個被拿來應用的領域,如同深度學習也是至少四年後才被 10/30 07:55
→ aaaba: 電腦圍棋利用,那時你不如先擔心你的ptt帳號密碼被破解 10/30 07:55
推 letudiant: 中國古棋就有贏最多和窮盡變化的觀念,雖然現在圍棋規 10/30 14:39
→ letudiant: 則和理論不同了,我覺得還算是個有趣的方向 10/30 14:39
→ aaaba: 那古人的結論具體來說是怎樣?還是所謂道可道非常道,不方 10/30 15:24
→ aaaba: 便說得太清楚 10/30 15:24
推 BRANFORD: 中國古棋怎樣窮盡變化的概念?我也很想聽具體的解說 10/30 16:04
噓 forfunmerely: 開賭盤啦我All in不了了之 10/30 16:06
→ sky0302: 周東侯:局中義理之所在 務須推移盡變 若稍有餘蘊 必不能 10/30 16:44
→ sky0302: 酣暢淋漓 高手以勝負泥於胸中 故往往中止 10/30 16:45
→ aaaba: 翻譯米糕:對局中務必盡量細算,高手往往太拘泥於勝負,無 10/30 17:38
→ aaaba: 關勝負處就不算,這樣很不舒服捏。 10/30 17:38
推 ddavid: 其實「贏最多」真的跟「獲勝」不一樣喔。 10/31 04:37
→ ddavid: 比如說某一手90%贏兩目半,另一手60%贏三目半,20%贏半目 10/31 04:40
→ ddavid: (或你也可以調成都是90%勝但目數分布不一樣就好),那麼 10/31 04:42
→ ddavid: 應該選擇哪一手呢? 10/31 04:42
→ ddavid: 這其中會微妙地牽扯到「值不值得為了多贏一目放棄1%勝率」 10/31 04:44
→ ddavid: 或甚至「要不要因為有多贏一目的機會,但導致少贏一目的機 10/31 04:44
→ ddavid: 率也上升了」,這都會造成評估函數有所變化,算出來的當前 10/31 04:45
→ ddavid: 最佳解會因而改變,一點點的小變化就可能導致模型整體差異 10/31 04:45
→ ddavid: 很大。 10/31 04:45
推 gamera: t同意。當「獲勝」為目標,一旦勝率超過50%,就會導向儘 10/31 08:45
→ gamera: 快定型收束,把棋盤變小。如果想「贏最多」,會持續亂戰。 10/31 08:47