[問題] 可否更改alphago的設定

作者benjamin1169 (阿呆名)

看板GO

標題[問題] 可否更改alphago的設定

時間Thu Mar 10 23:53:40 2016

其實現在很明顯可以看出來基本上alphago可以控制勝率最高的著法贏7目以上但這樣我們無法知道alphago真正的實力是不是可以改成讓兩顆或60%勝率以上的情況追求最大目數呢？這樣會不會更有看頭不然未來棋手都是被慢性屠殺看了也挺難過唉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.106.128 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457625222.A.2A4.html

推 Senkanseiki: 這個的說法只是在問讓幾子而已阿... 03/10 23:57

推 sky0302: 想太多是小李下得臭不是AI有多強 03/10 23:57

→ zelkova: 讓兩顆XD 03/10 23:58

→ benjamin1169: 我必須很客觀的說....兩邊棋手的內容完全是不是不同 03/11 00:02

→ benjamin1169: 水平.... 03/11 00:02

→ benjamin1169: 棋城8d 不會下棋應該還是會看一些xD 03/11 00:03

推 sky0302: 樓上我也棋城8d 很明顯這兩盤不是小李的水平呀 03/11 00:06

→ sky0302: AI的棋沒有到讓我看不懂或害怕的地步 03/11 00:07

→ sky0302: 甚至有些是一看就啥這下得出手..... 03/11 00:09

→ benjamin1169: 最可怕的就是它已經快贏了才下的出來你看的懂的啊 03/11 00:10

→ benjamin1169: 毽 03/11 00:10

→ benjamin1169: 如果一開始就讓兩顆下法就不一定一樣了 03/11 00:11

→ benjamin1169: 如果今天alphago被讓兩顆或落後中間白棋說不定就被 03/11 00:11

→ benjamin1169: 屠了 03/11 00:11

推 sky0302: 其實根本沒那麼神棋聖也是一手一手下反正我是放心了 03/11 00:12

→ sky0302: AI的棋力不可能超過我所認知的棋聖水平 03/11 00:12

→ benjamin1169: 就像alphago有可能是已經勝定樊灰才下臭棋 03/11 00:14

→ benjamin1169: 另一版的電腦對上alphago勝率77% 03/11 00:14

推 a1223356: 給世界頂尖棋士讓子，你要讓他們失業嗎？ 03/11 00:16

→ mothertime: 這版已經是分散式的了，不是單機版 03/11 00:18

推 ilw4e: 其實客觀說兩盤到中盤前李都有優勢或平局，電腦可怕的是後 03/11 00:18

→ ilw4e: 半幾乎不會有失誤 03/11 00:19

→ benjamin1169: 平局是我們看的....轉播也是一堆錯誤 03/11 00:20

→ benjamin1169: 說不定alphago早就判定贏10目提早收工了 03/11 00:21

推 ilw4e: 有些棋好壞很明顯的不能結果論，兩盤的左下角電腦選的變化 03/11 00:25

→ ilw4e: 都不會是好棋，不能說它最後因為李的其他失誤贏了所以就對 03/11 00:25

→ lwei781: 不是好棋但是不影響勝負對AlphaGO 來說沒差的 03/11 00:26

→ ilw4e: 不影響勝負只是因為人類之後犯的錯更嚴重阿:D 03/11 00:28

推 NaoGaTsu: 這件事就值得深思了。不影響勝負的臭棋真的臭嗎？ 03/11 00:29

→ NaoGaTsu: 對阿發狗來說，人類犯不犯錯都無關他「上一手」的運算啊 03/11 00:29

→ NaoGaTsu: 阿發狗也算不出人類下一手會犯錯，因此人類犯錯是人類的 03/11 00:29

→ NaoGaTsu: 事，阿發狗計算的只有當前「該怎麼下勝率最大」。 03/11 00:30

推 ilw4e: 我的意思是贏電腦不是沒機會，像昨天中盤李領先，不管人或 03/11 00:34

→ ilw4e: 電腦來判斷應該都一樣，所以電腦才需要打入那手 03/11 00:35

→ ilw4e: 不然若電腦覺得自己優勢應該要下些簡明棋更高機率邁向勝利 03/11 00:36

推 lwei781: 沒歐第一盤電腦一直都當102 是他的權利, 看看Zen的分數 03/11 00:36

→ lwei781: 第一盤的80 應該就是準備 102 的下法 03/11 00:37

→ ilw4e: 別說zen了，兩個程式等級差多少:D zen判斷夠強就換他來打了 03/11 00:37

→ ilw4e: 102後如果李處理較好也還是優勢 03/11 00:38

推 broodworld: 要看對手等級摟,李世石對我下臭棋也不影響勝負阿 03/11 00:45

→ broodworld: 而且不影響勝負也是中後盤強,前面有亂下本錢 03/11 00:46

推 NaoGaTsu: 所以說，臭不臭棋要看當下的盤勢，若以盤勢論，阿發狗抓 03/11 00:49

→ NaoGaTsu: 準高勝率的方向下，只要勝率高，就不算臭棋不是嗎？ 03/11 00:49

推 broodworld: 還是臭啊,因為盤上可選勝率看起來差不多,就是判斷不好 03/11 00:51

→ benjamin1169: 102之後誰都看的出來黑棋大劣了實戰是最佳解 03/11 00:52

推 NaoGaTsu: 以勝率論的話，我們覺得差不多，阿發狗計算上可能不是這 03/11 00:52

→ broodworld: 越後面當然越好,跟人剛好反過來 03/11 00:52

→ benjamin1169: 轉播當下的講解有些是錯的 03/11 00:52

→ NaoGaTsu: 樣，我們的運算力顯然沒阿發狗來得準確啊。所以以勝率論 03/11 00:52

→ NaoGaTsu: 在盤勢上有利狀況下，看起來再臭的棋可能也都是當下勝率 03/11 00:52

→ broodworld: 一個是前面不要判斷錯誤,一個是後面不要失誤 03/11 00:52

→ NaoGaTsu: 最高的「假臭棋」。 03/11 00:52

推 liaon98: 不是當下勝率最高而是當下AlphaGo能算到的最高勝率 03/11 00:53

→ NaoGaTsu: youtube轉播者好歹也是日棋九段，盤勢不太可能看錯吧 03/11 00:53

→ NaoGaTsu: 阿發狗那一手能算到的最高勝率對其而言不就是勝率最高？ 03/11 00:54

→ broodworld: 阿發的勝率分布會隨進行提高,不然前6手勝率不會差太多 03/11 00:54

→ liaon98: 呃閣下剛剛沒有講「對其」啊 03/11 00:55

→ NaoGaTsu: 我有打「阿發狗」啊 XDD 03/11 00:55

→ broodworld: 我是懷疑有套手,有套手時往往有更加解,電腦會選更加 03/11 00:56

→ broodworld: 如果阿發從頭贏到尾,有需要放勝負手嗎 03/11 00:58

→ benjamin1169: 世界排名第四都輸了......在alphago面前任何普通職 03/11 00:59

→ benjamin1169: 手形勢判斷都不能說正確吧 03/11 01:00

→ benjamin1169: 確實在102之前我也是認為黑好的 03/11 01:00

→ benjamin1169: 後來才發現是假象 03/11 01:00

推 NaoGaTsu: 呃，若是如此的話，那怎麼說102之後誰都看得出來黑棋大 03/11 01:00

→ NaoGaTsu: 劣 = = 03/11 01:00

推 lwei781: Zen 下不了前段, 但是後段的valuation 應該很接近 03/11 01:04

→ benjamin1169: 我認為大家對於102前的形勢判斷是錯的 03/11 01:04

推 liaon98: 評論是說115有點緩讓116占到形勢就歪過去了 03/11 01:04

→ benjamin1169: 而白棋早就把102算進去了 03/11 01:04

→ lwei781: 78, 102 應該很早就在AlphaGO 考慮的Tree 裡了 03/11 01:05

→ liaon98: 123讓白活整個角也被評不佳 03/11 01:05

推 lwei781: 72, 74, 76 時大概就已經有算出來了 03/11 01:08

推 NaoGaTsu: 同意lwei781大的觀點。 03/11 01:09

噓 xxx851027: 好多鍵盤九段喔 03/11 01:31

推 doomhydra: 好多鍵盤十段 03/11 02:39

推 kanonehilber: 高手看得更遠，結果被其他人當成沒下好 03/11 04:20

→ countingtls: 讓幾子不需要額外的設定，這跟它的結構無關。 03/11 08:03

→ countingtls: 追求贏最多子目前架構是沒有，只考慮輸或贏。要增加 03/11 08:05

→ countingtls: 應該有辦法， 03/11 08:05

推 darkseer: 想請問一下AlphaGo是追求勝率不是追求勝差這個的來源， 03/11 08:17

→ darkseer: 沒有追新聞，不過稍微翻了一下論文沒有發現，感謝XD 03/11 08:18

推 jasonchangki: 看接下來幾場阿法狗還有沒有下臭棋吧 03/11 09:05

→ jasonchangki: 假如之後開局還是有表示有些理解可能要重新思考 03/11 09:07

→ countingtls: 2nd page, Reinforcement Learning of policy networ 03/11 09:51

→ countingtls: ks 03/11 09:51

→ countingtls: We use a reward function r(s) that is zero for al 03/11 09:52

→ countingtls: l 03/11 09:52

→ countingtls: non-terminal time steps t < T. The outcome zt = 03/11 09:52

→ countingtls: 넠r(sT) is the terminal 03/11 09:52

→ countingtls: reward at the end of the game from the perspectiv 03/11 09:52

→ countingtls: e of the current 03/11 09:52

→ countingtls: player at time step t: +1 for winning and for lo 03/11 09:52

→ countingtls: -1 for losing 03/11 09:53

推 countingtls: 也不是追求勝率，看得懂Fig. 5? 03/11 09:57

→ countingtls: the algorithm chooses the most visited move from 03/11 09:58

→ countingtls: the root position 03/11 09:58

→ sck921: 很難相信棋城8d會講這種話 03/11 11:43

→ benjamin1169: 我不認為李世石真的下的很糟 03/11 12:01

→ benjamin1169: 我想知道alphago到底有沒有犯我們所謂的失誤 03/11 12:01

→ sck921: 等五番勝負比完再談也不遲 03/11 12:44

→ tonyselina: 推 sky0302: 想太多是小李下得臭不是AI有多強 wwwww 03/11 13:42

推 iwinlottery: 地獄模式關掉換monkey嗎 03/11 21:30