看板 GO 關於我們 聯絡資訊
其實現在很明顯可以看出來 基本上alphago可以控制勝率最高的著法贏7目以上 但這樣我們無法知道alphago真正的實力 是不是可以改成讓兩顆或60%勝率以上的情況追求最大目數呢? 這樣會不會更有看頭 不然未來棋手都是被慢性屠殺 看了也挺難過唉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.106.128 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457625222.A.2A4.html
Senkanseiki: 這個的說法只是在問讓幾子而已阿... 03/10 23:57
sky0302: 想太多 是小李下得臭 不是AI有多強 03/10 23:57
zelkova: 讓兩顆XD 03/10 23:58
benjamin1169: 我必須很客觀的說....兩邊棋手的內容完全是不是不同 03/11 00:02
benjamin1169: 水平.... 03/11 00:02
benjamin1169: 棋城8d 不會下棋應該還是會看一些xD 03/11 00:03
sky0302: 樓上我也棋城8d 很明顯這兩盤不是小李的水平呀 03/11 00:06
sky0302: AI的棋沒有到讓我看不懂 或 害怕的地步 03/11 00:07
sky0302: 甚至有些是一看就 啥 這下得出手..... 03/11 00:09
benjamin1169: 最可怕的就是它已經快贏了才下的出來你看的懂的啊 03/11 00:10
benjamin1169: 毽 03/11 00:10
benjamin1169: 如果一開始就讓兩顆 下法就不一定一樣了 03/11 00:11
benjamin1169: 如果今天alphago被讓兩顆或落後 中間白棋說不定就被 03/11 00:11
benjamin1169: 屠了 03/11 00:11
sky0302: 其實根本沒那麼神 棋聖也是一手一手下 反正我是放心了 03/11 00:12
sky0302: AI的棋力不可能超過我所認知的棋聖水平 03/11 00:12
benjamin1169: 就像alphago有可能是已經勝定樊灰 才下臭棋 03/11 00:14
benjamin1169: 另一版的電腦對上alphago勝率77% 03/11 00:14
a1223356: 給世界頂尖棋士讓子,你要讓他們失業嗎? 03/11 00:16
mothertime: 這版已經是分散式的了,不是單機版 03/11 00:18
ilw4e: 其實客觀說兩盤到中盤前李都有優勢或平局,電腦可怕的是後 03/11 00:18
ilw4e: 半幾乎不會有失誤 03/11 00:19
benjamin1169: 平局是我們看的....轉播也是一堆錯誤 03/11 00:20
benjamin1169: 說不定alphago早就判定贏10目提早收工了 03/11 00:21
ilw4e: 有些棋好壞很明顯的不能結果論,兩盤的左下角電腦選的變化 03/11 00:25
ilw4e: 都不會是好棋,不能說它最後因為李的其他失誤贏了所以就對 03/11 00:25
lwei781: 不是好棋 但是不影響勝負 對AlphaGO 來說沒差的 03/11 00:26
ilw4e: 不影響勝負只是因為人類之後犯的錯更嚴重阿:D 03/11 00:28
NaoGaTsu: 這件事就值得深思了。不影響勝負的臭棋真的臭嗎? 03/11 00:29
NaoGaTsu: 對阿發狗來說,人類犯不犯錯都無關他「上一手」的運算啊 03/11 00:29
NaoGaTsu: 阿發狗也算不出人類下一手會犯錯,因此人類犯錯是人類的 03/11 00:29
NaoGaTsu: 事,阿發狗計算的只有當前「該怎麼下勝率最大」。 03/11 00:30
ilw4e: 我的意思是贏電腦不是沒機會,像昨天中盤李領先,不管人或 03/11 00:34
ilw4e: 電腦來判斷應該都一樣,所以電腦才需要打入那手 03/11 00:35
ilw4e: 不然若電腦覺得自己優勢應該要下些簡明棋更高機率邁向勝利 03/11 00:36
lwei781: 沒歐 第一盤電腦一直都當102 是他的權利, 看看Zen的分數 03/11 00:36
lwei781: 第一盤的80 應該就是準備 102 的下法 03/11 00:37
ilw4e: 別說zen了,兩個程式等級差多少:D zen判斷夠強就換他來打了 03/11 00:37
ilw4e: 102後如果李處理較好也還是優勢 03/11 00:38
broodworld: 要看對手等級摟,李世石對我下臭棋也不影響勝負阿 03/11 00:45
broodworld: 而且不影響勝負也是中後盤強,前面有亂下本錢 03/11 00:46
NaoGaTsu: 所以說,臭不臭棋要看當下的盤勢,若以盤勢論,阿發狗抓 03/11 00:49
NaoGaTsu: 準高勝率的方向下,只要勝率高,就不算臭棋不是嗎? 03/11 00:49
broodworld: 還是臭啊,因為盤上可選勝率看起來差不多,就是判斷不好 03/11 00:51
benjamin1169: 102之後誰都看的出來黑棋大劣了 實戰是最佳解 03/11 00:52
NaoGaTsu: 以勝率論的話,我們覺得差不多,阿發狗計算上可能不是這 03/11 00:52
broodworld: 越後面當然越好,跟人剛好反過來 03/11 00:52
benjamin1169: 轉播當下的講解有些是錯的 03/11 00:52
NaoGaTsu: 樣,我們的運算力顯然沒阿發狗來得準確啊。所以以勝率論 03/11 00:52
NaoGaTsu: 在盤勢上有利狀況下,看起來再臭的棋可能也都是當下勝率 03/11 00:52
broodworld: 一個是前面不要判斷錯誤,一個是後面不要失誤 03/11 00:52
NaoGaTsu: 最高的「假臭棋」。 03/11 00:52
liaon98: 不是當下勝率最高 而是當下AlphaGo能算到的最高勝率 03/11 00:53
NaoGaTsu: youtube轉播者好歹也是日棋九段,盤勢不太可能看錯吧 03/11 00:53
NaoGaTsu: 阿發狗那一手能算到的最高勝率對其而言不就是勝率最高? 03/11 00:54
broodworld: 阿發的勝率分布會隨進行提高,不然前6手勝率不會差太多 03/11 00:54
liaon98: 呃 閣下剛剛沒有講「對其」啊 03/11 00:55
NaoGaTsu: 我有打「阿發狗」啊 XDD 03/11 00:55
broodworld: 我是懷疑有套手,有套手時往往有更加解,電腦會選更加 03/11 00:56
broodworld: 如果阿發從頭贏到尾,有需要放勝負手嗎 03/11 00:58
benjamin1169: 世界排名第四都輸了......在alphago面前任何普通職 03/11 00:59
benjamin1169: 手形勢判斷都不能說正確吧 03/11 01:00
benjamin1169: 確實在102之前我也是認為黑好的 03/11 01:00
benjamin1169: 後來才發現是假象 03/11 01:00
NaoGaTsu: 呃,若是如此的話,那怎麼說102之後誰都看得出來黑棋大 03/11 01:00
NaoGaTsu: 劣 = = 03/11 01:00
lwei781: Zen 下不了前段, 但是後段的valuation 應該很接近 03/11 01:04
benjamin1169: 我認為大家對於102前的形勢判斷是錯的 03/11 01:04
liaon98: 評論是說115有點緩 讓116占到形勢就歪過去了 03/11 01:04
benjamin1169: 而白棋早就把102算進去了 03/11 01:04
lwei781: 78, 102 應該很早就在AlphaGO 考慮的Tree 裡了 03/11 01:05
liaon98: 123讓白活整個角也被評不佳 03/11 01:05
lwei781: 72, 74, 76 時 大概就已經有算出來了 03/11 01:08
NaoGaTsu: 同意lwei781大的觀點。 03/11 01:09
xxx851027: 好多鍵盤九段喔 03/11 01:31
doomhydra: 好多鍵盤十段 03/11 02:39
kanonehilber: 高手看得更遠,結果被其他人當成沒下好 03/11 04:20
countingtls: 讓幾子不需要額外的設定,這跟它的結構無關。 03/11 08:03
countingtls: 追求贏最多子目前架構是沒有,只考慮輸或贏。要增加 03/11 08:05
countingtls: 應該有辦法, 03/11 08:05
darkseer: 想請問一下AlphaGo是追求勝率不是追求勝差這個的來源, 03/11 08:17
darkseer: 沒有追新聞,不過稍微翻了一下論文沒有發現,感謝XD 03/11 08:18
jasonchangki: 看接下來幾場阿法狗還有沒有下臭棋吧 03/11 09:05
jasonchangki: 假如之後開局還是有表示有些理解可能要重新思考 03/11 09:07
countingtls: 2nd page, Reinforcement Learning of policy networ 03/11 09:51
countingtls: ks 03/11 09:51
countingtls: We use a reward function r(s) that is zero for al 03/11 09:52
countingtls: l 03/11 09:52
countingtls: non-terminal time steps t < T. The outcome zt = 03/11 09:52
countingtls: 넠r(sT) is the terminal 03/11 09:52
countingtls: reward at the end of the game from the perspectiv 03/11 09:52
countingtls: e of the current 03/11 09:52
countingtls: player at time step t: +1 for winning and for lo 03/11 09:52
countingtls: -1 for losing 03/11 09:53
countingtls: 也不是追求勝率,看得懂Fig. 5? 03/11 09:57
countingtls: the algorithm chooses the most visited move from 03/11 09:58
countingtls: the root position 03/11 09:58
sck921: 很難相信棋城8d會講這種話 03/11 11:43
benjamin1169: 我不認為李世石真的下的很糟 03/11 12:01
benjamin1169: 我想知道alphago到底有沒有犯我們所謂的失誤 03/11 12:01
sck921: 等五番勝負比完再談也不遲 03/11 12:44
tonyselina: 推 sky0302: 想太多 是小李下得臭 不是AI有多強 wwwww 03/11 13:42
iwinlottery: 地獄模式關掉換monkey嗎 03/11 21:30