精華區beta C_Chat 關於我們 聯絡資訊
※ 引述《a127 (毛蘿蔔)》之銘言: : ※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言: : 個人只是看過一些簡報介紹, : 但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。 : 以前西洋棋被電腦演算直接暴力破解, : 原因在於合法步少,對手的下一手反制只有2X步可能, : 圍棋的合法步多,前幾手對手的反制有200步以上的可能。 : 然後西洋棋的好步就是成功的殺死對手的棋子+國王, : 圍棋的好步眾說紛紜,就連佈局來說不同的棋手就有各自不同的審美觀。 : 雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地, : 但兩個不同的N相比起來,還是會很微妙的難以判斷哪方優劣。 : 所以圍棋比賽沒有足夠時間被暴力破解, : 於是就變成阿發狗利用評價網路來建立圍棋的審美觀, : 也就是把人類棋手應對的"好步"記起來, : 利用這些好步跟有限的計算來擊倒對手。 : 原本我在想既然餵養阿發狗的食物來源也是人類創造的, 這段你搞錯了 餵人類棋譜長大的是舊版的阿發狗 也就是去年跟李世石下的那隻 去年那隻在李世石第78步下出神之一手後整個錯亂導致輸棋 可能也是因為李那步超越了去年狗狗建立的理論 今年這隻阿發狗是純粹藉由自我對局學習的 差別在於今年這隻會在前期中棋下一些違反常理 甚至被認為是臭棋的棋步 但事後發現這些棋步都是神之一手 所以才很多職業棋士說新版阿發狗顛覆了傳統圍棋理論 : 那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢? : 我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多, : 相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已) : 會有這種猜測是這五十場勝利之中,其實有幾場是幾目的勝負, : 而且都是在前中期阿發狗被評論大幅領先,在後面被人類追上。 : 我認為會有這種異常狀況出現,可能在於一部分的賽局都以投子結束, : 等於在最後收官階段給阿發狗餵養的資料不夠多, : 因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。 這點你判斷也是有問題 阿發狗中期贏很多 後期贏面變小的理由 主要是來自於他所設定的目標 對阿發狗來講 贏半目跟贏100目都是贏 所以我不需要贏很多 只要保持一定贏就可以了 所以狗狗在穩定領先時會變得保守的理由就在這邊 反觀人類在獲得優勢時 常常想要擴大優勢 但這個行為往往得不償失 這就是電腦最強的地方 電腦完全沒有情緒 他只往最高勝率的方向走 所以不容易犯錯 -- BZ黑一到板,所有看板的人便都看著他笑,有的叫道:「BZ黑,鬥陣特攻拿年度最佳遊戲了 !」他不回答,對板裡說:「發兩篇廢文。」便排出九文批幣。他們又故意的高聲嚷道:「 鬥陣特攻還拿最佳電競跟最佳多人遊戲!」BZ黑睜大眼晴說:「鬥陣早過氣了…」「什麼過 氣?我前天親眼見鬥陣特攻包辦三個獎。」BZ黑便漲紅了臉,額上的青筋條條綻出,爭辯道 :「只拿一次GOTY不能算贏…競技遊戲,能算GOTY嗎?」接連便是難懂的話,什麼「對手太 弱」,什麼「陰屍路也拿過」之類,引得眾人都哄笑起來:板內外充滿了快活的空氣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.51.10 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1483592194.A.DD7.html
intela60474: 我覺得不是變保守而是後期資訊量對人類來說終於夠了 01/05 13:00
orze04: AlphaGo在後期會把一些還有變化的地方早早結束掉 01/05 13:01
emptie: 這就是我們學棋跟阿發狗最大的不同…… 01/05 13:02
emptie: 我們會關注贏多少 他只會管有沒有贏 01/05 13:03
shadowblade: 機器沒有賭徒性格差很多 01/05 13:03
a1234567289: 和李世石打的那隻也有自我對奕了吧 01/05 13:03
那隻有自我對羿 但是他還是吃人類棋譜長大的 現在這隻完全不受人類棋譜污染 他是純粹自我對羿長大的
orze04: 人會犯錯啊 又不可能像AI那麼精準計算 01/05 13:03
emptie: 也不能說人的下法不對 因為我們怕失誤 所以會希望能盡量多 01/05 13:04
orze04: 不能說錯的 人也很難完整複製AI那套下法 01/05 13:04
重點是既往圍棋理論會跟你說 絕對不能這樣下的棋步 被狗狗證明是可以這樣下的 光這點就夠震撼了
emptie: 凹一點 但是機器不會失誤 01/05 13:04
※ 編輯: Justice5566 (114.34.51.10), 01/05/2017 13:05:40
MikiSayaka: 還有電腦的訓練量就算是最強的職業棋士都難望項背... 01/05 13:10
MikiSayaka: 職業棋士沒有辦法 24x7 都在下棋... ||| 01/05 13:10
orze04: AlphaGo能那樣下是因為它能發揮 人能不能發揮同樣效力? 01/05 13:10
MikiSayaka: AlphaGO 的著棋思路可能沒有辦法從內部結構去理解 01/05 13:11
henry1234562: 人類跟ai在下圍棋的根本判斷方式有不同 01/05 13:12
henry1234562: 雖然結果都是為了最大勝率 但過程差很多 01/05 13:13
ADIE2: 現在看起來李世石真的是神之一手 可能是阿發狗最後一敗 01/05 13:16
dreamnook: 圍棋理論也是建立在大量棋局的收斂經驗談上吧? 01/05 13:17
shinwind: 他前中期的下法.其實不是人類不懂.. 01/05 13:18
shinwind: 而是我們沒辦法判斷這麼宏觀 01/05 13:18
shinwind: 這樣說好了.人類的觀點 都在局部.=而阿法狗下的 都是宏 01/05 13:18
shinwind: 觀的勝利.其實人類也可以 只是... 01/05 13:18
shinwind: 你無法像AI那樣.中收尾不出錯 01/05 13:19
flysonics: "士傑讀了Alpha狗萬局練蠱棋局後 竟也成一代武林奇俠" 01/05 13:20
flysonics: 這種套路感覺好像武俠小說wwww 01/05 13:21
shinwind: 其實看解說就能有這種感覺.有時候一個局部固定的定式 01/05 13:25
shinwind: 解說就會說出這邊會怎樣下.但阿法狗就下一半 就不鳥了.. 01/05 13:25
shinwind: 跑出旁邊下. 01/05 13:26
zeyoshi: 我覺得電腦預測的能力比人類高很多 所以判斷是否需要收 01/05 13:26
zeyoshi: 手或進攻的時間會變得相當準確 01/05 13:26
loadingN: 最大的優勢應該是不會有太大的失誤 01/05 13:27
henry1234562: 只是因為ai的目標單純只放在贏而已 01/05 13:32
henry1234562: ai在確定當前局面基本贏定後 就是不會再擴大優勢 01/05 13:33
shinwind: 這也是為什麼收宮會看到填自己目的情況XD 01/05 13:36
wateryoo: 專業推~ 01/05 13:41
seaEPC: 目前這個發展階段能贏還是重點,不然AI目標要調整成盡可能 01/05 13:43
seaEPC: 贏越多目應該也不是問題,只是可能翻船機率稍大一點 01/05 13:43
jupto: 我覺得是因為AI預測能力高於人類 人類僅能不斷擴大優勢去確 01/05 13:49
jupto: 保自己的勝利機率 但AI可以不斷地消除自己輸棋的未來來確保 01/05 13:50
jupto: 自己的勝利 所以對於棋局的走向才會有所差異 01/05 13:51
jupto: 以程式的觀點人類的思考模式是loop AI是遞迴 01/05 13:52
blackwindy: loop跟遞迴一樣阿... 01/05 13:53
jupto: 一個反著來 一個正面上 概念上有差啦 01/05 13:54
blackwindy: 差別只是遞迴會呼叫自己 01/05 13:54
blackwindy: 不要亂套用專有名詞 那不是你想的那樣 01/05 13:54
blackwindy: 最好笑的應該是 以往圍棋大家都說人類有宏觀視野 戰略 01/05 13:55
blackwindy: 現在AI已經用實戰證明那些只不過是屁 人類應該謙虛點 01/05 13:56
zader: 深層運算跟宏局觀真的是贏不過電腦 01/05 14:01
jupto: 事實上什麼宏觀視野 戰略人類自己都不瞭解那東西的本質 01/05 14:03
jupto: 結果使用模擬大腦運作方式AI就自己發展出來了 01/05 14:04
orze04: 遞迴可以用stack和loop做出來沒錯 01/05 14:08
agag5123: 區域不走完用機器的角度想可能是另一區的手價值更高吧 01/05 14:21
agag5123: 即使當下這區放掉會損一些 也比不過另一區先下得的收穫 01/05 14:23
shinwind: 其實這一部分也是很有趣 01/05 14:24
agag5123: 人可能都要下到顯而易見才能判斷價值高低 機器則看的早 01/05 14:24
shinwind: 這完全是判斷格局的不同.沒下完 未必是損 01/05 14:25
agag5123: 所以才會出現許多不能理解的神之一手 01/05 14:25
shinwind: 如果這一手 不跟上.那區域的爭奪是損還是賺? 01/05 14:25
shinwind: 局勢判斷上差太多了.(還不是形勢.形勢偏區域 01/05 14:26
sarspieya521: 光沒有情緒這點來講 真的很可怕 01/05 14:36
agag5123: 如果可以看狗對狗的棋譜 感覺會很可怕 01/05 14:38
agag5123: 一直維持在勝率50左右的宏局作戰 不知道長得怎樣 01/05 14:40
tsming: 感覺該跪舔天網了XD 01/05 14:46
grandzxcv: 我看出人類對宇宙百害無一利,所以該毀滅人類 01/05 14:49
weltschmerz: 所以新版的有出PAPER了嗎? 我上次看的那篇有用到 01/05 14:50
opmina: 兩個ai的差異蠻有趣的 01/05 14:50
weltschmerz: 人類經驗做落點預測 01/05 14:51
tsubasawolfy: 今天的Nature沒有 只有新聞快報看看下禮拜吧 01/05 14:57
davidyang1: 我的看法跟你不一樣 01/05 15:10
lugiam: 有那個版面對這個議題有深入討論嗎 想拜見一下 01/05 15:31
jupto: 看起來目前的狗狗沒有針對對手個體行為做預測與調整 01/05 15:37
jupto: 也就是不管給他誰當對手他的思考方式都一樣 01/05 15:39
jupto: 如果未來要出專門玩猜拳的狗狗 應該就會發展出個體行為分析 01/05 15:40
jupto: 與預測的狗狗了 01/05 15:40
z101924512: 換句話說,狗已經領悟圍棋本質,根本不在乎對手.... 01/05 15:42
z101924512: 好像更厲害... 01/05 15:43
jupto: 這要看人 有人覺得下棋重在兩個人之前的互相影響 01/05 15:46
jupto: 如何打亂對方的節奏 如何不被對方打亂節奏 01/05 15:46
jupto: 但是狗狗就只是在想怎麼放子可以贏 01/05 15:47
moonlind: 究竟是從哪裡流出:這個AlphaGO是完全自我對弈出來的 01/05 16:09
moonlind: 官方也只說新版 甚至沒講如何新版 怎麼腦補的? 01/05 16:09
moonlind: 去年三月 AlphaGO就有過跳脫思維演出了 你也無法否定 01/05 16:10
moonlind: 他在一年的時間內 透過自我對弈 又刪除了不少人類棋譜的 01/05 16:11
moonlind: 可能性啊 01/05 16:11
goenitzx: 那AlphaGO2只要跟AlphaGO1對弈練習... 01/05 16:12
zseineo: 從新版那個字眼聯想出來的,沒有正式說法 01/05 16:19
davidpanda: 可是自我對弈的棋譜也是從上一版的AlphaGo來的吧? 01/05 16:19
davidpanda: 所以多少還是需要採用人類棋手的智慧? 01/05 16:20
davidpanda: 不太相信他們可以從全部隨機開始train出這版alphaGo.. 01/05 16:20
Justice5566: 訓練方式是go板看到的陸聞寫的 姑妄聽之吧 01/05 16:23
orion: 因為去年Google有說下一版的將會是自我對奕出來的版本 01/05 16:26
orion: 所以才會這樣說吧 01/05 16:26
orion: 人類的棋譜也是上千年棋局累積出來的 01/05 16:27
orion: 可是電腦自己下,可能幾個月就能累積出人類上千年的量 01/05 16:27
orion: 從而形成自己的棋譜 01/05 16:27
moonlind: 但是圍棋wiki上寫的歷史 最早圍棋跟現在好像布一樣 01/05 17:29
moonlind: 不知道現代圍棋 大概算是幾年的歷史 01/05 17:30
gemini2010: 圍棋真的太奧妙,可惜相較之下西方不夠盛行,想看東西 01/05 18:00
gemini2010: 方各種天才的比拼 01/05 18:00
shinwind: 樓上 不需要了.接下來讓ai帶著大家前進 01/05 18:09
goenitzx: 以後圍棋賽變成電腦拼電腦 人類會看熱鬧可是都看不懂XD 01/05 18:57
a127: 西洋棋被征服之後還是有職業棋賽阿 01/05 18:59
octopus4406: 簽名檔我笑了 01/05 23:49