看板 GO 關於我們 聯絡資訊
※ 引述《shehrevar (阿浩)》之銘言: : 1. 這五局質感 3>2>4>5>1 : 第三局的象飛,往上跳一手的大局觀,第二局的五路尖沖,相信可以給人類帶來新思想 : 2. AlphaGo的實力>>小李 : 第四局就不說了,電腦算不到這手整個就爛掉之外,其他四局從頭領先到尾 : 李世石完全無任何機會,以最後一局來說好了,AlphaGo官子並不出色 : 我想AlphaGo的"國際禮儀"應該表現得很好,有種不要贏太多的感覺,贏了就好 : 縱使事後研究應該要怎樣怎樣,對AlphaGo都一樣,世界第三實至名歸(暫時) : 3. AlphaGo先交換定型 : 初期來看真的是完全浪費劫財,(之前第二局小目下拖定石刺一個配合5路尖沖完美) : 右下角的交換在收官的時候卻派上用場,這或許之後下也一樣,但是對於之後戰鬥 : 我不覺得有那裡損失 : 4. AlphaGo打劫 : 就如眾高手說的,能不打則不打,減少變化,但好像真的要下出打劫是多麼難的事情 : 平常打劫隨處可見,對上AlphaGo就幾乎完全消失,值得研究,也呼應第三點 : 既然不打劫,何不趕快定型好,省得日後應手有變 : 5. AlphaGo進化 : 想知道如果拿出最佳勝率點以及最佳目數點的話,可以讓人類幾目,我猜可以兩子 我認為對手是電腦 能抓到演算法的破綻就很夠了 以電玩來說 玩家打電玩一開始會狂輸好幾場 但總是有些玩家一開始吃虧 後來抓到魔王AI的BUG 從這BUG衍伸出許多攻擊策略 過幾天開始就已經打倒魔王 到最後則是挑戰無損血K.O.魔王 另外有沒有聽過打不倒的空氣人這首歌? 為何該玩家打不倒空氣人 為何專版會有一堆人會說空氣人很弱 為何網路上有一堆無損血KO空氣人的play 有沒有針對電腦AI的BUG作攻擊策略 我想是人類戰勝AI的重要關鍵 這種通常要練習幾百場 一旦抓到攻擊策略 電腦就等著吃鱉 我認為李世石才玩五場就抓到AI之弱點 一旦玩個幾百場 阿發狗還用混嗎? 看程式設計者賽後心情有點不好 可能是該玩家玩五場就抓到弱點後 如果給其他玩家對奕 會衍伸出一些針對阿發狗的策略 到最後連普通玩家都能幹掉阿發狗 那就很不好了 題外話: 有跟星海爭霸2的AI打過 一開始打也都是絕望 正面根本不能贏電腦 後來嘗試用快攻與偷襲 並觀察電腦AI的習性 大約三十幾場後 殘酷的電腦就變肥料了 我認為要給李世石多玩幾場 說不定情況會大不相同 一點淺見 其實我看李輸 還蠻難過的 希望人類不會輸給電腦AI -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 115.165.255.87 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458047287.A.EBF.html
wahdee: 深藍也只敢偷襲一次 而且是由人作最後決策 ( ′-`)y-~ 03/15 21:12
scju: 照你這樣講,人類會進步,電腦難道就不會自我學習進步嗎? 03/15 21:12
pikachu2421: 但是AlphaGo還會再改進 進化 03/15 21:12
scju: 幾個月後再來,阿爾發GO就更厲害了啊。 03/15 21:13
這真的要看當時改的是怎樣 但會不會產生另一種BUG 也是有可能的 人類就盡力吧 我記得SC2的AI也有學習能力 但我換進攻策略 又開始狂電它 接著此AI攻擊策略又變成以前的樣子 你真的認為AI有進步嗎? ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:14:18 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:16:45
Atropos0723: 這樣分析的前提是阿法真有運算架構上的BUG 03/15 21:16
birdy590: 李世石的格局顯然不只這樣而已, 不然 G5 不會自願拿黑棋 03/15 21:17
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:18:09
LaPass: 請問,第五局不是本來就是李拿黑嗎? 03/15 21:18
LaPass: 我一直搞不清楚自願拿黑是怎麼回事 03/15 21:19
Atropos0723: 但是現在的消息來看,是演算資源限制它捨棄機率過小 03/15 21:19
李自己要求拿黑 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:19:31
zelkova: 無傷過空氣人是運氣吧 那個龍捲風是隨機的 03/15 21:19
Atropos0723: 的棋步,換句話說下快棋就是他的罩門 03/15 21:20
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:21:20
LaPass: 是每次開始都會先猜子,但是第五局李表示想拿黑這樣嗎? 03/15 21:20
LaPass: 還是照順序,李應該拿白,但是裡要求拿黑? 03/15 21:20
birdy590: 按規則第五盤要重新猜先, 但是李世石想拿黑 雙方協調OK 03/15 21:20
LaPass: 原來如此,了解了 03/15 21:21
birdy590: 不是在棋盤上真劍勝負, 就沒有那種氣魄了 03/15 21:22
aaaba: 當場猜對李不利啊 03/15 21:22
shehrevar: 這算抓到弱點嗎?google辦這比賽的目的就是要找到這bug 03/15 21:22
寫過演算法的程式 一旦為了解決一個BUG 有可能整個演算法整個改掉 也有可能讓整個電腦的AI變得不協調 總之這是個麻煩問題 看GOOGLE怎麼解決吧@@ 我也不敢說GOOGLE解決不了 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:25:43
shehrevar: 如果電腦有選到這手,第四局一樣GG~ 03/15 21:24
shehrevar: 當然能讓電腦忽略這手小李也是威猛沒錯 03/15 21:24
DemonElf: 原PO提到星海有學習的能力是學玩家的而不是"自我學習" 03/15 21:31
已改 感謝 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:31:56
DemonElf: Alphago的演算計往跟以往AI的窮舉方式都是有所不同的 03/15 21:31
DemonElf: 他是因應圍棋算不完那就在有限時間內盡可能算出最大勝率 03/15 21:32
DemonElf: 也就是說當然也會有他算不完而輸的可能,比方說Google自 03/15 21:33
DemonElf: 己就有提到連線的分散式Alphago對單機Alphago勝率約7成 03/15 21:33
如果你對付電腦有A、B、C、D招 其中A、B、C招都是對目前電腦AI策略有效 但D招無效 假如有一天AI發現一個對A、B、C招都有效的方法 而改變自己AI 偏偏此時D招剛好是目前電腦的破綻 此時電腦該如何適應? 這種例子 在人類的學習上也是常常遇到的 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:38:46
chang505: 你一定不是寫程式的,有人幫忙抓到bug有多爽 03/15 21:34
DemonElf: 觀察起來Google其實很有心測試Alphago的演算能力,除了 03/15 21:34
DemonElf: 比賽前就停掉Alphago的學習(也就是這五場都是同一版本) 03/15 21:35
DemonElf: 細心一點的人就會發現Alphago並沒有特別分配時間再把運 03/15 21:36
DemonElf: 算在時間明明還很充裕的情況下再多算一點 03/15 21:37
jpg31415926: Google花了錢當然希望有成效阿 贏了出名 輸了抓蟲 03/15 21:38
jpg31415926: 怎樣都不虧阿 03/15 21:38
這種事難說 萬一解決不了 會對不起投資者 如果是我的話當然想一勞永逸 只是是不可能的
DemonElf: Google應該是為了確認演算法的極限所以還自主設了一些運 03/15 21:38
DemonElf: 算時間(/次數?)限制 03/15 21:38
jpg31415926: 結果現在贏了又抓蟲 算是賺了 03/15 21:38
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:40:10
DemonElf: 真的,這次大賽對雙方來說都是很寶貴的收穫 03/15 21:40
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:42:00
DemonElf: 建議原PO去Google一下"深度學習"的文章多了解一下 03/15 21:42
我早就有看過了 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:43:37
DemonElf: Alphago很有價值的一點就是他能"自我對奕" 03/15 21:43
DemonElf: 也所以他能一定程試自主修正原本的水準 03/15 21:44
LaPass: 樓上,答案是不一定。 03/15 21:45
DemonElf: Alphago從去年約六段職業棋手的實力提升到現在能贏九段 03/15 21:46
DemonElf: 就是突顯深度學習的價值 03/15 21:46
LaPass: 有些先天的決策問題是要去修程式碼才能解決的,例如不是走 03/15 21:47
LaPass: 最佳棋步,而是走勝率最高的棋步之類的。這會導致中盤贏 03/15 21:48
DemonElf: 我說明的並不是Alphago是完美的啊,完美的話就不會輸了 03/15 21:48
LaPass: 50目,最後只贏2.5目這種狀況。 03/15 21:49
LaPass: 這主要是蒙地卡羅看的是勝率,而不是贏棋數的原因。 03/15 21:49
LaPass: 也就是說對狗狗而言,贏0.5目跟贏55.5目是一樣的。 03/15 21:50
LaPass: 所以在大優勢的狀況下會一直送,因為他覺得勝率差不多。 03/15 21:50
DemonElf: 要我來說的話,這不叫BUG,而是數學,這結果代表以勝率 03/15 21:50
LaPass: 然後,輸太多的話,像第四局,會想要一口氣贏二十幾目回來 03/15 21:51
DemonElf: 為優先的演算法還是很有調整空間 03/15 21:51
LaPass: ,而不是跟人類一樣,一點一點的追回來,等對方失誤時在超 03/15 21:52
LaPass: 越 03/15 21:52
DemonElf: 在看這幾局總覺得很多人會把下好下壞都看得太偏 03/15 21:52
LaPass: 這不算是BUG沒錯啊,因為指定ai的目標是贏棋就好,不是追 03/15 21:52
LaPass: 求贏最多。 03/15 21:53
DemonElf: 回歸到人跟人下棋時,之所以有輸贏不也是因為好手與失誤 03/15 21:53
DemonElf: 的統合結果,但是放到人機對戰就好像失誤就都不正常了 03/15 21:54
DemonElf: 只要圍棋還是"算不完",那麼永遠就只會有較佳而不是完美 03/15 21:55
DemonElf: 解,而且也有新聞提到開始有高段棋手試著採用Alphago的 03/15 21:56
DemonElf: 的勝率流概念、而且還下贏了,這代表的是這樣的演算技術 03/15 21:57
DemonElf: 不僅是展現了科學上的價值,也可以幫他所涉及領域突破原 03/15 21:58
DemonElf: 本的經驗框架再求精進 03/15 21:58
我覺得這五場阿發狗贏了就是贏了 李世石都下不贏了 就看GOOGLE願不願意接受日本棋院與中國棋院的挑戰 ※ 編輯: wnglon (115.165.255.87), 03/15/2016 22:00:44
birdy590: G4 那一連串異常只能視為 bug... 一步沒算到不是問題 03/15 22:01
birdy590: 但是接下來連續幾步繼續送棋. 是不應該發生的 03/15 22:02
birdy590: (完全不用估值網路的 Darkforest, 在這裡是沒有問題的) 03/15 22:02
birdy590: 電腦也不會"想要一口氣贏二十幾目" 因為它根本不會"想" 03/15 22:03
LaPass: 好吧,那改成他計算要追上20目的方法 03/15 22:05
shehrevar: 配合AlphaGo選點,官子給人收的話,贏10目以上沒問題 03/15 22:07
birdy590: 它養的小小兵棋力本來就不強啊, 估值網路看起來是有效 03/15 22:08
birdy590: 但還不夠穩定... 官子的異狀跟這個很可能也有關係 03/15 22:09
birdy590: 有很多參數可以調整, 所以這次和一流高手的實戰極為寶貴 03/15 22:09
goldduck: 配合狗狗選點 給人下跟收官 20目也不難 03/15 22:14
birdy590: 的確是如此 下到一半交給其它人類九段關門 應該是穩贏的 03/15 22:20
birdy590: 所以目前人類的確還是有比它強的地方 聶衛平的觀察蠻準 03/15 22:20
birdy590: 要在中盤壓過它得表現完全才有可能, 一點錯誤都不能犯 03/15 22:21
birdy590: 表現完"美" 03/15 22:21
imperfectJJT: 會只走同樣套路就不是頂尖工程師們打算構築出的AI 03/15 22:37
我還是想說 人類還是可以學電腦下法 電腦下三千萬盤的結果 人學個一千盤就了解大致上的方法也說不定 電腦深度學習技術我認為還是有瓶頸的一天 講的無窮無盡反而像是說大話
yamiyodare: 官子是算目的世界, AlphaGo 還在算勝率下起來自然怪. 03/15 22:37
yamiyodare: 還有一個可能是勝率 100% 的路太多, 但不知哪個贏得多 03/15 22:38
yamiyodare: 看起來就不會是最佳手順, 而是隨便選一條走. 03/15 22:38
yamiyodare: AlphaGo 可能要稍微落後, 才看得出收官的實力. 03/15 22:40
imperfectJJT: 阿Go若改版成在N手後開始算局部的權重加重應該更猛? 03/15 22:40
Ebergies: 勝率 100% 的路太多 <= 這個蠻有可能的 03/15 22:44
※ 編輯: wnglon (115.165.255.87), 03/15/2016 22:59:19
imperfectJJT: 我覺得當人類必須開始去理解AI的思路並且從AI學習 03/15 23:08
imperfectJJT: 進步 新的紀元就已經開始了 而且學完後AI還是沒輸你 03/15 23:10
mothertime: 第五局原訂猜先,是李在第四局後要求執黑挑戰 03/15 23:13
imperfectJJT: 覺得官子收不好 可能是因阿Go雖然損 但覺得後續對手 03/15 23:17
imperfectJJT: 能使對勝率的變化較少才那樣走 代表著白其實贏更多 03/15 23:20
birdy590: 現在這個演算法 實質上靠的還是暴力運算 所謂的學習能力 03/15 23:22
birdy590: 只是增強計算效率的輔助措施罷了, 學習可以做出"棋感" 03/15 23:23
birdy590: 但是做不出計算能力... 03/15 23:24
DemonElf: 有一篇是Facebook研究員解析Alphago的文章可以看看 03/15 23:42
DemonElf: http://goo.gl/gIikTa 03/15 23:42
bbbtri: 樓上那個連結已經出現過好多次啦 03/15 23:45
DemonElf: 但顯然還是有很多人沒看過啊(比方說原PO)XD 03/15 23:46
DemonElf: facebook這篇文章有一個重點就是調整不同的演算比重是會 03/15 23:50
DemonElf: 影響下出來的品質或勝率,也就是越了解就越可以了解AI也 03/15 23:52
DemonElf: 是在有限運算下盡可能尋求勝利但還是有其極限的最佳化統 03/15 23:54
DemonElf: 合成果,只要電腦技術還是沒有能力完全算完圍棋,理論上 03/15 23:55
DemonElf: 就不會有完美解 03/15 23:56
DemonElf: 但他若能贏下多數棋局,這就是棋力的展現了,不是嗎? 03/15 23:57
steve1012: 我也覺得很多人沒看懂那篇文章 03/16 01:08
MicroB: 用個簡單比喻 電腦靠速算的三段網路勝率做了一個數值解的 03/16 03:18
MicroB: fit 人用各式各用不精確地棋理近似 做了一個理論解 你理論 03/16 03:19
MicroB: 解要更優 棋理的精細度得提升 就可以贏了 03/16 03:20
你講得太理想 實際上沒能不能做到都是未知數 最後兩盤給我感覺 人類還是有戰勝的可能 就這樣 不要說我有沒有看文章 我有看過了 但沒看到阿發狗實際表現完美的一面 半年後人類是否還能戰勝ai 我還是持保留態度 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 04:58:37 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:30:44 ※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:44:44
lolylolyosu: 因為我在第二場結束後 就對黃士偉提出了阿發狗的弱點 03/16 08:30
lolylolyosu: 啦 其實阿發狗弱在"一分鍾的情況下" 征子和收官 03/16 08:30
lolylolyosu: 電腦反而強在前.中期 因為佈局可以避開征子 大概是這 03/16 08:30
lolylolyosu: 個理由 03/16 08:30