→ wahdee: 深藍也只敢偷襲一次 而且是由人作最後決策 ( ′-`)y-~ 03/15 21:12
→ scju: 照你這樣講,人類會進步,電腦難道就不會自我學習進步嗎? 03/15 21:12
→ pikachu2421: 但是AlphaGo還會再改進 進化 03/15 21:12
→ scju: 幾個月後再來,阿爾發GO就更厲害了啊。 03/15 21:13
這真的要看當時改的是怎樣 但會不會產生另一種BUG
也是有可能的 人類就盡力吧
我記得SC2的AI也有學習能力
但我換進攻策略
又開始狂電它
接著此AI攻擊策略又變成以前的樣子
你真的認為AI有進步嗎?
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:14:18
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:16:45
推 Atropos0723: 這樣分析的前提是阿法真有運算架構上的BUG 03/15 21:16
→ birdy590: 李世石的格局顯然不只這樣而已, 不然 G5 不會自願拿黑棋 03/15 21:17
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:18:09
推 LaPass: 請問,第五局不是本來就是李拿黑嗎? 03/15 21:18
→ LaPass: 我一直搞不清楚自願拿黑是怎麼回事 03/15 21:19
推 Atropos0723: 但是現在的消息來看,是演算資源限制它捨棄機率過小 03/15 21:19
李自己要求拿黑
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:19:31
→ zelkova: 無傷過空氣人是運氣吧 那個龍捲風是隨機的 03/15 21:19
→ Atropos0723: 的棋步,換句話說下快棋就是他的罩門 03/15 21:20
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:21:20
→ LaPass: 是每次開始都會先猜子,但是第五局李表示想拿黑這樣嗎? 03/15 21:20
→ LaPass: 還是照順序,李應該拿白,但是裡要求拿黑? 03/15 21:20
推 birdy590: 按規則第五盤要重新猜先, 但是李世石想拿黑 雙方協調OK 03/15 21:20
→ LaPass: 原來如此,了解了 03/15 21:21
→ birdy590: 不是在棋盤上真劍勝負, 就沒有那種氣魄了 03/15 21:22
→ aaaba: 當場猜對李不利啊 03/15 21:22
→ shehrevar: 這算抓到弱點嗎?google辦這比賽的目的就是要找到這bug 03/15 21:22
寫過演算法的程式
一旦為了解決一個BUG 有可能整個演算法整個改掉
也有可能讓整個電腦的AI變得不協調 總之這是個麻煩問題
看GOOGLE怎麼解決吧@@
我也不敢說GOOGLE解決不了
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:25:43
→ shehrevar: 如果電腦有選到這手,第四局一樣GG~ 03/15 21:24
→ shehrevar: 當然能讓電腦忽略這手小李也是威猛沒錯 03/15 21:24
推 DemonElf: 原PO提到星海有學習的能力是學玩家的而不是"自我學習" 03/15 21:31
已改 感謝
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:31:56
→ DemonElf: Alphago的演算計往跟以往AI的窮舉方式都是有所不同的 03/15 21:31
→ DemonElf: 他是因應圍棋算不完那就在有限時間內盡可能算出最大勝率 03/15 21:32
→ DemonElf: 也就是說當然也會有他算不完而輸的可能,比方說Google自 03/15 21:33
→ DemonElf: 己就有提到連線的分散式Alphago對單機Alphago勝率約7成 03/15 21:33
如果你對付電腦有A、B、C、D招
其中A、B、C招都是對目前電腦AI策略有效 但D招無效
假如有一天AI發現一個對A、B、C招都有效的方法
而改變自己AI
偏偏此時D招剛好是目前電腦的破綻
此時電腦該如何適應?
這種例子 在人類的學習上也是常常遇到的
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:38:46
推 chang505: 你一定不是寫程式的,有人幫忙抓到bug有多爽 03/15 21:34
→ DemonElf: 觀察起來Google其實很有心測試Alphago的演算能力,除了 03/15 21:34
→ DemonElf: 比賽前就停掉Alphago的學習(也就是這五場都是同一版本) 03/15 21:35
→ DemonElf: 細心一點的人就會發現Alphago並沒有特別分配時間再把運 03/15 21:36
→ DemonElf: 算在時間明明還很充裕的情況下再多算一點 03/15 21:37
→ jpg31415926: Google花了錢當然希望有成效阿 贏了出名 輸了抓蟲 03/15 21:38
→ jpg31415926: 怎樣都不虧阿 03/15 21:38
這種事難說 萬一解決不了 會對不起投資者
如果是我的話當然想一勞永逸 只是是不可能的
→ DemonElf: Google應該是為了確認演算法的極限所以還自主設了一些運 03/15 21:38
→ DemonElf: 算時間(/次數?)限制 03/15 21:38
→ jpg31415926: 結果現在贏了又抓蟲 算是賺了 03/15 21:38
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:40:10
→ DemonElf: 真的,這次大賽對雙方來說都是很寶貴的收穫 03/15 21:40
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:42:00
推 DemonElf: 建議原PO去Google一下"深度學習"的文章多了解一下 03/15 21:42
我早就有看過了
※ 編輯: wnglon (115.165.255.87), 03/15/2016 21:43:37
→ DemonElf: Alphago很有價值的一點就是他能"自我對奕" 03/15 21:43
→ DemonElf: 也所以他能一定程試自主修正原本的水準 03/15 21:44
推 LaPass: 樓上,答案是不一定。 03/15 21:45
→ DemonElf: Alphago從去年約六段職業棋手的實力提升到現在能贏九段 03/15 21:46
→ DemonElf: 就是突顯深度學習的價值 03/15 21:46
推 LaPass: 有些先天的決策問題是要去修程式碼才能解決的,例如不是走 03/15 21:47
→ LaPass: 最佳棋步,而是走勝率最高的棋步之類的。這會導致中盤贏 03/15 21:48
→ DemonElf: 我說明的並不是Alphago是完美的啊,完美的話就不會輸了 03/15 21:48
→ LaPass: 50目,最後只贏2.5目這種狀況。 03/15 21:49
→ LaPass: 這主要是蒙地卡羅看的是勝率,而不是贏棋數的原因。 03/15 21:49
→ LaPass: 也就是說對狗狗而言,贏0.5目跟贏55.5目是一樣的。 03/15 21:50
→ LaPass: 所以在大優勢的狀況下會一直送,因為他覺得勝率差不多。 03/15 21:50
推 DemonElf: 要我來說的話,這不叫BUG,而是數學,這結果代表以勝率 03/15 21:50
→ LaPass: 然後,輸太多的話,像第四局,會想要一口氣贏二十幾目回來 03/15 21:51
→ DemonElf: 為優先的演算法還是很有調整空間 03/15 21:51
→ LaPass: ,而不是跟人類一樣,一點一點的追回來,等對方失誤時在超 03/15 21:52
→ LaPass: 越 03/15 21:52
→ DemonElf: 在看這幾局總覺得很多人會把下好下壞都看得太偏 03/15 21:52
→ LaPass: 這不算是BUG沒錯啊,因為指定ai的目標是贏棋就好,不是追 03/15 21:52
→ LaPass: 求贏最多。 03/15 21:53
→ DemonElf: 回歸到人跟人下棋時,之所以有輸贏不也是因為好手與失誤 03/15 21:53
→ DemonElf: 的統合結果,但是放到人機對戰就好像失誤就都不正常了 03/15 21:54
→ DemonElf: 只要圍棋還是"算不完",那麼永遠就只會有較佳而不是完美 03/15 21:55
→ DemonElf: 解,而且也有新聞提到開始有高段棋手試著採用Alphago的 03/15 21:56
→ DemonElf: 的勝率流概念、而且還下贏了,這代表的是這樣的演算技術 03/15 21:57
→ DemonElf: 不僅是展現了科學上的價值,也可以幫他所涉及領域突破原 03/15 21:58
→ DemonElf: 本的經驗框架再求精進 03/15 21:58
我覺得這五場阿發狗贏了就是贏了 李世石都下不贏了
就看GOOGLE願不願意接受日本棋院與中國棋院的挑戰
※ 編輯: wnglon (115.165.255.87), 03/15/2016 22:00:44
推 birdy590: G4 那一連串異常只能視為 bug... 一步沒算到不是問題 03/15 22:01
→ birdy590: 但是接下來連續幾步繼續送棋. 是不應該發生的 03/15 22:02
→ birdy590: (完全不用估值網路的 Darkforest, 在這裡是沒有問題的) 03/15 22:02
→ birdy590: 電腦也不會"想要一口氣贏二十幾目" 因為它根本不會"想" 03/15 22:03
推 LaPass: 好吧,那改成他計算要追上20目的方法 03/15 22:05
推 shehrevar: 配合AlphaGo選點,官子給人收的話,贏10目以上沒問題 03/15 22:07
→ birdy590: 它養的小小兵棋力本來就不強啊, 估值網路看起來是有效 03/15 22:08
→ birdy590: 但還不夠穩定... 官子的異狀跟這個很可能也有關係 03/15 22:09
→ birdy590: 有很多參數可以調整, 所以這次和一流高手的實戰極為寶貴 03/15 22:09
→ goldduck: 配合狗狗選點 給人下跟收官 20目也不難 03/15 22:14
→ birdy590: 的確是如此 下到一半交給其它人類九段關門 應該是穩贏的 03/15 22:20
→ birdy590: 所以目前人類的確還是有比它強的地方 聶衛平的觀察蠻準 03/15 22:20
→ birdy590: 要在中盤壓過它得表現完全才有可能, 一點錯誤都不能犯 03/15 22:21
→ birdy590: 表現完"美" 03/15 22:21
→ imperfectJJT: 會只走同樣套路就不是頂尖工程師們打算構築出的AI 03/15 22:37
我還是想說 人類還是可以學電腦下法
電腦下三千萬盤的結果 人學個一千盤就了解大致上的方法也說不定
電腦深度學習技術我認為還是有瓶頸的一天 講的無窮無盡反而像是說大話
推 yamiyodare: 官子是算目的世界, AlphaGo 還在算勝率下起來自然怪. 03/15 22:37
→ yamiyodare: 還有一個可能是勝率 100% 的路太多, 但不知哪個贏得多 03/15 22:38
→ yamiyodare: 看起來就不會是最佳手順, 而是隨便選一條走. 03/15 22:38
→ yamiyodare: AlphaGo 可能要稍微落後, 才看得出收官的實力. 03/15 22:40
→ imperfectJJT: 阿Go若改版成在N手後開始算局部的權重加重應該更猛? 03/15 22:40
推 Ebergies: 勝率 100% 的路太多 <= 這個蠻有可能的 03/15 22:44
※ 編輯: wnglon (115.165.255.87), 03/15/2016 22:59:19
→ imperfectJJT: 我覺得當人類必須開始去理解AI的思路並且從AI學習 03/15 23:08
→ imperfectJJT: 進步 新的紀元就已經開始了 而且學完後AI還是沒輸你 03/15 23:10
→ mothertime: 第五局原訂猜先,是李在第四局後要求執黑挑戰 03/15 23:13
→ imperfectJJT: 覺得官子收不好 可能是因阿Go雖然損 但覺得後續對手 03/15 23:17
→ imperfectJJT: 能使對勝率的變化較少才那樣走 代表著白其實贏更多 03/15 23:20
推 birdy590: 現在這個演算法 實質上靠的還是暴力運算 所謂的學習能力 03/15 23:22
→ birdy590: 只是增強計算效率的輔助措施罷了, 學習可以做出"棋感" 03/15 23:23
→ birdy590: 但是做不出計算能力... 03/15 23:24
推 DemonElf: 有一篇是Facebook研究員解析Alphago的文章可以看看 03/15 23:42
→ bbbtri: 樓上那個連結已經出現過好多次啦 03/15 23:45
推 DemonElf: 但顯然還是有很多人沒看過啊(比方說原PO)XD 03/15 23:46
→ DemonElf: facebook這篇文章有一個重點就是調整不同的演算比重是會 03/15 23:50
→ DemonElf: 影響下出來的品質或勝率,也就是越了解就越可以了解AI也 03/15 23:52
→ DemonElf: 是在有限運算下盡可能尋求勝利但還是有其極限的最佳化統 03/15 23:54
→ DemonElf: 合成果,只要電腦技術還是沒有能力完全算完圍棋,理論上 03/15 23:55
→ DemonElf: 就不會有完美解 03/15 23:56
→ DemonElf: 但他若能贏下多數棋局,這就是棋力的展現了,不是嗎? 03/15 23:57
推 steve1012: 我也覺得很多人沒看懂那篇文章 03/16 01:08
推 MicroB: 用個簡單比喻 電腦靠速算的三段網路勝率做了一個數值解的 03/16 03:18
→ MicroB: fit 人用各式各用不精確地棋理近似 做了一個理論解 你理論 03/16 03:19
→ MicroB: 解要更優 棋理的精細度得提升 就可以贏了 03/16 03:20
你講得太理想 實際上沒能不能做到都是未知數
最後兩盤給我感覺 人類還是有戰勝的可能 就這樣 不要說我有沒有看文章
我有看過了 但沒看到阿發狗實際表現完美的一面
半年後人類是否還能戰勝ai 我還是持保留態度
※ 編輯: wnglon (49.214.35.100), 03/16/2016 04:58:37
※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:30:44
※ 編輯: wnglon (49.214.35.100), 03/16/2016 05:44:44
推 lolylolyosu: 因為我在第二場結束後 就對黃士偉提出了阿發狗的弱點 03/16 08:30
→ lolylolyosu: 啦 其實阿發狗弱在"一分鍾的情況下" 征子和收官 03/16 08:30
→ lolylolyosu: 電腦反而強在前.中期 因為佈局可以避開征子 大概是這 03/16 08:30
→ lolylolyosu: 個理由 03/16 08:30