推 andylin8707: 老大賺P幣不是這樣賺的阿 認真推 01/28 18:56
推 sky0302: 我看的第一盤和你的不一樣 哈哈 這盤我沒看到 01/28 19:03
順序確實有點錯誤XD 我調整一下
推 kd1523: 超認真的文啊 01/28 19:08
推 aaaba: 跟李世石下獎金有一百萬鎂,應氏杯才四十鎂,如果不是快棋 01/28 19:42
→ aaaba: ,李應該能贏,這個電腦弱點就是超一流的訓練棋譜不夠,大 01/28 19:42
→ aaaba: 部分的招法是透過中等棋手的譜訓練出來的,至於強項就是速 01/28 19:42
→ aaaba: 度快,打勺的機會低。 01/28 19:42
推 sky0302: 石頭又要狠撈一票了 上次500萬人民幣 這次100萬美金 01/28 19:45
推 aaaba: 柯潔不知心裡做何感想,一百萬鎂我也想賺啊,等下次搞不好 01/28 19:50
→ aaaba: 人類就賺不到了啊! 01/28 19:50
推 sky0302: 可以看新浪棋牌的新聞 普遍認為谷歌相當於業餘頂尖 01/28 20:13
覺得是新浪棋牌的朋友多數是棋迷,程度沒到。因為很多弈城九段,對它的評價都沒有說
很強的軟體,可能對於弈城有九段水平的,這軟體沒什太大威脅性吧。
推 sky0302: 突然想到如果下座子棋和還棋頭 不知道電腦會不會短路 哈 01/28 20:22
推 jackeikuo: 它學了 16 萬盤 KGS 6~9 段的棋路 01/28 20:27
→ jackeikuo: 如果把所有職業對戰譜都丟進去學不知會如何 01/28 20:28
推 sky0302: 小米說是衝段少年 李喆說是頂尖讓先倒貼 柯潔評價也很高 01/28 20:30
→ aaaba: 以現在mtcs這個AI的做法,讓子應該不影響人工智慧的發揮, 01/28 20:41
→ aaaba: 因為他其中第一塊核心是計算盤面雙方贏棋的機率,這邊雙方 01/28 20:41
→ aaaba: 盤面子數不一致不會造成任何問題。而另一個核心是篩選幾個 01/28 20:41
→ aaaba: 可以落子的位置讓第一核心來評論勝率,再選出最好的下,這 01/28 20:41
→ aaaba: 塊也跟讓不讓子關係不大。 01/28 20:41
→ aaaba: mcts 01/28 20:44
推 sky0302: 新浪說了 比賽真實性有問題 但也不排除谷歌隱藏實力 01/28 20:57
→ sky0302: 不過敢約戰石頭 感覺善者不來 來者不善 當然還是看好石頭 01/28 21:00
推 aaaba: 基本上nature期刊和google研究水平應該值得相信,至於歐陸 01/28 21:04
→ aaaba: 二段的水平到哪,那是那位仁兄的問題,研究人員圖的就是他 01/28 21:04
→ aaaba: 那個歐洲冠軍的頭銜,先拿下一個里程碑打響自己的名聲何樂 01/28 21:04
→ aaaba: 不為。 01/28 21:04
推 sky0302: 那個歐洲冠軍都說了私下和谷歌有協議 反正到時就知道了 01/28 21:09
噓 ggoutoutder: 小李輸一盤我就一年不尻尻 01/28 21:09
→ aaaba: 私下協議可以理解啊,因為棋下完,paper還沒刊出啊,做研究 01/28 21:16
→ aaaba: 的最怕成果被其他競爭團隊搶先發表,即便你成果再好,只要 01/28 21:16
→ aaaba: 你不是第一個突破職棋障礙的,都有可能以創新元素不高而被 01/28 21:16
→ aaaba: 退稿。 01/28 21:16
→ aaaba: 況且是nature這個等級的期刊,如果其他團隊先發表個五戰三 01/28 21:20
→ aaaba: 勝的成果,你五戰五勝再來也沒用,只能摸摸鼻子乖乖去投其 01/28 21:20
→ aaaba: 他次級的小期刊吧 01/28 21:20
推 Seikan: 開賭盤的時刻又到啦! XD 01/28 21:28
推 staristic: 二月底開吧,讓我好好想想要怎賭 01/28 21:31
→ goldduck: 光是不失誤就強很多了 01/28 21:45
推 sky0302: 所謂協議 根據新浪報導 是指棋的內容上 反正很隱諱 01/28 22:03
→ sky0302: 不過感覺谷歌有點越級打怪 應該先正式比賽贏個孟泰齡之類 01/28 22:05
推 staristic: 有看到有人猜是不能下打劫的變化,感覺這猜測有像 01/28 22:06
→ aaaba: 我看新浪只有提到保密協議,這是要學術領域很常見的做法。 01/28 22:22
→ aaaba: 至於有沒有限定可不可以打劫,我認為如果論文沒寫修改了部 01/28 22:22
→ aaaba: 分遊戲規則卻暗地偷搞,是很沒道德的事,我是選擇相信作者 01/28 22:22
→ aaaba: 報告成果的誠信,否則人類最高等級的學術殿堂nature豈不是 01/28 22:22
→ aaaba: 淪為一本廢文集。 01/28 22:22
推 sky0302: 三月就知道了 如果出現什麼級位的失誤 就對石頭太失禮了 01/28 22:29
推 sky0302: 以後每年辦個谷歌杯宇宙圍棋最強人機對抗賽也不錯 哈哈 01/28 22:35
→ aaaba: 即使到時候有失誤,也無法用來否定目前戰勝歐冠的成就。即 01/28 22:40
→ aaaba: 使這個歐冠對棋界而言還不算一流,但拿來當個里程碑打打廣 01/28 22:40
→ aaaba: 告還是站得住腳的 01/28 22:41
→ sky0302: 敢向石頭挑戰 應該不至於有低級失誤 不然像瘋石對依田 01/28 22:45
→ sky0302: 下到官子變級位 就很冏 = = 01/28 22:45
推 maplefoxs: 如果不告訴我黑白分別是誰,我還以為電腦那方是職棋... 01/28 22:49
→ maplefoxs: 這職棋的下法也太僵硬了 01/28 22:49
推 sean51623: 解說不錯 01/28 22:55
推 yyhsiu: 每年舉辦應該不成立…應該某一年開始 電腦就會一直贏了 01/28 22:57
推 sky0302: 若只是模仿人類 那最多和人類頂尖並肩 圍棋虛的地方太多 01/28 23:04
推 tsai18: 歐洲冠軍明顯有讓 太複雜的情況都盡量避開了 01/28 23:20
推 yyhsiu: 或許觀念只能和人類並肩,但局佈計算力是人腦必輸的 01/28 23:23
→ aaaba: 策略上可以模仿人類,弱一點也無妨,在計算深度與廣度上大 01/28 23:23
→ aaaba: 贏,也是ai常幹的把戲 01/28 23:23
推 yyhsiu: 沒錯 極端來說,哪天電腦可以直接硬幹所有可能性 01/28 23:25
→ yyhsiu: 就很確定能贏了,可能連「正確」黑棋要貼多少目都算出來了 01/28 23:26
推 sky0302: 問題就是圍棋的局部計算是要服務全盤的 下九路的電腦必勝 01/28 23:27
→ sky0302: 把古往今來那些和全局有關的妙手來考電腦 不認為電腦能行 01/28 23:29
推 Rueyh: 看完覺得 不如我來下吧 01/28 23:42
推 aaaba: 你的質疑應該成立,但那應該就是因為全局有關的妙手在所有 01/28 23:44
→ aaaba: 用來訓練電腦的材料中猶如滄海一粟,被大量本手所掩蓋。但 01/28 23:44
→ aaaba: 別忘了這個ai可以自我精進,也就是某次他好死不死算出妙手 01/28 23:44
→ aaaba: ,他就拿這著妙手來修正自己的算路(reinforcement learning 01/28 23:44
→ aaaba: ),這種技術就“有機會”讓人吃土了,那個人有辦法自己跟自 01/28 23:44
→ aaaba: 己每天下幾萬盤棋,嚇死人了。 01/28 23:44
推 ztdxqa: 可以問一下原PO弈城八的水平是多少嗎?衝段少年? 5-0 這 01/29 00:25
→ ztdxqa: 比數實在有點懸殊 意思是弈城八的網友們都可以電歐洲冠軍 01/29 00:26
推 ztdxqa: 不知道板上有沒有職棋可以來說明一下這AI水準 01/29 00:29
先感謝各位熱烈的討論,因為我下午花了兩小時稍微看了下這五盤棋,加上自己本身棋力
水平並沒有到一定的程度,要檢討這些棋譜對我來說還是有點吃力的,但我相信如果是職
業棋士水平的棋手,我大概是沒辦法打出那麼長篇的想法的,因為漏洞有多得棋我才有辦
法講出這麼一長串的東西...
確實看完了,許多台灣業餘六段水平朋友,和小弟比較有在聊的朋友都會講出一句話,還
不如我來下吧XDD,其實我個人認為我上去和電腦下也不會被0:5被完封。但要說勝他,
我也沒絕對的把握在。畢竟水平退太多了,從小李輸棋後,我好像下什麼棋都可以輸... 囧
至於說弈城八段的朋友們可不可以贏這位"歐洲冠軍",我不敢確定,但我很肯定的是如果
我和這五盤棋的棋手,下五番,我認為我不會處於絕對性的敗北。在自信一點以前我的水
平,應該很有得下。
最後,如果開賭盤小李和這 AI 會幾比幾,我一定押 小李完封 AI。
推 sky0302: 小吳應該是樂觀型棋手 要我上 下番棋肯定贏不了 嗚嗚 01/29 00:50
→ sky0302: 圍棋TV有做即時節目討論 蠻多料的 感覺很有趣 01/29 00:52
→ sky0302: 我覺得電腦最強的還不是棋力 而是穩定性的絕對心理優勢 01/29 00:53
→ sky0302: 可以比做加強版的巔峰李昌鎬 以前很多棋手說還沒和大李下 01/29 00:54
→ sky0302: 就覺得已經輸了 也就是面對電腦 人類的心理負擔太大了 01/29 00:55
→ sky0302: 若論絕對棋力 我不相信有電腦可能能超越人腦 01/29 00:56
→ sky0302: 如果有一天 電腦真的一對一 徹底完敗世界最頂尖 01/29 00:59
→ sky0302: 那就來下加壓棋 不然對人類太不公平 01/29 01:00
推 sixersai: 看完只覺得很假 肯定有人下假棋 01/29 02:21
→ sean51623: 最開始看完之後 覺得電腦不太行 但其實是人類沒有逼出 01/29 02:26
→ sean51623: 電腦極限 我覺得電腦實力究竟到哪還值得商榷 01/29 02:26
推 jord: 看棋譜覺得電腦比我想像中的強...我應該下不贏 01/29 02:59
→ jord: 我覺得電腦可怕的地方在於他有可能跳脫一些框架 01/29 03:01
→ jord: 一般人則是會有很明顯的棋風與相對應的弱點 01/29 03:02
→ jord: 業餘高段的棋其實還是犯很多錯 如果電腦局部不犯錯 01/29 03:04
→ jord: 那其實就已經很可怕了 畢竟有些錯不是大局官可以彌補 01/29 03:04
推 BigShotBob: 還沒仔細研讀論文 不太知道電腦到底可以學到哪裡 01/29 03:25
→ BigShotBob: 但沒意外的話 這幾個月應該都在學職業棋士的棋譜吧@@ 01/29 03:26
→ BigShotBob: 看圍棋TV的解說去年10月他的實力水平大概在接近但未到 01/29 03:27
→ BigShotBob: 職業的水平 佈局弱 中盤官子強 當然這是以中國棋界的 01/29 03:29
→ BigShotBob: 標準 歐洲標準一定是職業級的了 台灣標準就不確定了 01/29 03:30
→ BigShotBob: 但不管怎麼說這個AI已經非常接近職業水準 跟Zen是完全 01/29 03:32
→ BigShotBob: 不同等級的生物啊 真可怕 期待三月的比賽 01/29 03:33
推 BigShotBob: 不過不得不說這Google實在是很會廣告XD 01/29 03:49
推 ddavid: 我沒去看其技術細節,但「好死不死算出一次妙手從此以後就 01/29 03:59
→ ddavid: 修正」這回事是不是容易發生可能還得細看技術細節 01/29 04:00
→ ddavid: 電腦的學習這回事其實跟人類的學習模式相差很大,相較於人 01/29 04:02
→ ddavid: 類下出一次妙手就有可能一直爽爽用到被破解或被證實為止, 01/29 04:02
→ ddavid: 電腦的學習除非你找很多專業棋手天天來跟它下棋,否則偶然 01/29 04:03
→ ddavid: 自己下出的妙手就我淺薄的知識來說其實成功學習的難度比起 01/29 04:04
→ ddavid: 人來說還是低很多 01/29 04:04
推 ddavid: 當然不是說不可能,因此才說需要看細節有沒有針對這方面做 01/29 04:07
→ ddavid: 設計 01/29 04:07
→ ddavid: 即便有採用reinforcement learning,如果沒有特殊設計還是 01/29 04:09
→ ddavid: 不容易學到偶然妙手的,特別是在它其實並不一定每次都能利 01/29 04:10
→ ddavid: 用此妙手發揮價值的情況下。我可以舉個簡單的例子讓就算不 01/29 04:12
→ ddavid: 懂機器學習的人也大略思考一下。 01/29 04:12
→ ddavid: 比較好的情況是有天電腦下出妙手贏了(或被判斷得到優勢) 01/29 04:13
→ ddavid: ,因此此妙手的成功與失敗是1:0。但大量的棋譜跟自我模擬 01/29 04:14
→ ddavid: 會看到很多的本手,假設某手是個60000:40000的成敗比好了 01/29 04:14
→ ddavid: 。你會比較信任哪一種下法呢?那個1:0你很容易就做出各種 01/29 04:15
→ ddavid: 質疑,60000:40000卻是千錘百鍊的結論。當然,人類的優勢 01/29 04:16
→ ddavid: 就在於可以靠靈感、熱血或某些不理性硬是去鑽研這一手,最 01/29 04:17
→ ddavid: 後發現這真的是個妙手。但電腦的運算雖快也不是無限的,它 01/29 04:17
→ ddavid: 學習或選擇的優先順序還是存在的,並且往往依賴大量的數據 01/29 04:18
→ ddavid: ,只出現一次的可能性在沒有特別設計或加入額外背景知識的 01/29 04:19
→ ddavid: 支持下,它還是相對不容易去優先考慮學這個東西的。 01/29 04:19
→ ddavid: 而且以上還是最佳情況,運氣不好時是下出了這個妙手但後續 01/29 04:20
→ ddavid: 並不太會利用,結果雖然下出了好幾次卻只是個2:2甚至1:3, 01/29 04:20
→ ddavid: 這反而導致更學不到的可能性也是存在的。因此如果沒有特殊 01/29 04:21
→ ddavid: 的設計,其實自我學出妙手這件事的期待性並不高。 01/29 04:21
→ ddavid: 呃......壞習慣又來了,不小心直接推文超過一頁......XD 01/29 04:22
→ aaaba: 我有看論文,自我對弈後會根據勝負微量修正類神經網路的權 01/29 04:24
→ aaaba: 重,中間若有妙手,大方向而言會反映在對局的結果上。而統 01/29 04:24
→ aaaba: 計上這種名為SGD的優化技術會讓訓練結果更好。並非一次出現 01/29 04:24
→ aaaba: 妙手就立刻學會,而是修正一點點而已。在機器學習這個領域 01/29 04:24
→ aaaba: 一筆訓練樣本不會起到決定性的效用,而是反覆累計可能數以 01/29 04:24
→ aaaba: 百萬計的經驗。 01/29 04:24
推 ddavid: 我的想法是說,新的(對應於已經學得差不多的部分)妙手太 01/29 04:31
→ ddavid: 少筆就會導致學不起來 + 就算靠大量自我模擬對局以亂數性 01/29 04:31
→ ddavid: 使妙手更容易出現,但也無法保證後續利用成功,有可能反而 01/29 04:32
→ ddavid: 埋沒妙手。我知道如果這個妙手在自我模擬大量出現,而且都 01/29 04:33
→ ddavid: 利用得相對成功當然是學得到的,這沒有問題。主要是在想說 01/29 04:33
→ ddavid: 除非有很特殊的設計,不然埋沒妙手的情況應該也不會是少數 01/29 04:34
→ ddavid: 情況,這會導致學到某個水準以後模型收斂,無法再靠自我模 01/29 04:35
→ ddavid: 擬對局再讓棋力往上,這種情況只有餵大量新的真實且更高段 01/29 04:36
→ ddavid: 的對局才有機會打破這個收斂結果再次往上。 01/29 04:37
→ aaaba: 我定義一下妙手:人類棋感(相對於alphaGo的policy network) 01/29 04:39
→ aaaba: 上不會去細算卻可得利的落子位置。而mtcs演算法就是有一定 01/29 04:39
→ aaaba: 機率會去算到冷門位置,假如塞到不錯的選點時,就等於偶然 01/29 04:39
→ aaaba: 下出妙手。 01/29 04:39
推 BigShotBob: 我覺得以目前這個演算法 光是用打敗歐冠的AI當成 01/29 04:42
→ BigShotBob: pretrain model 在大量輸入職業棋手的棋譜去學習 01/29 04:43
推 ddavid: 你有看了論文全文嗎?我只看了Abstract,就跟你說到的部分 01/29 04:43
→ aaaba: 的確是無法無限制長棋啊,不過百尺竿頭更進一步的效果是還 01/29 04:44
→ aaaba: 有的。 01/29 04:44
→ BigShotBob: (fine-tuning)就可以達到相當不錯的職業水平了 01/29 04:44
推 ddavid: 差不多,其實我主要就是在想MTCS到底埋沒妙手的情況比例會 01/29 04:45
→ BigShotBob: 當然隨機性跟那些learning rate的調配這就給最佳化專 01/29 04:46
→ ddavid: 有多高。高到一定程度會導致前中期學習很快,感覺不斷地變 01/29 04:46
→ BigShotBob: 家去搞就好了 在經過這些fine tuning過後 再用他們善 01/29 04:46
→ ddavid: 強,但後期收斂了就不會再算出新的東西,即便MCTS也無法讓 01/29 04:47
→ ddavid: 被捨棄的死去妙手重新被算回來了。 01/29 04:47
→ BigShotBob: 擅長的左右互搏術去強化 當然要到頂尖一定需要更強的 01/29 04:48
→ BigShotBob: 演算法 不過這又是一年後的事了吧 抱歉截斷好多回文 01/29 04:48
→ ddavid: 對對,我不是懷疑這個架構有往上學的能力,只是我不會認為 01/29 04:49
→ ddavid: MCTS的隨機性就足以讓這個學習有無限往上的能力,它還是會 01/29 04:50
→ ddavid: 落到Local Max裡面,只是好的方法可以落到更高的Max 01/29 04:50
→ aaaba: 同意樓上兩位的看法,每次看論文都會感嘆Google的人就是能t 01/29 04:52
→ aaaba: une出好的結果,自己就是一直鬼打牆… 01/29 04:52
→ ddavid: Abstract中有一句「Without any lookahead search」,這個 01/29 04:52
→ ddavid: 會有一些幫助,不過這評估函數就要更精妙了XD 01/29 04:53
→ ddavid: 事實上Without any lookahead search這件事正是Google的拿 01/29 04:54
→ ddavid: 手好戲,用資料量壓死你,誰管什麼細節背景知識這招XD 01/29 04:55
→ ddavid: 只是這邊評估函式要是只取最終勝負就一定會大量埋沒妙手, 01/29 04:56
→ ddavid: 所以我想精華會在他們的優劣評估方式了 01/29 04:57
→ aaaba: (其實那句話是指tree search,你講的似乎是domain knowledg 01/29 05:00
→ aaaba: e) 01/29 05:00
推 BigShotBob: 看新聞google會跟韓國棋手合作 感覺應該是可以拿到很 01/29 05:01
→ BigShotBob: 多實戰經驗 三月的比賽只是個起頭 未來兩三年才是重點 01/29 05:02
推 ddavid: 應該說,用背景知識去做search cut就會偏頗,所以他用完全 01/29 05:03
→ BigShotBob: 以google的實力說不定一年就搞定@@ 當初深藍好像也 01/29 05:03
→ aaaba: (他即使不用mcts,效果也還不錯,但混合mcts結果更好) 01/29 05:03
→ BigShotBob: 發展了好幾年的樣子 01/29 05:04
→ ddavid: 的MCTS能讓妙手出來的機會變多。可是這個問題會轉嫁到事後 01/29 05:04
→ ddavid: 評估某一手是否妙手上,結果是背景知識從不同的地方切入, 01/29 05:04
→ ddavid: 然後我覺得後者就是能「有機會」達到更高界限但是評估更難 01/29 05:05
→ ddavid: 這樣 01/29 05:05
→ ddavid: 不用MCTS就是徹底的從舊局學習對吧?MCTS我看起來就是提高 01/29 05:06
→ ddavid: 學習上限的手法,他們實際裡面有什麼技術細節我不知道當然 01/29 05:07
→ ddavid: 就沒辦法評論了XD 01/29 05:07
推 BigShotBob: 說不定第一作者Aja Huang也是鄉民 01/29 05:09
推 ddavid: XD 01/29 05:10
→ aaaba: 希望三月不要同時是起頭也是結尾,這樣屁股還沒坐熱戲就演 01/29 05:11
→ aaaba: 完了@@ 01/29 05:11
→ ddavid: 總之三月那戰還是可以期待的 01/29 05:11
→ ddavid: 是不看好直接能贏啦,就看下到什麼程度了 01/29 05:12
推 orze04: 連環劫 交換 不斷多處騷擾這些戰術或許有用? 01/29 06:50
→ orze04: 這五場奇怎看怎怪 雙方下得都很“平” 01/29 06:51
推 orze04: 甚至有點懷疑有作假 人類方有些棋部是連段位以下都不太可 01/29 06:54
→ orze04: 能會下出的 01/29 06:54
推 Vick753: 好猛 推個 01/29 08:49
推 ztdxqa: 該怎麼下就怎麼下 堂堂正正的 不用搞戰術最好 01/29 08:51
推 aaaba: 打亂局面會先考驗到自己的臨場計算能力,這電腦不會怕吧, 01/29 12:58
→ aaaba: 個人覺得佈局階段精心準備幾把飛刀會比較有效。 01/29 12:58
推 aaaba: 還沒看完棋譜,不曉得電腦對引征的敏感度有沒有學到位,這 01/29 13:20
→ aaaba: 比較像是人會特別去檢查但deep learning沒有特地處理的觀念 01/29 13:20
推 tsai18: 但3月才比 這近半年時間 電腦搞不好又強了不少 01/29 14:16
推 staristic: 蠻希望google開一個伺服器讓大家挑戰的,以google的能 01/29 14:56
→ staristic: 力,這應該是小菜一碟 01/29 14:57
→ aaaba: 研究人員會不會曾經偷偷放電腦到網棋上砍翻過幾個P,才來約 01/29 15:16
→ aaaba: 戰小李 01/29 15:16
推 angelsoul: 這篇不能不推 01/29 17:08
推 para123: 看完譜心得: 台灣有好幾千個世界冠軍 01/29 19:52
推 chaoyang: 原來是Aja 他應該是台灣六段 應該也是鄉民 01/29 21:09
※ 編輯: wukevinboy (124.218.70.54), 01/30/2016 08:04:49
推 Tabrith: 好文推 01/30 12:49
推 jerrysaikou: 推用心分析 由這譜看來李世石必勝 01/30 23:09
推 reflow: 目前看棋譜我覺得我能贏這個電腦,但不敢說絕對必勝~"~ 01/31 23:46
推 bearching: 請問如果以強化學習的系統來說,如果這個目前的這個AI 02/04 01:35
→ bearching: 程度,要是開放給大量新中手下或是輸入極大量新中手的 02/04 01:35
→ bearching: 譜,那這個AI理論上應該會變弱沒? 另外我想是否這個AI 02/04 01:35
→ bearching: 的弱點一樣在於劫爭跟棄子戰術的部分呢? 02/04 01:35
推 ddavid: 輸入大量新中手的棋譜會不會弱回來 → 看設計,如果沒有特 02/04 03:33
→ ddavid: 別設計確實有可能真的弱回來。 02/04 03:33
→ ddavid: 劫爭棄子是否較弱就交給比較了解AhphaGo細節的幾位來答XD 02/04 03:36
噓 Anbi: 結果臉都被打腫了 ㄏㄏ 03/22 11:04
推 jigger5566: 朝聖... 02/27 02:49