[心得] 期待東坡棋─寫在人機大戰2.0第二局賽前

作者librevie (平地有何可見)

看板GO

標題[心得] 期待東坡棋─寫在人機大戰2.0第二局賽前

時間Thu May 25 09:06:43 2017

小弟凌晨熬夜寫的文章，聊聊東坡棋的意義，還請大家多多指教。原文連結： http://www.goer.com.tw/edu/spe_details/34 窗外淅瀝瀝的雨聲，在不眠的夜深時分更添幾分孤寂。人機大戰首局，柯潔執黑落敗，他自己說「輸得沒有脾氣」。明天的第二局輪到柯潔執白，他會下出怎麼樣的棋局呢？去年AlphaGo和李世石的決戰，小李唯一獲勝的第四局即是拿白棋贏的；AlphaGo自我對弈的評估，也顯示現行的貼目規則下，執黑是比較辛苦的。這次的人機大戰2.0，柯潔已完全不被看好，但我想，還是有很多棋迷，對這第二局人類執白──懷著渺茫的一點希望。然而，我對於柯潔執白的期待不止於此。今年年初，AlphaGo化身Master在網路上的60盤測試棋，原本最後一盤是要由柯潔壓軸挑戰，後因他身體不適住院而改由古力代打，柯潔在微博上略有不甘地宣稱他原本有準備「秘密武器」。據悉，柯少俠當時所準備的絕招，即是「東坡棋」，也就是所謂的「模仿棋」。對於東坡棋，想必很多人乍聽都是嗤之以鼻的。不過，職業棋士的東坡棋，並不是只是一味地模仿，也不是為了激怒對手，更不會是懶得認真想、胡鬧一番。東坡棋的目的，說穿了，是為了先和對手戰成平手，等待適當地時機，再一舉變著、取得優勢。吳清源大國手當年第一次與木谷實對陣，便嘗試過東坡棋的下法，賽後兩人徹夜長談彼此對棋道的追求，更從此成為關係最緊密的好友。在Master的60盤棋中，紅面棋王周俊勳也有祭出東坡棋戰術。但是必須分辨的是，周九段用的是執黑先著天元，再模仿白棋的下法，吳清源當年對木谷也是執黑用東坡棋。不過卻有一天壤之別，就是現今的規則黑棋必須「貼目」了，故黑棋的東坡棋僅與白戰成平手是無法獲勝的，是以後來周九段中盤趕緊變招出擊，最終玉碎落敗。這樣看來，黑棋的東坡棋反而給自己莫大的壓力，預計「後動」，卻是「被動」了。然而，真正厲害的，是白棋的東坡棋。棋友可能會想，拿白棋還模仿黑棋，又有什麼差別？那黑棋不是下天元就好了嗎？奧妙正在於此，天元雖然處於棋盤的中心，理論上是最平衡的一個著點，但是在空蕩蕩的情況之下落子天元，由於棋盤中央尚缺少棋子配合，通常是難以發揮效用的。白棋模仿黑棋，在黑棋落子天元之前，是確實能與黑棋保持平手的局面的。進一步的關鍵則是，或在黑落子天元之前、或在之後，選擇一個恰當的時機變著，一舉讓棋子的效率超過對方，並努力維持到終局。必須貼目的既是黑棋，那白棋只要不被追上貼目，即可獲勝。不過，在AlphaGo這樣強大的對手面前，只要對圍棋稍有了解便不難想到的這個戰術，會有用嗎？在此，且讓我稍微岔個題，聊一下在過去下東坡棋最有名的棋手──藤澤朋齋。藤澤朋齋本名藤澤庫之助，是日本棋院歷史上的第一位九段，在原本應該屬於他的時代，因為在十番的舞臺上兩敗於吳清源，而黯然失色了。藤澤的東坡棋是非常有名的。他在三、四段的時候，就有「黑番不敗」的名聲，棋風穩重而厚實，但他當時執白的布局常常過緩，是以他便嘗試用東坡棋的策略。但是，在他登上九段的高位之後，甚至於在輸給吳清源、退出日本棋院，改名朋齋再回歸棋壇之後，他仍然持續不斷地嘗試東坡棋。這究竟是為什麼呢？江崎誠致在《昭和的棋》一書中，談到藤澤的東坡棋。他認為與其從圍棋的技術上去討論，不如想一想，藤澤在不同的階段、不同的處境下從一而終地堅持東坡棋的心態：世間是有這樣一種人的，他們儘管擁有創造財富的才能，卻能夠安於清貧。這些人之所以採取了這樣的生活態度，是因為他們覺悟到貧富並不是評判人生價值的標準。這個比方聽起來或許有些突兀，但我無法不認為，藤澤孜孜不倦地下模仿棋，就是在棋道上追求清貧。我認為，藤澤是在沒有個性的模仿棋中追求自我的個性。我相信肯定還是會有很多人覺得，這不過是在為「東坡棋」美化門面的說辭罷了。不過，這就是一種選擇。與吳清源、木谷實一樣，藤澤朋齋確實是屬於一心一意求道的性格，在吳清源的故事裡他雖然淪為配角，可是若從他本人的角度來看呢？他的一生都奉獻給圍棋，只有圍棋而已。他不可能不知道這樣的堅持，等於把「東坡棋」、「模仿棋」這個標記，深深地烙印在自己的身上。我們談起東坡棋，就想到藤澤朋齋，談起藤澤，也就想起東坡棋。這是他的選擇。說了這麼多，只是想說，東坡棋並不只有模仿，它確實也是求勝、求道上的一種選擇。它肯定不是一般人會欽佩、嚮往的一條路，甚至表面上看來無味且平庸，更必須擔負罵名，但是──蟄伏沉潛，等待時機，忍耐孤獨，你可以不贊成，但不能不認同，那是更艱難、更冒險的一個選擇。最後回到剛剛的問題：「會有用嗎？」大家都說肯定沒用，主要的論點是「DeepMind團隊一定想過應對方式」，但我覺得未必盡然，理由有三：第一，與其說DeepMind團隊一定想過應對方式，不如說他們一定「測試過」下東坡棋，但不見得有辦法、更不見得會在程式演算法中去干涉AlphaGo的深度學習選擇。那麼，即使黃士傑博士嘗試過和AlphaGo下東坡棋，他和柯潔的棋力不同，選擇變著的場合也必定不同，如何能肯定柯潔來下一定沒有效呢？第二，AlphaGo與人類不同，人類一看到東坡棋，便知曉了對手的意圖，並且開始謀畫如何盡量提高「天元」位置的重要性，利用下在天元來取得優勢。但AlphaGo 會有「原來你想跟我先戰成平手」的理解能力嗎？我想合理的推測是，它仍然會選擇經過計算，棋盤上效益最高的一手，直到「天元」成為那一手時，它才會下在天元，而不會主動去創造出使天元成為最重要一手的局面。第三，DeepMind的Demis Hassabis曾經在演講中透露，他們請樊麾測試過，若讓樊麾加上AlphaGo來對陣AlphaGo，也就是說，樊麾對局時大部分都採用AlphaGo自己的棋步，只有在覺得有更好的選擇時才出手變招，這樣是可以擊敗AlphaGo的。這代表的意義是，也許在序盤布局，人類難以像AlphaGo一樣掌握全局，但是在選擇局部最佳解的計算能力上，人類仍有一些優勢，畢竟AlphaGo永遠作的是全局的計算。綜言之，柯潔若選擇使用東坡棋，保持平手的局面，且真的能在適當時機下出更好的著手，那麼並非沒有可能「暫時取得些許優勢」；而即使這樣的優勢很微小，但人類的後半盤相對而言，也不是沒有機會避免失誤，保持這樣的優勢到終局。更何況，如果現行的貼目確實對黑棋更有負擔的話，那AlphaGo是否能夠在相對變化少的局面下搶到7.5目？仍然值得期待吧。如果AlphaGo真的能夠做到，那麼表面上平淡無趣的東坡棋，實際上也會是暗潮洶湧、錙珠必較、無比激烈的一場惡戰啊！這是我之所以，在大戰前夕如此期待東坡棋的原因。當然，承認AlphaGo優於全人類頂尖高手，已是不爭的事實。選擇東坡棋，我想已不只是追求棋道上的清貧，更是承認了人類千百年來積累的渺小，我們等於先認輸，同意AlphaGo的著點更好，然後等待。雨不停歇，道無止盡。在追求圍棋真理的道路上，我們並不孤獨。話說AlphaGo的自我對弈盤數，如今不曉得是多少？當初聽到的數字就已經是三千萬盤，這是任何人類窮極一生也無法達到的數字。但即使如此，AlphaGo大師也還沒有到達圍棋的盡頭。既然還沒到達，那就仍然值得我們嘗試吧。如果不嘗試東坡棋，或許也會是一個缺憾？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.251.187 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495674407.A.A89.html

推 xhakiboo: 雖然好像都是討論很多次了不過還是推推 05/25 09:16

推 bidodu: 頗適合在島內當記者 05/25 09:17

→ pmove: 吃東坡肉比較快 05/25 09:19

→ winall: 模仿棋我覺得可以私下玩,正式比賽玩模仿棋太不尊重 05/25 09:24

推 LeeSeDol: 還是2F的文章比較有舒壓功效 05/25 09:31

推 mathbug: 應該是最接近贏棋的策略了 05/25 09:34

→ goldduck: 不會用 05/25 09:40

→ AirOctopus: 原本不太希望模仿棋，因為不但不覺得有用，而且會少很 05/25 09:41

→ AirOctopus: 多精彩的棋步，但現在反而覺得還是下模仿棋好了XD 05/25 09:41

→ AirOctopus: 感覺說不定比較精彩，說不定可以產生大規模戰鬥 05/25 09:42

→ AirOctopus: 自然下根本就自然死了，還是模仿死好一點 05/25 09:43

推 sapc87952: Master對周俊勳就下過了雖然周是持黑 05/25 09:43

→ sapc87952: 持白下模仿棋根本沒機會不用想了 05/25 09:44

→ AirOctopus: 但我不同意模仿棋可以先"戰成平手"，我想像中是會產生 05/25 09:46

→ AirOctopus: 兩邊攻殺，然後天元附近先佔先贏，白棋無法先佔就掛了 05/25 09:47

推 shehrevar: 下模仿棋只能看到如何破解，看不到令人驚嘆的妙手了 05/25 09:48

→ sapc87952: 上面講錯是持黑模仿棋沒機會 05/25 09:49

→ AirOctopus: 或者Master也可能設計爭子，很多人覺得電腦邏輯差無法 05/25 09:50

推 kd1523: 推認真分享文 05/25 09:51

→ AirOctopus: 但所有對攻死活都是邏輯運算，電腦都能做到沒道理做不 05/25 09:51

→ AirOctopus: 到自然產生爭子破解 05/25 09:52

推 orze04: 看過alphago去年的那份論文我很懷疑他能理解長距離爭子 05/25 10:13

→ AirOctopus: 它不能處理爭子的話早就被殺爆很多次了 05/25 10:17

→ AirOctopus: 不會的話怎麼可能共下了71盤棋還沒被征子搞到 05/25 10:18

推 FacebookGO: 不要用懷疑(感覺) 自己去實作跑跑看所以谷歌科技才強 05/25 10:18

→ FacebookGO: 科技是講求實作成果的東西不希望台灣只擅長想像科技 05/25 10:20

推 LeeSeDol: 論文有寫nn第一層feature中就有兩個跟引征相關，不知道 05/25 10:24

→ LeeSeDol: 樓上某位自稱看過論文的如何評論？ 05/25 10:24

推 xhakiboo: 樓上這個有喔xD 05/25 10:32

推 orze04: 謝謝了是我看得不完全 05/25 10:41

推 orze04: 沒全部詳細看完就妄下斷論抱歉了 05/25 10:44