看板 GO 關於我們 聯絡資訊
小弟凌晨熬夜寫的文章,聊聊東坡棋的意義,還請大家多多指教。 原文連結: http://www.goer.com.tw/edu/spe_details/34 窗外淅瀝瀝的雨聲,在不眠的夜深時分更添幾分孤寂。 人機大戰首局,柯潔執黑落敗,他自己說「輸得沒有脾氣」。明天的第二局輪到柯 潔執白,他會下出怎麼樣的棋局呢?去年AlphaGo和李世石的決戰,小李唯一獲勝 的第四局即是拿白棋贏的;AlphaGo自我對弈的評估,也顯示現行的貼目規則下, 執黑是比較辛苦的。這次的人機大戰2.0,柯潔已完全不被看好,但我想,還是有 很多棋迷,對這第二局人類執白──懷著渺茫的一點希望。 然而,我對於柯潔執白的期待不止於此。今年年初,AlphaGo化身Master在網路上 的60盤測試棋,原本最後一盤是要由柯潔壓軸挑戰,後因他身體不適住院而改由古 力代打,柯潔在微博上略有不甘地宣稱他原本有準備「秘密武器」。據悉,柯少俠 當時所準備的絕招,即是「東坡棋」,也就是所謂的「模仿棋」。 對於東坡棋,想必很多人乍聽都是嗤之以鼻的。不過,職業棋士的東坡棋,並不是 只是一味地模仿,也不是為了激怒對手,更不會是懶得認真想、胡鬧一番。東坡棋 的目的,說穿了,是為了先和對手戰成平手,等待適當地時機,再一舉變著、取得 優勢。吳清源大國手當年第一次與木谷實對陣,便嘗試過東坡棋的下法,賽後兩人 徹夜長談彼此對棋道的追求,更從此成為關係最緊密的好友。 在Master的60盤棋中,紅面棋王周俊勳也有祭出東坡棋戰術。但是必須分辨的是, 周九段用的是執黑先著天元,再模仿白棋的下法,吳清源當年對木谷也是執黑用東 坡棋。不過卻有一天壤之別,就是現今的規則黑棋必須「貼目」了,故黑棋的東坡 棋僅與白戰成平手是無法獲勝的,是以後來周九段中盤趕緊變招出擊,最終玉碎落 敗。這樣看來,黑棋的東坡棋反而給自己莫大的壓力,預計「後動」,卻是「被動 」了。 然而,真正厲害的,是白棋的東坡棋。棋友可能會想,拿白棋還模仿黑棋,又有什 麼差別?那黑棋不是下天元就好了嗎?奧妙正在於此,天元雖然處於棋盤的中心, 理論上是最平衡的一個著點,但是在空蕩蕩的情況之下落子天元,由於棋盤中央尚 缺少棋子配合,通常是難以發揮效用的。白棋模仿黑棋,在黑棋落子天元之前,是 確實能與黑棋保持平手的局面的。進一步的關鍵則是,或在黑落子天元之前、或在 之後,選擇一個恰當的時機變著,一舉讓棋子的效率超過對方,並努力維持到終局 。必須貼目的既是黑棋,那白棋只要不被追上貼目,即可獲勝。 不過,在AlphaGo這樣強大的對手面前,只要對圍棋稍有了解便不難想到的這個戰 術,會有用嗎? 在此,且讓我稍微岔個題,聊一下在過去下東坡棋最有名的棋手──藤澤朋齋。藤 澤朋齋本名藤澤庫之助,是日本棋院歷史上的第一位九段,在原本應該屬於他的時 代,因為在十番的舞臺上兩敗於吳清源,而黯然失色了。 藤澤的東坡棋是非常有名的。他在三、四段的時候,就有「黑番不敗」的名聲,棋 風穩重而厚實,但他當時執白的布局常常過緩,是以他便嘗試用東坡棋的策略。但 是,在他登上九段的高位之後,甚至於在輸給吳清源、退出日本棋院,改名朋齋再 回歸棋壇之後,他仍然持續不斷地嘗試東坡棋。這究竟是為什麼呢? 江崎誠致在《昭和的棋》一書中,談到藤澤的東坡棋。他認為與其從圍棋的技術上 去討論,不如想一想,藤澤在不同的階段、不同的處境下從一而終地堅持東坡棋的 心態: 世間是有這樣一種人的,他們儘管擁有創造財富的才能,卻能夠安於 清貧。這些人之所以採取了這樣的生活態度,是因為他們覺悟到貧富 並不是評判人生價值的標準。這個比方聽起來或許有些突兀,但我無 法不認為,藤澤孜孜不倦地下模仿棋,就是在棋道上追求清貧。 我認為,藤澤是在沒有個性的模仿棋中追求自我的個性。 我相信肯定還是會有很多人覺得,這不過是在為「東坡棋」美化門面的說辭罷了。 不過,這就是一種選擇。與吳清源、木谷實一樣,藤澤朋齋確實是屬於一心一意求 道的性格,在吳清源的故事裡他雖然淪為配角,可是若從他本人的角度來看呢?他 的一生都奉獻給圍棋,只有圍棋而已。他不可能不知道這樣的堅持,等於把「東坡 棋」、「模仿棋」這個標記,深深地烙印在自己的身上。我們談起東坡棋,就想到 藤澤朋齋,談起藤澤,也就想起東坡棋。這是他的選擇。 說了這麼多,只是想說,東坡棋並不只有模仿,它確實也是求勝、求道上的一種選 擇。它肯定不是一般人會欽佩、嚮往的一條路,甚至表面上看來無味且平庸,更必 須擔負罵名,但是──蟄伏沉潛,等待時機,忍耐孤獨,你可以不贊成,但不能不 認同,那是更艱難、更冒險的一個選擇。 最後回到剛剛的問題:「會有用嗎?」大家都說肯定沒用,主要的論點是 「DeepMind團隊一定想過應對方式」,但我覺得未必盡然,理由有三: 第一,與其說DeepMind團隊一定想過應對方式,不如說他們一定「測試過」下東坡 棋,但不見得有辦法、更不見得會在程式演算法中去干涉AlphaGo的深度學習選擇。 那麼,即使黃士傑博士嘗試過和AlphaGo下東坡棋,他和柯潔的棋力不同,選擇變著 的場合也必定不同,如何能肯定柯潔來下一定沒有效呢? 第二,AlphaGo與人類不同,人類一看到東坡棋,便知曉了對手的意圖,並且開始 謀畫如何盡量提高「天元」位置的重要性,利用下在天元來取得優勢。但AlphaGo 會有「原來你想跟我先戰成平手」的理解能力嗎?我想合理的推測是,它仍然會選 擇經過計算,棋盤上效益最高的一手,直到「天元」成為那一手時,它才會下在天 元,而不會主動去創造出使天元成為最重要一手的局面。 第三,DeepMind的Demis Hassabis曾經在演講中透露,他們請樊麾測試過,若讓樊 麾加上AlphaGo來對陣AlphaGo,也就是說,樊麾對局時大部分都採用AlphaGo自己 的棋步,只有在覺得有更好的選擇時才出手變招,這樣是可以擊敗AlphaGo的。這 代表的意義是,也許在序盤布局,人類難以像AlphaGo一樣掌握全局,但是在選擇 局部最佳解的計算能力上,人類仍有一些優勢,畢竟AlphaGo永遠作的是全局的計 算。 綜言之,柯潔若選擇使用東坡棋,保持平手的局面,且真的能在適當時機下出更好 的著手,那麼並非沒有可能「暫時取得些許優勢」;而即使這樣的優勢很微小,但 人類的後半盤相對而言,也不是沒有機會避免失誤,保持這樣的優勢到終局。更何 況,如果現行的貼目確實對黑棋更有負擔的話,那AlphaGo是否能夠在相對變化少 的局面下搶到7.5目?仍然值得期待吧。如果AlphaGo真的能夠做到,那麼表面上平 淡無趣的東坡棋,實際上也會是暗潮洶湧、錙珠必較、無比激烈的一場惡戰啊! 這是我之所以,在大戰前夕如此期待東坡棋的原因。當然,承認AlphaGo優於全人 類頂尖高手,已是不爭的事實。選擇東坡棋,我想已不只是追求棋道上的清貧,更 是承認了人類千百年來積累的渺小,我們等於先認輸,同意AlphaGo的著點更好, 然後等待。 雨不停歇,道無止盡。在追求圍棋真理的道路上,我們並不孤獨。話說AlphaGo的 自我對弈盤數,如今不曉得是多少?當初聽到的數字就已經是三千萬盤,這是任何 人類窮極一生也無法達到的數字。但即使如此,AlphaGo大師也還沒有到達圍棋的 盡頭。既然還沒到達,那就仍然值得我們嘗試吧。如果不嘗試東坡棋,或許也會是 一個缺憾? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.251.187 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1495674407.A.A89.html
xhakiboo: 雖然好像都是討論很多次了 不過還是推推 05/25 09:16
bidodu: 頗適合在島內當記者 05/25 09:17
pmove: 吃東坡肉比較快 05/25 09:19
winall: 模仿棋我覺得可以私下玩,正式比賽玩模仿棋太不尊重 05/25 09:24
LeeSeDol: 還是2F的文章比較有舒壓功效 05/25 09:31
mathbug: 應該是最接近贏棋的策略了 05/25 09:34
goldduck: 不會用 05/25 09:40
AirOctopus: 原本不太希望模仿棋,因為不但不覺得有用,而且會少很 05/25 09:41
AirOctopus: 多精彩的棋步,但現在反而覺得還是下模仿棋好了XD 05/25 09:41
AirOctopus: 感覺說不定比較精彩,說不定可以產生大規模戰鬥 05/25 09:42
AirOctopus: 自然下根本就自然死了,還是模仿死好一點 05/25 09:43
sapc87952: Master對周俊勳就下過了 雖然周是持黑 05/25 09:43
sapc87952: 持白下模仿棋根本沒機會 不用想了 05/25 09:44
AirOctopus: 但我不同意模仿棋可以先"戰成平手",我想像中是會產生 05/25 09:46
AirOctopus: 兩邊攻殺,然後天元附近先佔先贏,白棋無法先佔就掛了 05/25 09:47
shehrevar: 下模仿棋只能看到如何破解,看不到令人驚嘆的妙手了 05/25 09:48
sapc87952: 上面講錯 是持黑模仿棋沒機會 05/25 09:49
AirOctopus: 或者Master也可能設計爭子,很多人覺得電腦邏輯差無法 05/25 09:50
kd1523: 推認真分享文 05/25 09:51
AirOctopus: 但所有對攻死活都是邏輯運算,電腦都能做到沒道理做不 05/25 09:51
AirOctopus: 到自然產生爭子破解 05/25 09:52
orze04: 看過alphago去年的那份論文 我很懷疑他能理解長距離爭子 05/25 10:13
AirOctopus: 它不能處理爭子的話早就被殺爆很多次了 05/25 10:17
AirOctopus: 不會的話怎麼可能共下了71盤棋還沒被征子搞到 05/25 10:18
FacebookGO: 不要用懷疑(感覺) 自己去實作跑跑看 所以谷歌科技才強 05/25 10:18
FacebookGO: 科技是講求實作成果的東西 不希望台灣只擅長想像科技 05/25 10:20
LeeSeDol: 論文有寫nn第一層feature中就有兩個跟引征相關,不知道 05/25 10:24
LeeSeDol: 樓上某位自稱看過論文的如何評論? 05/25 10:24
xhakiboo: 樓上這個有喔xD 05/25 10:32
orze04: 謝謝了 是我看得不完全 05/25 10:41
orze04: 沒全部詳細看完就妄下斷論 抱歉了 05/25 10:44