推 sky0302: 推 01/05 16:31
→ signm: 世石那場是還沒進化的,當初比的時候狗有時候會想很久 01/05 16:38
推 MicroB: 少在這裡的意思不能單指數量吧 這個量化AI用勝率 人呢? 01/05 16:39
→ ilw4e: 人只能用目數阿:D 雖然人的目數預估常常是不準的 01/05 16:41
推 MicroB: 我的意思就是"錯越少"是什麼少 人說目數少是錯的 機器說 01/05 17:44
→ MicroB: 勝率少是錯的 就算今天知道唯一的那一個下法 兩者偏離的影 01/05 17:48
→ MicroB: 響都還不能量化 吧? 01/05 17:48
推 Aipr: 錯多少不能量化,才會"不知道怎麼輸的",但他這句話本身沒錯吧 01/05 17:55
→ Aipr: 如果你都能知道神之一手了,知道其他手錯多少還難嗎 01/05 17:57
推 MicroB: 我覺得蠻難的 比方說神之一手第一手是天元 AI說下星位 人 01/05 18:05
→ MicroB: 說下小目 誰錯的多呢 > < 01/05 18:05
→ MicroB: 這是單以這一手來講 下的多了"錯的量化"單位更困難吧 01/05 18:07
推 ddavid: 當你知道神之一手的時候,只有對與錯,沒有錯多少了 01/05 18:09
→ Aipr: 有吧 每個局面都會有最終雙方最佳解啊 01/05 18:14
→ Aipr: 黑下A, 結果0.5敗, 下B結果10.5敗, 就是B錯比較多 01/05 18:14
推 MicroB: 知道神之一手時就沒有錯多少只有對和錯 不知道時反而可以 01/05 18:15
→ MicroB: 錯多或錯少 XD 01/05 18:15
→ MicroB: A兄是是假設某一方有正解 但下棋是互相的當兩方都錯時 對 01/05 18:18
→ Aipr: 不 我是假設雙方都是棋神, 這樣每一手錯多少都可以知道 01/05 18:19
→ MicroB: 正解10.5敗的下法說不定能贏對方0.5敗於正解的下法嗎? 01/05 18:19
推 ddavid: 圍棋的勝負沒有說勝十目半就是比勝半目對的 01/05 21:54
→ ddavid: 規則寫明在那邊了,不管勝幾目都是勝,除非你要改編一個積 01/05 21:55
→ ddavid: 分制的新圍棋規則出來,否則以現有規則來說就是一樣的 01/05 21:56
→ ddavid: 人類是被迫因為無法算清,所以把圍棋轉化成一個競爭更多目 01/05 21:57
→ ddavid: 數的觀念來輔助計算,但不要誤解了計算目數的初衷 01/05 21:58
→ Aipr: 前後文是在討論"錯多少"這個能否量化,不是在說輸贏定義 01/05 22:37
→ Aipr: 你第一手1之1 跟第一手2之2, 這兩手假設都不是神之一手,都錯 01/05 22:40
→ Aipr: 這兩手總有高低之分,對棋神來說,這兩手確實可以量化的啊 01/05 22:41
→ Aipr: @MicroB沒錯,對手未必能將局面變成10.5目敗,但那依然是錯比 01/05 22:53
→ Aipr: 多的壞棋,不會因為對手應錯變成好棋 01/05 22:53
→ Aipr: 當然實際對局中,錯多少只能是估計,且相對的 01/05 22:58
這樣說吧,可以把人腦想成一個系統,我們是用目數來評估盤勢。AI則是另一種系
統,他是用模擬勝率的方式來理解。這兩個系統距離圍棋上帝這真理都還有距離,
我們都是試圖接近它而已。而也可發現兩種系統對好壞棋的判斷沒有太大差異。
如果看deepmind的分析,一些疑問手如果講明白他背後的理由,職業九段多半是也
能接受的。所以用AI這個系統下的棋跟人類多數棋理是不衝突的,除了一些人類單
純用經驗法則認定的好壞棋,因為這種認定不準確,這部分會和AI的分析有出入也
是可以理解的
所以通常下錯棋的時候,在人的系統就會認為損目,在AI的理解就會降低勝率,這
兩個應該是同樣會發生的。如果現在一步棋人認為損目但AI模擬的勝率不變或反而
上升,那就是可以來分析比較兩個系統誰在這邊更準確的有趣著點
https://deepmind.com/research/alphago/alphago-games-traditional-chinese/
(Alphago自戰解說,之前有人貼過了,重貼一次)
※ 編輯: ilw4e (223.137.235.66), 01/05/2017 23:57:00
推 sky0302: 人類靠的其實不只數目 因為很多虛的地方很難判斷 01/06 00:00
→ sky0302: 在虛的地方還是靠長期累積的棋感和經驗 01/06 00:01
推 ddavid: @Aipr 你還會考慮可以量化就是因為你並沒有真的用圍棋之神 01/06 01:50
→ ddavid: 的角度去想,你還是用人類或AI的角度 01/06 01:50
→ ddavid: 一開始一個選擇題,規則就是對了給兩分錯了給零分,老師知 01/06 01:51
→ ddavid: 道答案是1,所以他怎麼樣也不會在給分時去對234評估哪個錯 01/06 01:52
→ ddavid: 比較多的量化,因為再怎麼量化結果都是零分 01/06 01:52
→ ddavid: 對圍棋之神來講,你只要下出一手不是神之一手,他就是可以 01/06 01:54
→ ddavid: 讓你敗定,你不會錯得更多也不會錯得更少,因為必然敗 01/06 01:55
→ ddavid: 是人類跟AI沒辦法做出你下錯保證讓你敗定的承諾,你才有評 01/06 01:55
→ ddavid: 估錯多大的空間,這個錯多大就是對方多能懲罰你下錯的程度 01/06 01:56
→ ddavid: 。以人的評估可能是懲罰你盤面少多少目,以AI的評估可能是 01/06 01:57
→ ddavid: 懲罰你的勝率,而圍棋之神只懂得一種懲罰,就是你一下錯直 01/06 01:57
→ ddavid: 接敗。 01/06 01:59
推 Aipr: 能不能量化,跟量化有沒有意義,是兩個不同的命題 01/06 09:11
推 ddavid: 沒有意義的量化你想拿來做什麼呢?都已經把前提擺在圍棋 01/06 15:10
→ ddavid: 之神的思考方式了,為什麼還有需要量化的想法呢。 01/06 15:10
推 ddavid: 當你想要量化就已經回到人類的思考了。對圍棋之神來說,確 01/06 15:13
→ ddavid: 定好貼目後,棋局在猜先完就結束了。 01/06 15:13