[將棋] 第27回世界電腦將棋大賽

作者ssccg (23)

看板chess

標題[將棋] 第27回世界電腦將棋大賽

時間Thu May 4 21:53:30 2017

http://www2.computer-shogi.org/wcsc27/ 二次預選決勝 elmo 8-1 7-0 Ponanza Chainer 8-1 6-1 (輸elmo) 技巧 6-3 4-3 (輸elmo、ponanza、読み太) 大合神クジラちゃん 6-3 4-3 (輸elmo、ponanza、技巧) 蒼天幻想ナイツ・オブ・タヌキ 5-4 3-4 読み太 6-3 2-5 HoneyWaffle 6-3 2-5 NineDayFever 5-3-1 0-7 === 晉級決勝 === 大将軍 5-4 Qhapaq 5-4 nozomi 5-4 Apery 5-4 這次Ponanza導入了deep learning、1092 CPU + 128 GPU的Cluster 號稱對去年電王戰版的Ponanza勝率超過80% 原本想說可能沒什麼好看的... 結果又有讓Ponanza拿到敗場的軟體出現 elmo是最近出現在floodgate上、rating超過4000的monkeymagic 參賽使用的硬體只用2 CPU的主機預定賽後也會公開，又有新玩具可以用了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.46.137 ※ 文章網址: https://www.ptt.cc/bbs/chess/M.1493906013.A.E9E.html

推 merhi0506: 電腦賽為什麼會連下兩手理解不能 05/04 23:25

→ ssccg: 在輪到對方下的時候，傳送不合法的指令到server，被判定為 05/05 00:36

→ ssccg: 違規，其實不是真的送了下一手指令，只是規則上算二手指し 05/05 00:38

※ 編輯: ssccg (118.150.36.84), 05/05/2017 00:39:35

→ ssccg: elmo要2連勝ponanza了 05/05 15:45

→ ssccg: 不知道是將棋跟DNN的相性問題，還是只是學習時間還不夠 05/05 16:00

推 NeedGem: 覺得圍棋只要機率過就好比較適合 DNN... 05/05 16:53

→ NeedGem: 將棋需要嚴格的將死才算數不太好用 DNN # 除非入玉. 05/05 16:53

→ NeedGem: 賽後... 只有棋譜和評價參數, 程式: Y王!!!!! 05/05 16:54

→ ssccg: やねうら王根本場外參戰了，在比賽中推出新版本 05/05 17:02

※ 編輯: ssccg (118.163.87.133), 05/05/2017 17:26:12

推 NewYAWARA: 有點橫空出世的味道…而且是免費的，看來千田可以好好 05/05 17:27

→ NewYAWARA: 利用一下了 05/05 17:27

推 NewYAWARA: elmo: https://goo.gl/HEhL6M 05/05 17:31

→ NeedGem: 他不負責寫 engine, 他的努力都在棋譜和評價參數上了. 05/05 17:40

推 NewYAWARA: 看了一下決賽，雙方用的是主流的換角48金37桂29飛，後 05/05 17:40

→ NewYAWARA: 來elmo爭取到入玉過程中大幅棋得，最後直接打趴pona 05/05 17:41

→ NeedGem: https://pbs.twimg.com/media/C_DEIZmUwAErQ44.jpg 05/05 17:42

→ NeedGem: 從這邊到可以贏... 嗯 05/05 17:43

→ NeedGem: 相較於大合神集眾人之力還是被那兩個玩假的... 囧 05/05 17:48

→ NeedGem: 也許是因為去年Y王本尊有贏到Pona才會有人想這種可能 @@ 05/05 17:51

→ NeedGem: Y王本人覺得這個比賽沒錢賺所以不會自己下去拼吧 (X) 05/05 17:53

→ NeedGem: 應該說將棋不太適合直接把 DNN 丟上去用... 05/05 18:54

→ ssccg: クジラ好像用去年電王版本的Apery(這次參賽的Apery也是) 05/05 19:18

→ ssccg: 眾人之力的效果還是看的出來啦... 05/05 19:20

→ ssccg: 明年要拿到優勝可能至少要比クジラ+elmo強，可能要R4500+? 05/05 21:11

→ ssccg: elmo看說明是從Apery開始加上各家的學習方法，主要改善終盤 05/05 21:16

→ ssccg: 的強度，從上面那局面可以守住ponanza的進攻可以看出這方面 05/05 21:17

→ ssccg: 可能是目前最強的吧 05/05 21:18

→ NeedGem: 試驗一下炎之七番勝負第七局終盤, 用elmo評價參數之後... 05/06 10:00

→ NeedGem: 真的很快就在某一手看到... 28 手詰 (羽生已完蛋) 05/06 10:00

→ NeedGem: Engine 終盤初測: Apery >= Y王 > silent_majority(魔女) 05/06 10:01

→ NeedGem: 初步亂來的終盤檢證: http://0rz.tw/lebXG (放巴哈...) 05/07 00:02

→ ssccg: 差不多各家都公開了(差技巧)，各家的特色好像是qhapaq序盤 05/07 01:42

→ ssccg: 強，読み太是單機強化版的Y牌引擎(可是我試覺得沒Y4.41+強) 05/07 01:44

→ ssccg: pona跟alphago比了一下，DNN好像只有policy network，只用 05/07 01:49

→ ssccg: 在決定各分枝探索的順序上，剩下的就是cluster化，評價值好 05/07 01:50

→ ssccg: 像都沒提到，說不定就是都沒有動...評價準確度輸人的話找的 05/07 01:51

→ ssccg: 快也沒用，2~4名都是NPS幾億的cluster但是輸千萬級的elmo 05/07 01:52

→ ssccg: alphago在評價用了rollout和value network，value network 05/07 02:03

→ ssccg: 在攻王類的好像CP值不好，rollout在將棋這種不知道什麼時候 05/07 02:14

→ ssccg: 結束的不知道效果如何...不過方法上應該還是有嘗試的空間 05/07 02:15

→ ssccg: pona的policy準確率55%跟alphago的57%已經差不多了，再來重 05/07 02:18

→ ssccg: 點還是要放在改善評價方法，至於引擎跟ML比較沒關係，比較 05/07 02:21

→ ssccg: 看寫程式的人最佳化的功力了 05/07 02:21

→ NeedGem: deep learning 的正確用途目前可能是拿來練評價參數. 05/07 06:19

→ NeedGem: 但是現行的二三駒關係不排除可能也有所侷限 (思) 05/07 06:20

→ NeedGem: 攻王需要的是正確的手順, 用 value network 有其困難點. 05/07 06:21

→ NeedGem: 除了 kk/kpp/kkp 那套之外該有新的評價想法了 05/07 06:23

→ ssccg: 新想法就技巧啊，只是這次沒練贏... 05/07 06:39

→ ssccg: 現在學習用的局面是用傳統評價自我對戰生的，加上policy 05/07 06:43

→ ssccg: network也許能用比較少的時間生出這些資料? 05/07 06:45

→ NeedGem: 剛剛把 usapyon2 dash 丟進 elmo 的 kk/kpp/kkp... 05/07 07:01

→ NeedGem: 當機了wwwwww 05/07 07:01

→ ssccg: 技巧2出了，可以調強度和戰型，這可以賣了吧... 05/08 02:10

→ NeedGem: 偷偷試一下檢討棋... 結果三種軟體套elmo檢討出來不一樣 05/10 16:13

→ NeedGem: (著名實況台: 魔女 # 這邊根據之前測試使用 Apery/Y王) 05/10 16:14

→ NeedGem: 太難了先擺一邊... 囧 05/10 16:19

推 lwei781: 有新的大魔王 12/07 01:46

→ lwei781: AlphaGO 太兇惡了 12/07 01:47