推 fragmentwing: alphago不是窮舉法吧 05/12 13:43
→ fragmentwing: 不太懂為何玩家沒贏會無窮迴圈 05/12 13:45
改了一點敘述,可能會清楚一點。
→ fragmentwing: 遊戲內部沒有結束無窮迴圈的判定嗎?像是圍棋的打結 05/12 13:45
→ fragmentwing: 規則那樣 05/12 13:45
推 shadowblade: 如果你是說遊戲內對loop的規則的話是玩家必須直接喊 05/12 13:45
→ shadowblade: 出要做的loop數量(取捷徑,當然這是實體牌的做法),而 05/12 13:46
→ shadowblade: 形成強制的無窮迴圈時若所有玩家都無法停止則和局,若 05/12 13:47
→ shadowblade: 有玩家有其他選擇能做的話,印象中好像是主動玩家(該 05/12 13:47
推 jojojen: 在一回合出現 消耗資源b產生資源a->消耗資源a產生資源b 05/12 13:47
→ jojojen: 這樣就無限了吧 05/12 13:47
→ shadowblade: 回合玩家)優先要把迴圈停下來(這個有點忘了 05/12 13:48
→ shadowblade: 現在問題是在電子版上要判定形成無窮迴圈會有問題吧 05/12 13:48
→ shadowblade: MTG電子版的loop要全程自己按 05/12 13:49
推 fragmentwing: 痾……那就ai養好後再寫個if?XD 05/12 13:50
說明一下,問題不是「判斷現在已經進入無窮迴圈」,而是「判斷最終是否會無窮迴圈」
,前者很簡單,後者做不到。不過照理說「不會停」應該並不一定是無窮迴圈,但作者
這樣寫,所以我也不是很肯定。
--------------------------------------------------------------------------
我在想MTG電子版沒辦法自行判定是否進入無窮迴圈是不是因為「決策」的問題,如果像
這篇論文內的殘局,玩家的操作被限制,那麼一旦進入以前經歷過的狀態就能知道我們已
經進入無窮迴圈。但實際可能有別的動作可做,需要雙方認同迴圈是最佳解而和局?
(如果規則上有要求要強制離開loop,另一種可能是計算量太大 XD)
→ shadowblade: 對AI不熟,但要判斷無窮迴圈這個好像也是個大問題? 05/12 13:50
→ fragmentwing: 我也不熟,不過可以想見最基本就窮舉殘局狀況手動寫 05/12 13:53
→ fragmentwing: if來判斷 05/12 13:53
→ fragmentwing: 問題是如果不靠手動要AI自己判斷殘局,不知道該怎麼 05/12 13:53
→ fragmentwing: 養 05/12 13:53
→ fragmentwing: 可能首先會從重複行為下手吧 05/12 13:53
推 shadowblade: 那看起來就是,如果是玩家要進行N次重複操作這個很好 05/12 13:54
→ shadowblade: 判斷,但遇到那種強制型的loop(先不考慮能不能中斷) 05/12 13:54
→ shadowblade: 判斷會有問題 05/12 13:55
→ fragmentwing: 可是判斷是否在無窮迴圈裡,一樣能達到判出和局的要 05/12 13:55
→ fragmentwing: 求啊 05/12 13:55
推 twosheep0603: 問題就在無窮迴圈這件事本身不可能靠自身判斷出來 05/12 13:56
→ fragmentwing: 有可能會先窮舉列出但不給ai看,要ai自己判斷是不是 05/12 13:57
→ fragmentwing: 然後根據判斷給分,慢慢養出(選出)接近窮舉(判斷10 05/12 13:57
→ fragmentwing: 0%正確)的ai 05/12 13:57
→ shadowblade: 比較經典的無法停止迴圈舉例就像是,在場上沒有其他可 05/12 13:57
→ shadowblade: 放逐目標的狀況下連拍三張這個,會導致2壓掉1,然後3壓 05/12 13:58
→ fragmentwing: 樓主就說判斷自己是否在無窮迴圈裡很簡單了,難的是 05/12 13:58
→ fragmentwing: 預測 05/12 13:58
→ shadowblade: 掉2讓1回來,1再壓掉3讓2回來壓掉1 (loop 05/12 13:58
→ shadowblade: 如果有其他目標可以選的狀況會被迫做其它選擇來中斷 05/12 13:59
→ pikachu2421: 圍棋也有循環劫啊 但現在看來不是問題 05/12 14:04
※ 編輯: aaaaajack (67.241.78.93), 05/12/2019 14:08:10
推 fragmentwing: 圍棋不太一樣的地方是,規則很明確定義結的狀況與應 05/12 14:08
→ fragmentwing: 對,而且他只有一種狀況 05/12 14:08
→ aaaaajack: 我現在其實有點混亂,我想確認一下MTG的token有數量上 05/12 14:16
→ aaaaajack: 限嗎? 圍棋不成問題應該是因為盤面大小固定,所以可以 05/12 14:16
→ aaaaajack: 保證在有限步數內達到循環,但這篇論文似乎用了token來 05/12 14:17
→ aaaaajack: 表示tape上的內容,而且似乎沒有假設上限,使得可能的 05/12 14:18
→ aaaaajack: 狀態無限多 05/12 14:18
推 sixpoint: 沒有上限 05/12 14:22
→ skylightwen: 阿發夠不是窮舉喔,是算機率的 05/12 14:22
推 shadowblade: 沒有上限 05/12 14:28
→ aaaaajack: 我文章應該沒說AlphaGo是窮舉吧... 05/12 14:31
※ 編輯: aaaaajack (67.241.78.93), 05/12/2019 14:43:44
推 IllMOR: 推原po大神 05/12 15:14
推 IllMOR: 是說現在有閒情逸致做這種研究也是蠻厲害的… 05/12 15:17
推 notsmall: 推認真 05/12 15:24
推 qd6590: 這研究也不能說沒意義 如果結果是可以的話代表推翻了長久 05/12 16:22
→ qd6590: 以來的理論 05/12 16:22
→ JamesChen: 殘局要看多殘啊 只有動了一步也是殘局 05/12 17:29
→ JamesChen: 那當然是不存在這個演算法 05/12 17:30
推 JamesChen: 但如果倒數有限步 當然是找的到演算法的 人腦都可以算 05/12 17:32
→ JamesChen: 了 05/12 17:32
推 enjoytbook: alphaGo就是靠隨機減少對窮舉的需求啊,這只是因為遊 05/12 18:53
→ enjoytbook: 戲結構不同 05/12 18:53
推 felix1031: 圍棋才是公認最難的 05/12 19:44
推 AMTS: 深度學習其實比較像直覺 他不需要算出有沒有無窮 只評估勝率 05/12 20:21
→ AMTS: 高的作法 後續就可以再用別的方式去模擬這些作法 05/12 20:21
推 vnon: 如果盤面不會重複的話,判斷是否已進入無窮迴圈也很困難吧? 05/13 00:11
→ aaaaajack: 我可能說得不太精確,容易的是判斷'是否已經繞了一圈' 05/13 01:21