精華區beta HOT_Game 關於我們 聯絡資訊
對應更為棘手的驗證圖,要綜合整理 Bird 大的構思 提出一個可能的「必勝法」 簡單來講,假定機械智能開發不能 所有的圖可能幾乎每一次都要人工處理 在這樣的條件之下,表面上所有參戰國的條件都一樣 可是,實際上仍有可以壓搾的空間 這場 Game,是個 Liar Game,所以要耍 Trick 觀察遊戲進行的瓶頸,只在一點 那就是辨識驗證圖 原來的阿法妻是透過更新辨識庫資料達成自動化 但是現在假如圖形不重複,資料庫就沒用了 問題在於,要每一個使用者都回到自行辨識是不可能的 因為一個人的工作時間不可能連續 於是一個構想就來了 假如認證圖能夠一直接踵而來 處理玩一張圖,緊接著下一張圖 那嚜人工作業的可能性將會提高,這就是這篇所要強調的可壓縮的時間 假若有一批打字大隊,經過粗略估計,可達到一比二十四的處理率 在上工期間,一個人工辨識機台可對應二十四個點點 下一個問題就是,因為這二十四個點點機台是分開獨立的 我們的平台必須提供時序的建立 (排隊機制) 現在已知,點完點數之後,要按下 Add to total 才會出現認證圖 這個時間差可以適當調整 讓二十四個點點機依照一定的順序送出認證圖給人工辨識機 不然一次二十四張圖同時送到肯定吃不消 不曉得多久沒把一張圖辨識出來會被判定 out ? (假設是 dt 秒之內一定要辨識出來) 系統規劃就是 壹台最高總Server,命名 總司令 數台人工辨識機,稱作 X 還有無限量的點點機,稱作 P 這裡頭 X 是極為珍貴的資源 而總司令是一個仲介,負責發包與接單,調度 X 接受哪二十四台點點機的辨識要求 總司令接受 點點機 (P) 的請求,並且等待有空的 X 也接受 X 的請求,等待需要協助的 P 然後 P 透過總司令與 X 聯繫之後 開始作業,就與總司令無關 每個 X 在一個工作期間內,最多可接 n 個任務 (解認證圖) 而且限定每個任務的傳送必須在 工作期/n 的時間點 送出 考量到P能處理的時間點,只允許 dt/2 的時間誤差, 如果錯過,就要等下一輪 ※ 工作期/n 的時間大約是人工辨識的處理時間 為了處理時序,P 必須接受 X 的指令,舉例如下: 現在有一個 P,和 3 個 X (X1, X2, X3) 為了簡化一下 假定每回合花費 15 秒,人工辨識要花 5 秒 X1 於時間 t=0 申請 X 的協助 X2 於時間 t=5 申請 X3 於時間 t=10 這樣嘟嘟好,第一輪 X1 at t=30 送出請求, P 有閒暇處理 X2 t=35 X3 t=40 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 X1 --------r--------r--------r--------r--------r--------r-------- X2 ---------r--------r--------r--------r--------r--------r----- X3 ---------r--------r--------r--------r--------r--------r-- 如上圖表示,每一個 r 代表一次的任務請求 (解認證圖) 每回合花費除以人工辨識的時間剛好是能連續處理的最大 P 值 這裡的小問題是, P 怎嚜可能這樣剛好依照這樣的時間申請 X 的協助? 我們的彈性在於點擊速率以及點擊數量 不論 P 是哪時候加入,哪時候完成,天殺的網路 lag 問題 只要能控制認證圖的送出請求在 X 可接受的時間點即可 比如 X1 於時間點 t=0 加入 ==> 依照原計畫 X2 t=1 加入 ==> 多點擊四秒,怕點太多,點慢一點總行吧 X3 t=4 加入 ==> 類似X2,多點擊6秒 ※ 以上的時序機制是假設認證圖必須在某個時效範圍內解出,不然無效 希望做這樣的解釋可以幫助理解這個點子 當然原來的 阿法 機制仍要持續運行 畢竟不認為短期內真的會徹底改成完全的隨機圖 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.229.9.134
evaoq:眼花.... 06/23 02:35
remixx:趁機廣告Liar Game,好看喔XDDDD 06/23 02:35
rootking:有道理但實行上有困難~~除非程式化的任務編組 06/23 02:35
greenmoon00:原PO的圖讓我想到WOW的攻擊輸出節奏 06/23 02:36
flysonics:為什麼我看起來像平行處理啊 我等級真的太嫩了...= = 06/23 02:36
ruemann:基本上是管線的概念 06/23 02:37
finbo:暈@@ 06/23 02:37
KyleTso:推Liar Game 06/23 02:38
cherrywish:版主也來點點點嗎XD 06/23 02:39
cherrywish:O_O 這構思不錯..... 06/23 02:40
vicamo:其實沒有嚴重到這樣吧,弄個 random query 就好了 06/23 02:40
PPPGGG:原PO的圖讓我想到WOW的攻擊輸出節奏.... 06/23 02:47
infixman:亦即是p2p嗎? A端接收到驗證圖,傳送給B解完回傳 06/23 02:56
> -------------------------------------------------------------------------- < 作者: jskblack (天空茶) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:35:39 2007 ※ 引述《addbear (無家的小孩)》之銘言: : ※ 引述《vicamo (asdf)》之銘言: : : 1. 究竟是否隨機 : : 從自動兵器還是可以辨識的情況下,它應該不是真的完全隨機 : : 剛在抓 t => sec 的關係已經發現至少三筆(才剛開始) md5 重複,也可以證明不是 : : ( 光說看到相同的 sec 是不夠的,因為我可以只差一個 pixel : : 人看不出來,但是 md5 會完全不相同 ) : 我是路人甲亂入, : 如果只是數個 pixel 不同, : 或許可以用和 image content 相關的 hashing function 來產生驗證碼, : 而不要用 md5 這種 hashing function , : 但是關於如何寫這種 hashing function, : 我也是從 paper 看來的,細節不明。 感覺今天晚上在這裡晃一下 原本只是想說參戰繼續點的 沒想到這樣一討論 專題研究計畫竟然派上用場了 XD 還得到一堆強者大大的意見 真是受益無窮啊 :Q 不過還是要回歸正題 大家繼續點吧 XD -- 這真是太好吃了啊啊啊啊 甲胖44號!! 天國我來了~~!!! 吃了飛到天國的甲胖!! \●/ + ●/ < / \ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.112.42.92
htalent:會自己跳認證圖就比以前的AXS好了 只是很容易誤按enter- - 06/23 02:36
> -------------------------------------------------------------------------- < 作者: jubilee2 (3321) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:36:26 2007 ※ 引述《htalent (TalentKid)》之銘言: : ※ 引述《invalid (everlasting)》之銘言: : : 我覺得最大的問題是 : : 誰的水管有那麼大? (學網衝太大會被網管ban) : : 愛台灣壓縮後看起來也有300kB以上 : : 換算網路傳輸用的單位是300k x 8 =2.4 Mbit : : 所以要是有100個鄉民用的話 : : 上下傳乘二,很快就爆炸了@@ : 所以我建議改成SQL, : 這樣如果加個index就能夠避免掉開頭重複的部分 : 直接從最後更新的部分取得,對於資料的整理也相對方便許多 : 排序之類的… : --- : 不好意思只會出一張嘴= = 簡單的做法就是一段時間更新一次 包成像更新病毒碼一樣.. 就不用做到SQL這麼複雜了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.118.71
jhjhs33504:來源是? 06/23 02:36
jubilee2:一段時間新增的包成一個當案 06/23 02:37
htalent:學kav把檔案切割成一堆小碎片也不錯? 每N筆資料包一個 06/23 02:37
htalent:當然這樣索引檔就很重要了 ....(默) 06/23 02:37
> -------------------------------------------------------------------------- < 作者: invalid (everlasting) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:38:52 2007 ※ 引述《jubilee2 (3321)》之銘言: : ※ 引述《htalent (TalentKid)》之銘言: : : 所以我建議改成SQL, : : 這樣如果加個index就能夠避免掉開頭重複的部分 : : 直接從最後更新的部分取得,對於資料的整理也相對方便許多 : : 排序之類的… : : --- : : 不好意思只會出一張嘴= = : 簡單的做法就是一段時間更新一次 : 包成像更新病毒碼一樣.. : 就不用做到SQL這麼複雜了 我覺得如果要做到增量更新的話 這是一個關鍵,server每段時間出一個新版愛台灣 大家直接比較版本號就可以跟server要求漸進式的patch 資料量會小非常多 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.228.241.218
rootking:好方法~~但資料庫沒有切除舊資料~~速度會慢慢降低XD 06/23 02:39
gnagna:對了 忽然想到 我們能不能寫一個程式 專門抓某幾張圖來認證 06/23 02:40
flysonics:另外再寫一個程式砍掉過久未被使用的資料? 06/23 02:41
htalent://001.txt //002.txt //003.txt 004.txt 005.txt... <=? 06/23 02:41
vicamo:砍可能比較困難,要作 aging 的話負擔會不會很大 06/23 02:42
htalent:類似RO的patch2.txt 06/23 02:42
flysonics:也是 還要多吃空間來做aging...我忘記了... 06/23 02:43
louis925:這之前我就說過了...但沒人理我... 06/23 13:41
> -------------------------------------------------------------------------- < 作者: rein (rein) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:40:45 2007 ※ 引述《jubilee2 (3321)》之銘言: : ※ 引述《htalent (TalentKid)》之銘言: : : 所以我建議改成SQL, : : 這樣如果加個index就能夠避免掉開頭重複的部分 : : 直接從最後更新的部分取得,對於資料的整理也相對方便許多 : : 排序之類的… : : --- : : 不好意思只會出一張嘴= = : 簡單的做法就是一段時間更新一次 : 包成像更新病毒碼一樣.. : 就不用做到SQL這麼複雜了 愛台灣.txt裡面每一行的開頭 依照 0-3 4-7 8-B C-F 類似這樣 各分成一個檔案 這樣就可以方便分流、個別更新囉 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.137.72.56
rootking:難~~PW:ecig有七個背景了 06/23 02:41
htalent:依照開頭似乎比較不妥 無法區分新舊 06/23 02:41
jubilee2:要更新也是全部都要重傳.. 06/23 02:43
rein:耶 更新先交給一個dispatcher來做就好了 要抓哪個程式自己判 06/23 02:44
rein:抓下來在自動組成 愛台灣.txt 06/23 02:45
> -------------------------------------------------------------------------- < 作者: KyleTso (負けないで) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:46:50 2007 ※ 引述《jubilee2 (3321)》之銘言: : ※ 引述《htalent (TalentKid)》之銘言: : : 所以我建議改成SQL, : : 這樣如果加個index就能夠避免掉開頭重複的部分 : : 直接從最後更新的部分取得,對於資料的整理也相對方便許多 : : 排序之類的… : : --- : : 不好意思只會出一張嘴= = : 簡單的做法就是一段時間更新一次 : 包成像更新病毒碼一樣.. : 就不用做到SQL這麼複雜了 若是沒辦法做到即時更新 那點點官網只要隔一段時間把認證圖全部換新 發現有人連續幾個圖都跳過或打錯就ban 這樣ip馬上就會被ban光光 XD 或是說阿法改成自動連續出現不在資料庫內的圖就斷線? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.121.93.92
Leeng:你得到它了 06/23 02:47
flysonics:直接斷線 就沒辦法收新圖了吧? 06/23 02:47
vicamo:換新圖是不會被 ban 的,因為會被跳過 06/23 02:47
flysonics:問題是好像跳圖的次數太頻繁 也是會被BAN? 06/23 02:49
vicamo:可是我剛到現在跳了 1000 多張圖也沒 ban 啊 06/23 02:50
qaze:跳圖太頻繁也不會被ban...我剛就試過了 06/23 02:51
qaze:他只會換到買衣服的網頁去... 06/23 02:52
PPPGGG:同樓上 +1 06/23 02:53
KyleTso:所以阿法要改成會自動從買衣服(或其他)網頁連回來 ? 06/23 02:54
KyleTso:這樣就只是空轉一段時間 06/23 02:55
louis925:我也是跳到買衣服的網頁 06/23 13:44
> -------------------------------------------------------------------------- < 作者: Leeng (里恩) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:50:23 2007 在此之前 想先請教阿髮妻讀認證圖的原理.... 究竟圖形與認證碼以及那串md5有什麼關聯呢? 麻煩強者解釋一下... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 60.248.166.161
LPH66:簡單說就是建立圖→字的對應表 06/23 02:50
cat771126:讀取圖片的md5與認證碼配對? 06/23 02:50
flysonics:阿髮妻沒有讀認證圖吧 只是把鄉民讀完的結果傳上SERVER? 06/23 02:50
LPH66:圖用md5在抓 這樣省空間 06/23 02:51
victor740519:關鍵字:md5  去找辜狗比較仔細.... 06/23 02:51
htalent:下載圖片比對hash 有資料則輸入對應字串 沒有就跳出keyin 06/23 02:50
berimaru:md5是用來辨識圖片是不是同一張 06/23 02:51
kqalea:把圖形的二進位值拿去做運算,會出來一組特定的值,會是那넠 06/23 02:50
Leeng:圖本身沒有意義吧? 要紀錄的是圖的檔名還是那裡有標籤? 06/23 02:51
caeru:不只可以分辨圖形,也可以分辨檔案 06/23 02:52
caeru:他實際上是分辨這兩個檔案是不是同一個東西 06/23 02:52
kqalea:張圖獨一無二的一串碼,運算的方式叫md5 06/23 02:52
caeru:所以同一張圖的話,可以使用資料庫確認過的字串來輸入 06/23 02:53
alliao:他要是圖的metadata 裡面不斷更新不就慘了.... 06/23 02:53
> -------------------------------------------------------------------------- < 作者: Ieesmart (趕羚羊,我要戒BBS!) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:52:59 2007 ※ 引述《rein (rein)》之銘言: : ※ 引述《jubilee2 (3321)》之銘言: : : 簡單的做法就是一段時間更新一次 : : 包成像更新病毒碼一樣.. : : 就不用做到SQL這麼複雜了 : 愛台灣.txt裡面每一行的開頭 : 依照 : 0-3 : 4-7 : 8-B : C-F : 類似這樣 : 各分成一個檔案 這樣就可以方便分流、個別更新囉 其實如果要玩得久由SQL處理會比較好 每看到新的東西就insert這樣一張圖認證對一次就可以了 現在如果算1000人在玩好了每2分鐘送出2000次query好了 就算舊有資料有幾十萬筆... 感覺上其實也還好,不論於機器所需資源上或是頻寬流量上 等負荷不了n-tier? XDDDDDDDDDDDDDDDDDDDDDDD -- 我是小綠 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.137.135.237
vicamo:只要圖庫有限,並且不大,大概每人一兩次就不會有新的了 06/23 03:02
Ieesmart:沒錯XDDDDD 06/23 03:03
> -------------------------------------------------------------------------- < 作者: vicamo (asdf) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 02:59:12 2007 ※ 引述《Leeng (里恩)》之銘言: : 在此之前 : 想先請教阿髮妻讀認證圖的原理.... : 究竟圖形與認證碼以及那串md5有什麼關聯呢? : 麻煩強者解釋一下... hash 是指一種對應方式 例如說有很多數字,我們就光看最後的一個 digit 來分類 尾數是 1 的放到籃子 1,2 的放到籃子 2 .... 當我們有很多很多的籃子時,可以假定幾乎不可能出現籃子裡有兩個東西 當然啦,你有更多東西要放到這些籃子的時候就一定會重複 如果我們假定 Ian 生出來的圖不多,那就大概可以說籃子裡不會有兩個東西 也就可以拿來分辨在 a 籃的東西一定跟 b 籃的東西不一樣 所以把籃子的編號拿來當 key,認證碼就是我們要的值,這樣的一對一關係用以檢索 md5 就是我們用來生成籃子編號的方法,它會生成 2^128 個籃子 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.31.162.194
flysonics:資結才學過不久 (茶) 06/23 02:59
litthe:這個版...越來越專業了.........(汗) 06/23 02:59
PPPGGG:好像越知道越多了....可是還是不懂128..... 06/23 03:00
KyleTso:不要管128代表什麼意義 只要知道那是很大的量就可以了 06/23 03:01
Leeng:因為編出來的code有32字元(hex) 06/23 03:01
johnnyaiba:2的128次方...會多大呢 (自己按計算機試試看) 06/23 03:01
addbear:因為 md5 會產生 128 bit 06/23 03:02
ruemann:計算機爆炸! 06/23 03:02
lzrong:三月份剛考完的東西^^" 06/23 03:02
flysonics:工程計算機還是算的出來吧? 2的10次方約是10的三次方? 06/23 03:02
Leeng:大前天才考完計概.......砰........ 06/23 03:03
flysonics:所以大概約是10的39次方的單位量?? @@||| 06/23 03:03
kafai:2^10~10^3 2^128~10^(3*13)~10^39 06/23 03:04
vicamo:大概是地球上每平方公尺有 6 億個籃子 ..... 06/23 03:05
kafai:128*log2=38.53 06/23 03:05
jskblack:雜湊法 XD 06/23 03:07
summerkof:340282367000000000000000000000000000000差不多這麼大? 06/23 03:06
htalent:其實是 444,444,444,444,444,444,444,444 驚! 06/23 03:08
KyleTso:不用管揪竟有多大 只要知道產生的量足夠對應到所有認證碼 06/23 03:08
vicamo:340282366920938463463374607431768211456 06/23 03:40
> -------------------------------------------------------------------------- < 作者: gnagna (節能停上1小時) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 03:09:07 2007 ※ 引述《vicamo (asdf)》之銘言: : ※ 引述《Leeng (里恩)》之銘言: : : 在此之前 : : 想先請教阿髮妻讀認證圖的原理.... : : 究竟圖形與認證碼以及那串md5有什麼關聯呢? : : 麻煩強者解釋一下... : hash 是指一種對應方式 : 例如說有很多數字,我們就光看最後的一個 digit 來分類 : 尾數是 1 的放到籃子 1,2 的放到籃子 2 .... : 當我們有很多很多的籃子時,可以假定幾乎不可能出現籃子裡有兩個東西 : 當然啦,你有更多東西要放到這些籃子的時候就一定會重複 : 如果我們假定 Ian 生出來的圖不多,那就大概可以說籃子裡不會有兩個東西 : 也就可以拿來分辨在 a 籃的東西一定跟 b 籃的東西不一樣 : 所以把籃子的編號拿來當 key,認證碼就是我們要的值,這樣的一對一關係用以檢索 : md5 就是我們用來生成籃子編號的方法,它會生成 2^128 個籃子 我不會寫程式但是我想提供一下想法 : 有沒有可能我們連進去點點點的網站以後就固定只抓一些圖來認證 : 圖是我們抓來放的,不是站方給的,這樣有可能騙過主機嗎?? -- 世界滑鼠點擊大賽:Click~Click~Click http://www.clickclickclick.com/ 台灣官網: http://www35.atwiki.jp/clicktaiwan/pages/11.html 台灣PTT bbs官版: telnet://ptt.cc 版名: HOT_Game 台灣gaaan版: http://www.gaaan.com/clickclickclick 點點點台灣聊天部屋: http://0rz.tw/ce2IQ Taiwan!!! Click~Click~Click!!! Let me show it (Taiwan)!!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.123.8.34
BigSuckTube:???? 06/23 03:09
nmchen:阿....ㄚ你就說阿... 06/23 03:09
flysonics:你的想法用別的顏色標啦 這樣會跟原文搞混耶 06/23 03:09
hakkinen1984: 快說快說 06/23 03:09
gnagna:最下面那三行就是了 色碼忘了改 06/23 03:09
johnnyaiba:他前面加到: 變成引文... 06/23 03:10
PPPGGG:....一片空白是跑不出東西的..... 06/23 03:10
htalent:這跟開GM8改OnlineGame人物的HP有異曲同工之妙XD 06/23 03:10
tubou:我想笑 撲 06/23 03:10
sony1256:XDDD 06/23 03:10
flysonics:你的意思是用暴力狂洗 洗到認證圖剛好我們SERVER有? 06/23 03:11
gnagna:我的意思是能不能貼上我們的圖然後經過認證騙過站方 06/23 03:11
saiboyu:這樣跟攻擊有啥二樣 06/23 03:13
KyleTso:不能 06/23 03:13
flysonics:這樣就有點算是駭的動作了吧? 何況對方安全步驟一定有 06/23 03:13
vicamo:網頁載入的時候,它會動態地配給那個t參數讓我們去跟它伸圖 06/23 03:12
Swordfish2:就算可以,這已經算是駭客行為了吧 06/23 03:14
htalent:能改的只有客戶端,就算本機圖片換了 留存伺服器的不會變 06/23 03:14
KyleTso:認證是server端在處理 沒辦法(不成文規定)影響server端 06/23 03:13
htalent:所以回傳回去的數值,一樣會比對錯誤的 06/23 03:14
flysonics:那個不成文規定就是為了網路安全啊= = 06/23 03:14
vicamo:,如果你的t不是從他那來的,拿已知的去跟它要,它還是會給 06/23 03:14
vicamo:但是等一下的驗證不會過 06/23 03:15
flysonics:所以以v大說法 暴力狂洗也是不可行的? 06/23 03:16
saiboyu:樓上我想問一下 這種圖片認證都是這種處理方式嗎 06/23 03:16
vicamo:(這個行為算駭嗎,我覺得不算駭"進去",只是在外面駭而已) 06/23 03:16
htalent:不... 連續打錯也會被笨 我剛剛忙推文誤按一堆enter也死 06/23 03:16
saiboyu:還是看SERVER端怎麼設計 06/23 03:16
vicamo:看 server 怎麼設計,現在還不是最嚴重的。 06/23 03:17
htalent:劍魚大應該是以為連server端圖片也換掉 才會那樣說(我猜 06/23 03:18
flysonics:最嚴重的情況是? 06/23 03:18
saiboyu:那你怎麼知道點點點他們是這樣設計的 你看封包內容嗎 06/23 03:18
vicamo:看過啊,我最愛抓封包了~~~ 06/23 03:19
htalent: 啊,我最愛被抓包了~~~ (? 06/23 03:20
A1pha7: 啊,我最愛吃肉包了~~~ 06/23 03:22
htalent:還是正經一點好了... 貌似前面好幾天有些文章提到了流程 06/23 03:22
htalent:不小心有喵到的話 其實要猜出大概的架構還不算太難 06/23 03:23
saiboyu:第幾篇阿 我想研究一下 06/23 03:24
vicamo:最嚴重的情況就是一開始擔心的情況,所有圖自動生,不重覆 06/23 03:22
flysonics:嗯嗯 討論大部份都還是建立在不是自動生的前提下.... 06/23 03:26
htalent:原則上伊安不太敢全面自動化產生?(不敢說太滿 上次有悲慘 06/23 03:33
htalent:經驗, 才說GGB不會修改,隔天馬上更新 黑暗法失效 囧) 06/23 03:33
> -------------------------------------------------------------------------- < 作者: johnsonla (johnson) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 03:27:08 2007 假設新圖是有限個,只是數量龐大。 目前大概分3 4 5碼 約7種底色。 假設3碼的出現機率是1/3 而且已知是子母子 or 母子母 and 7種底色 那這樣個數約(20*6*20+6*20*6)*7 = 21,840 直接把21840個編碼加到資料庫中 有辦法提升到30%的準確率嗎?? -- 我是唸統計的= =" -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.115.225.96
flysonics:問題不是只有顏色這麼簡單= = 06/23 03:27
aries45:字母在圖片中的位置也有影響 06/23 03:29
mvp04:隨機產生也有可能重複吧 06/23 03:29
flysonics:看是哪一種 有可能是批次的 也有可能就全部隨機... 06/23 03:30
> -------------------------------------------------------------------------- < 作者: sadle (sadle) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 04:45:35 2007 圖片裡面如果有一些 pixel 是 random 指定的話, 眼睛可能看不出差異, 可是對直接使用圖檔內容比對或以圖檔內容 digest(md5) 來比對的方法來看, 結果就會完全不符. 驗圖是經由瀏覽當時的頁面裡指定圖片網址 http://www.clickclickclick.com/images/sec.asp?t=0.856168175382172 來產生和取得的. 如果猜的沒錯, t 參數會用來決定驗圖中的驗文.(不然幹嘛傳) 如果只有 t 參數參與驗圖生成, 只需紀錄 t 參數和驗文關係(mapping) 就可以完成對照表. ( 若有其他參數則此法無效 ). 如果以上看法得以証明, 這樣或許就可以避開 random pixel 反擊了. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 139.175.160.250
LPH66:據說決定圖的不只t一個參數? 06/23 04:46
waynesan:同樣的t不一定會跑出同一張圖 06/23 04:47
maxty1:電腦比人腦差的缺點 要精密很簡單...要模糊卻很困難... 06/23 04:48
licor710:不傳t給sec.asp仍然可取圖 06/23 04:58
SmallBeeWayn:應該只是其中一個參數吧...我猜來源IP一定是一個參數 06/23 04:59
SmallBeeWayn:然後還有伺服器系統時間 06/23 05:00
sadle:這樣的話, t 應該是避免圖檔用到 cache 的才是(真是失禮了) 06/23 05:09
> -------------------------------------------------------------------------- < 作者: SmallBeeWayn (喵喵叫的蜜蜂貓) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 04:50:31 2007 首先,在談到結構該怎麼搞之前,先討論一下資料該怎麼存放的問題... 基本上,資料有三項, 來源(圖片特徵值), 結果(辨識結果), 加入時間 我看了一下愛台灣.txt 居然用64,16 Byte長度的資料@_@ 對結果做加密就算了, 來源值似乎也做過加密...? 基本上來源值用MD5或是CRC-64應該就足夠防止算出結果重複了 如果在換算之前多一道內部XOR的話,MD5/CRC的值就可以直接傳送了 我的建議的話...CRC-64長度為16Byte, 應該滿合適的 結果的話因為需要接收方做解密的關係 原本的加密方法應該就繼續使用下去 伺服器的儲存當然還是SQL比較好 用來源做Primary, 加入時間做Index 每一筆的資料長度大約是32Byte 然後以每x筆為單位做一個升級包 由於資料長度固定, 逗號跟換行其實都不需要的資訊 倒是升級包需要做一個整個資料的效驗碼,免得資料傳錯了... 伺服器的工作則分為兩個部份 1.接受客戶端的更新提供 2.接受版本更新請求 當客戶端啟動的時候 會向伺服器提供自身當前版本 並由伺服器方面提供一直到最新版本為止的升級包 為了簡化封包複雜性 這兩項工作應該由不同的服務Port來處理 而且最好是用UDP方式 甚至其實也可以用不同的主機來處理 一台機器只儲存升級包,另一台才處理資料 之後,當客戶端收到新的來源時,並不立即請求更新 除非系統已經超過一段時間接收到新來源且一直沒有提交更新 (也就是當使用者不在的時間)才用啟動模式更新版本 另一方面,當客戶端有提供新的結果時 會向伺服器提交包含自身當前版本及最新的來源&結果 伺服器就會更新資料庫,並且檢查新的升級包是否已經完成 如果已經完成則回傳 ============== 再來,就是偽造的請求跟偽造的結果這兩個問題 偽造的版本更新請求會讓伺服器負載過度 我是不知道是不是有人會這樣搞啦 不過版本更新請求還是應該加一點驗證碼才是... 偽造的結果可以利用重複檢核或是信任的支援者來處理 重複檢核就是儲存同一個來源的結果重複率跟來源主機 也就是假定多數的使用者提供的是正確得結果 不過萬一遇到DDOS一樣無法 或者就是在新增一種封包請求 就是「這一筆來源-結果對應是錯的」這樣的信息 但是其實一樣擋不住DDOS 信任的支援者是比較安全的方式 也就是只讓特定的一些人提供更新資料 其他人只能請求新的升級包 這種的好處是不怕被假結果攻擊... 不過要找信任的支援者很麻煩的, 得主動去找 或者呢,就是讓整個資料的編碼複雜性增加 讓來源&結果的編碼互相掛勾 增加偽造結果的複雜性 這方面的方法我還沒想到.... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.115.204.46
TIM751010:為什麼這裡會讓我想起K2的空氣... 06/23 04:52
maxty1: MD5...不是驗證碼嗎...還可以解碼嗎= =??? 06/23 04:53
jhjhs33504:推認真文 06/23 04:56
gnagna:推認真文 雖然我不太懂 06/23 04:56
SmallBeeWayn:不需要解碼啊, 來源圖為何要解碼...? 06/23 04:58
a1212520:推認真文 雖然不懂 06/23 04:58
SmallBeeWayn:編碼之後跟資料庫做比對就可以了 06/23 04:58
nanako81240:推認真文 對我來說是天書 06/23 05:01
rupcj:不懂還是推 06/23 05:03
hari:推認真文~但是我只想知道~要做什麼才好~ 06/23 05:13
sadle:db 是文字檔, 加密後應可用 CVS/Subversion 來同步 06/23 05:13
jeremychang:專業啊 06/23 09:01
> -------------------------------------------------------------------------- < 作者: victor740519 (  ) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 04:56:19 2007 ※ 引述《sadle (sadle)》之銘言: : 圖片裡面如果有一些 pixel 是 random 指定的話, 眼睛可能看不出差異, : 可是對直接使用圖檔內容比對或以圖檔內容 digest(md5) 來比對的方法來看, : 結果就會完全不符. : 驗圖是經由瀏覽當時的頁面裡指定圖片網址 : http://www.clickclickclick.com/images/sec.asp?t=0.856168175382172 : 來產生和取得的. 如果猜的沒錯, t 參數會用來決定驗圖中的驗文.(不然幹嘛傳) : 如果只有 t 參數參與驗圖生成, 只需紀錄 t 參數和驗文關係(mapping) : 就可以完成對照表. ( 若有其他參數則此法無效 ). : 如果以上看法得以証明, 這樣或許就可以避開 random pixel 反擊了. 那這這樣不能固定抽取圖中的某個部份做比對? (例如:最中間那一行的像素作比對) 假設只是雜幾個點進去的話,或許剛好可以避開 目前還不清楚他是如何產生亂數圖,還需要更多圖才能比對出結果...... 幾小時前手動蒐集幾十張,沒看到半張一樣的,很沒效率 看來只能用程式去抓圖..... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.225.13.170
J06u9jy:我第一版程式就是這樣做, 水平垂直中間線顏色 06/23 04:56
J06u9jy:當初這樣寫就是想說可以做成容錯能力較強的 06/23 04:57
gnagna: J 大出現了 充滿希望 06/23 04:57
jhjhs33504:問一下~現在可以開全自動嗎? 06/23 05:00
victor740519:j大...能不能寫個抓圖的程式? 圖多比較好統計。 06/23 05:00
gnagna:全自動是指鎖滑鼠嗎?? 06/23 05:01
victor740519:幾乎不行........ 06/23 05:01
jhjhs33504:哪我睡醒再戰~*_*\~/ 06/23 05:02
J06u9jy:剛抓了四百多張看了一下,他們應該沒有做加雜訊這件事 06/23 05:02
J06u9jy:看起來只是他們圖庫變大n倍 06/23 05:03
J06u9jy:才抓20分鐘已經開始每五六個就會有重複了 06/23 05:04
victor740519:orz....那只好硬上了.... 06/23 05:04
J06u9jy:有個最簡單的方法, 把辨識資料庫架在server上 06/23 05:05
TIM751010:推推推.讓大家看看台灣實力XD 06/23 05:05
J06u9jy:說到這個為什麼我不這樣做呢? = =+ 06/23 05:06
honochung:因為J大還有工作要做阿~ 06/23 05:07
victor740519:辨識資料庫......頻寬要夠大啊......要去租嗎? = =|| 06/23 05:06
victor740519:@@ 突然想到...要是明天又換圖庫怎麼辦? 06/23 05:11
TIM751010:換了...就看每個國家都開始歡樂... 06/23 05:13
alliao:資料庫需要什麼呢?反正我就在英國抓他網站超快的... 06/23 05:14
TIM751010:有援軍咧 06/23 05:15
> -------------------------------------------------------------------------- < 作者: SmallBeeWayn (喵喵叫的蜜蜂貓) 看板: HOT_Game 標題: Re: [討論] ====關於解決隨機認證圖==== 時間: Sat Jun 23 05:25:27 2007 ※ 引述《victor740519 (  )》之銘言: : → J06u9jy:剛抓了四百多張看了一下,他們應該沒有做加雜訊這件事 06/23 05:02 : → J06u9jy:看起來只是他們圖庫變大n倍 06/23 05:03 : → J06u9jy:才抓20分鐘已經開始每五六個就會有重複了 06/23 05:04 : → J06u9jy:有個最簡單的方法, 把辨識資料庫架在server上 06/23 05:05 : 推 TIM751010:推推推.讓大家看看台灣實力XD 06/23 05:05 : → J06u9jy:說到這個為什麼我不這樣做呢? = =+ 06/23 05:06 : 推 honochung:因為J大還有工作要做阿~ 06/23 05:07 : 推 victor740519:辨識資料庫......頻寬要夠大啊......要去租嗎? = =|| 06/23 05:06 資料的部份, 我提出的方法是來源跟結果各使用16Byte 在假定不加入任何反DOS機制的情況下, 加上2Byte CRC-8 網路封包標頭長度為40Byte, 因此總計封包長度58Byte 以Click分速200,000計算, 每張圖送出600個結果, 每張圖單向58Byte 因此每日網路流量為200000/600*58*60*24/1024/1024=26MB/day 所以...完全不用擔心網路流量的問題.... 至於資料庫大小.... 老實說我估不出來XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.115.204.46
J06u9jy:剛抓滿40分鐘1144張不重複的圖 06/23 05:35
killman:我之前自己玩的時候是只讀取圖片中間一行的像素 應該較省 06/23 14:43