→ victor740519:問一下....「同樣驗證碼但不同圖片」的會不會算同一 07/05 10:32
→ victor740519:張圖? 07/05 10:32
→ victor740519:我看過都是get但不同圖片的..... 07/05 10:32
→ victor740519:看過三張了吧..... 07/05 10:32
推 elic2577:回victor不算,只要圖檔有一丁點不一樣,就不算同一筆資 07/05 10:40
推 chuchin:有個疑問,怎麼確定第一個人打到這張圖的人答案是對的? 07/05 11:04
→ chuchin:第一筆的資料需要傳送這張圖的攻擊兵的武器回傳答案正確? 07/05 11:05
> -------------------------------------------------------------------------- <
作者: elic2577 (艾力克) 看板: HOT_Game
標題: Re: [戰報] 07:35~07:49
時間: Thu Jul 5 11:06:44 2007
※ 引述《invalid (everlasting)》之銘言:
: 70萬筆的話要好好想一個搜尋方式了..
: 直接下sql的話應該會撐不住
: 就速度來說 mysql>> postgresql > mssql
這邊,說一下目前的主機的loading
目前吸他接受來自各地的熱情,使用的CPU約在5%上下(穩定觀察10分鐘)
所以,吸他主機還很有得撐,他還閑的很
另外,有看到我之前的說明的話,應該知道我只怕防火牆
那台防火牆是很便宜的野牛牌,好像1000把塊
會當機的話,這個可能比較容易掛
上週日吸他主機失聯,我一直以為是防火牆掛了
後來也知道是有人動主機引起的,跟防火牆無關
如果要做這一段的話,主機要被操爆的機會真的不大
(真的掛了,就當我貢獻國家吧 T__T)
: 我提供一點輔助說明
: 就我自己開發自動戰情機的狀況看來
: 認證碼在60秒後再拿都還有效
: 所以如果能夠把theta改成
: 1.等待10~20秒後問主機
: 2.打字兵還沒打的話在等xx秒再問
: 3.超過一定時間,alpha換下一張圖
: 這樣在打字兵短缺的情況下
: 就不會有一直拿不到認證碼的情形
: (也降低ban率)
這邊作法很多種
I大的方式也很值得P帥參考
: : 9.等到答案的攻擊手攻擊伊安
: : 這樣,打字兵會輕鬆很多,因為8成的圖檔都至少有過一次以上重複
: 所以目前推估Ian的圖檔母群是100萬筆嘍
: 真是大手筆啊Ian...
我的話,估計伊安的圖檔約在20萬上下
因為絕大多數都有過2次以上的重複(8成以上)
雖然最多重複的也只有200次左右
但中間份子30-50次的幾乎將近一半
因此推估20萬都還高估了呢
有請數學系的計算一下機率跟推估圖檔數(我不是周守遜啊啊啊啊啊啊啊啊啊.....)
: : 也可以解救目前打字兵不足的問題
: : 但,要等P帥今天口試完後,再決定可行性
: : 最後,我不姓周,名字跟守遜也差蠻多的
: : 如果我數學不好,請不要鞭我 ^___^
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 219.87.128.36
推 cherrywish:淚推E大啊,辛苦了T____________T 07/05 11:07
→ taiwantshirt:一台主機爆掉換國家的一刻光榮 很值得啊XDD 07/05 11:10
→ jerryou:好難理解...總之...我也不是數學系的... 07/05 11:11
推 sunemblem:大推!!感謝E大!! 07/05 11:27
> -------------------------------------------------------------------------- <
作者: sqr (Harvey) 看板: HOT_Game
標題: Re: [戰報] 07:35~07:49
時間: Thu Jul 5 12:07:58 2007
小弟有一些想法
提出來與前輩分享
(部分引言恕刪)
※ 引述《elic2577 (艾力克)》之銘言:
: 答案是3碼的重複率最高(是誰說伊安更新過隨機驗證後,三碼的就不再重覆了)
: 但,令人跌破眼鏡的是三碼雖然重複率高,但次數還是少的可憐
: 下列表列一下
: 碼 次數 %
: asd 213 0.031
asd好像不符合母子相間的規則...
: ero 198 0.028
: 靠腰,不敢算了,不過眾版友應該可以知道如果還要走自動,我們會有什麼樣的情形
: 那,就這樣了嗎?也不是,是要改兵器的讀取方向
: 順便一提,在資料庫內只出現一次的約在10萬出頭多一點
: 也就是這些出現率很少的約也只在10%-20%之間
不知道是以圖計 還是以答案計
小弟認為應該要以圖計
因為一樣的答案可能來自不一樣的圖
: 其他的資料庫內都有了
: 如果目前兵器的讀取方向改一下
: 目前的作法是
: (略)
: 如果改成
: 1.去官網讀取圖檔
: 2.攻擊兵用吸他傳檔器將圖檔資料傳給主機(等待時間可以5秒內)
: 3.主機搜尋到圖檔資料庫內有一筆答案
: 4.將答案回傳給攻擊手
: 5.若主機查詢不到答案,將圖檔傳給打字兵
: 6.而攻擊手5秒內等不到答案自動更改成20秒後向主機問答案
: 7.打字兵辨識後回傳給主機
: 8.等待10-20秒的攻擊手去問主機有沒有該圖檔的答案
: 9.等到答案的攻擊手攻擊伊安
10.回傳答案是否正確給主機,以便建立正確的資料庫
因為有些圖看起來真的很容易誤會
可能看10次 有8次是錯的
或者打字兵疲勞看錯 按下Enter鍵才發現打錯了(小弟發生過 很歹勢)
如果能建立"回傳答案是否正確"的機制
對資料庫的建立應該是有幫助的
一點看法 討論討論
PS:小弟知道這篇文不對題 但是這樣也好 可以"偽裝"一下..
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.231.64.45
→ susanchi:我也常在送出後大叫@@" 對不起 07/05 12:12
> -------------------------------------------------------------------------- <
作者: dizzyben (頭暈班尼 @_@) 看板: HOT_Game
標題: Re: [戰報] 07:35~07:49
時間: Thu Jul 5 12:21:26 2007
※ 引述《sqr (Harvey)》之銘言:
: 小弟有一些想法
: 提出來與前輩分享
: (部分引言恕刪)
: ※ 引述《elic2577 (艾力克)》之銘言:
: : 答案是3碼的重複率最高(是誰說伊安更新過隨機驗證後,三碼的就不再重覆了)
: : 但,令人跌破眼鏡的是三碼雖然重複率高,但次數還是少的可憐
: : 下列表列一下
: : 碼 次數 %
: : asd 213 0.031
: asd好像不符合母子相間的規則...
: : ero 198 0.028
: : 靠腰,不敢算了,不過眾版友應該可以知道如果還要走自動,我們會有什麼樣的情形
: : 那,就這樣了嗎?也不是,是要改兵器的讀取方向
: : 順便一提,在資料庫內只出現一次的約在10萬出頭多一點
: : 也就是這些出現率很少的約也只在10%-20%之間
: 不知道是以圖計 還是以答案計
: 小弟認為應該要以圖計
: 因為一樣的答案可能來自不一樣的圖
: : 其他的資料庫內都有了
: : 如果目前兵器的讀取方向改一下
: : 目前的作法是
: : (略)
: : 如果改成
: : 1.去官網讀取圖檔
: : 2.攻擊兵用吸他傳檔器將圖檔資料傳給主機(等待時間可以5秒內)
: : 3.主機搜尋到圖檔資料庫內有一筆答案
: : 4.將答案回傳給攻擊手
: : 5.若主機查詢不到答案,將圖檔傳給打字兵
: : 6.而攻擊手5秒內等不到答案自動更改成20秒後向主機問答案
: : 7.打字兵辨識後回傳給主機
: : 8.等待10-20秒的攻擊手去問主機有沒有該圖檔的答案
: : 9.等到答案的攻擊手攻擊伊安
: 10.回傳答案是否正確給主機,以便建立正確的資料庫
: 因為有些圖看起來真的很容易誤會
: 可能看10次 有8次是錯的
: 或者打字兵疲勞看錯 按下Enter鍵才發現打錯了(小弟發生過 很歹勢)
: 如果能建立"回傳答案是否正確"的機制
: 對資料庫的建立應該是有幫助的
: 一點看法 討論討論
: PS:小弟知道這篇文不對題 但是這樣也好 可以"偽裝"一下..
我認為應該可以繼續以 md5 的方式放入 mysql。
在建立資料庫的這段時間,每個人都手動。當圖片的 MD5 與輸入文字不同時,就刪除掉
(或是記錄下來)讓管理資料庫的人決定。
當資料數達到一定數目時,就可以嘗試著"自動 (以量取勝)"進行辨認。
若某一資料庫無法負荷時,建議使用 master DB 定時更新 slave DBs.. 然後由 client
端 (alpha7) 以 rand 方式選擇 slave DB..
例圖:
Master DB
/ \
Slave DB1 Slave DB(N)
//////\\\\\ //\\\\\\\\\
Alpha 7 Clients Alpha 7 Clients
這只是想法...
請少鞭一點 :(
--
◢▅宅灣人▂▁╰(‵▽′)><(‵▽′)╯▁▂宅灣魂▆◣
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.132.106.165
> -------------------------------------------------------------------------- <
作者: invalid (everlasting) 看板: HOT_Game
標題: Re: [戰報] 07:35~07:49
時間: Thu Jul 5 12:28:50 2007
※ 引述《elic2577 (艾力克)》之銘言:
: 這邊,說一下目前的主機的loading
: 目前吸他接受來自各地的熱情,使用的CPU約在5%上下(穩定觀察10分鐘)
: 所以,吸他主機還很有得撐,他還閑的很
: 另外,有看到我之前的說明的話,應該知道我只怕防火牆
: 那台防火牆是很便宜的野牛牌,好像1000把塊
: 會當機的話,這個可能比較容易掛
: 上週日吸他主機失聯,我一直以為是防火牆掛了
: 後來也知道是有人動主機引起的,跟防火牆無關
: 如果要做這一段的話,主機要被操爆的機會真的不大
: (真的掛了,就當我貢獻國家吧 T__T)
其實...比起CPU使用量
我更想知道現在網路使用量啊
這台機器的水管真大...是放在電信機房裡嗎?
: 我的話,估計伊安的圖檔約在20萬上下
: 因為絕大多數都有過2次以上的重複(8成以上)
: 雖然最多重複的也只有200次左右
: 但中間份子30-50次的幾乎將近一半
: 因此推估20萬都還高估了呢
: 有請數學系的計算一下機率跟推估圖檔數(我不是周守遜啊啊啊啊啊啊啊啊啊.....)
我本來以為你70萬筆資料是已經去掉重複的了orz..
剛剛本來想用常態曲線分析一下
結果標準差比平均值還大(汗)
看來還是得拿到分佈曲線才有機會了...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.160.181.22