精華區beta HOT_Game 關於我們 聯絡資訊
※ 引述《elic2577 (艾力克)》之銘言: : [前文恕刪] : 如果改成 : 1.去官網讀取圖檔 : 2.攻擊兵用吸他傳檔器將圖檔資料傳給主機(等待時間可以5秒內) : 3.主機搜尋到圖檔資料庫內有一筆答案 70萬筆的話要好好想一個搜尋方式了.. 直接下sql的話應該會撐不住 就速度來說 mysql>> postgresql > mssql : 4.將答案回傳給攻擊手 : 5.若主機查詢不到答案,將圖檔傳給打字兵 : 6.而攻擊手5秒內等不到答案自動更改成20秒後向主機問答案 : 7.打字兵辨識後回傳給主機 : 8.等待10-20秒的攻擊手去問主機有沒有該圖檔的答案 我提供一點輔助說明 就我自己開發自動戰情機的狀況看來 認證碼在60秒後再拿都還有效 所以如果能夠把theta改成 1.等待10~20秒後問主機 2.打字兵還沒打的話在等xx秒再問 3.超過一定時間,alpha換下一張圖 這樣在打字兵短缺的情況下 就不會有一直拿不到認證碼的情形 (也降低ban率) : 9.等到答案的攻擊手攻擊伊安 : 這樣,打字兵會輕鬆很多,因為8成的圖檔都至少有過一次以上重複 所以目前推估Ian的圖檔母群是100萬筆嘍 真是大手筆啊Ian... : 也可以解救目前打字兵不足的問題 : 但,要等P帥今天口試完後,再決定可行性 : 最後,我不姓周,名字跟守遜也差蠻多的 : 如果我數學不好,請不要鞭我 ^___^ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.160.181.22
victor740519:問一下....「同樣驗證碼但不同圖片」的會不會算同一 07/05 10:32
victor740519:張圖? 07/05 10:32
victor740519:我看過都是get但不同圖片的..... 07/05 10:32
victor740519:看過三張了吧..... 07/05 10:32
elic2577:回victor不算,只要圖檔有一丁點不一樣,就不算同一筆資 07/05 10:40
chuchin:有個疑問,怎麼確定第一個人打到這張圖的人答案是對的? 07/05 11:04
chuchin:第一筆的資料需要傳送這張圖的攻擊兵的武器回傳答案正確? 07/05 11:05
> -------------------------------------------------------------------------- < 作者: elic2577 (艾力克) 看板: HOT_Game 標題: Re: [戰報] 07:35~07:49 時間: Thu Jul 5 11:06:44 2007 ※ 引述《invalid (everlasting)》之銘言: : 70萬筆的話要好好想一個搜尋方式了.. : 直接下sql的話應該會撐不住 : 就速度來說 mysql>> postgresql > mssql 這邊,說一下目前的主機的loading 目前吸他接受來自各地的熱情,使用的CPU約在5%上下(穩定觀察10分鐘) 所以,吸他主機還很有得撐,他還閑的很 另外,有看到我之前的說明的話,應該知道我只怕防火牆 那台防火牆是很便宜的野牛牌,好像1000把塊 會當機的話,這個可能比較容易掛 上週日吸他主機失聯,我一直以為是防火牆掛了 後來也知道是有人動主機引起的,跟防火牆無關 如果要做這一段的話,主機要被操爆的機會真的不大 (真的掛了,就當我貢獻國家吧 T__T) : 我提供一點輔助說明 : 就我自己開發自動戰情機的狀況看來 : 認證碼在60秒後再拿都還有效 : 所以如果能夠把theta改成 : 1.等待10~20秒後問主機 : 2.打字兵還沒打的話在等xx秒再問 : 3.超過一定時間,alpha換下一張圖 : 這樣在打字兵短缺的情況下 : 就不會有一直拿不到認證碼的情形 : (也降低ban率) 這邊作法很多種 I大的方式也很值得P帥參考 : : 9.等到答案的攻擊手攻擊伊安 : : 這樣,打字兵會輕鬆很多,因為8成的圖檔都至少有過一次以上重複 : 所以目前推估Ian的圖檔母群是100萬筆嘍 : 真是大手筆啊Ian... 我的話,估計伊安的圖檔約在20萬上下 因為絕大多數都有過2次以上的重複(8成以上) 雖然最多重複的也只有200次左右 但中間份子30-50次的幾乎將近一半 因此推估20萬都還高估了呢 有請數學系的計算一下機率跟推估圖檔數(我不是周守遜啊啊啊啊啊啊啊啊啊.....) : : 也可以解救目前打字兵不足的問題 : : 但,要等P帥今天口試完後,再決定可行性 : : 最後,我不姓周,名字跟守遜也差蠻多的 : : 如果我數學不好,請不要鞭我 ^___^ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.87.128.36
cherrywish:淚推E大啊,辛苦了T____________T 07/05 11:07
taiwantshirt:一台主機爆掉換國家的一刻光榮 很值得啊XDD 07/05 11:10
jerryou:好難理解...總之...我也不是數學系的... 07/05 11:11
sunemblem:大推!!感謝E大!! 07/05 11:27
> -------------------------------------------------------------------------- < 作者: sqr (Harvey) 看板: HOT_Game 標題: Re: [戰報] 07:35~07:49 時間: Thu Jul 5 12:07:58 2007 小弟有一些想法 提出來與前輩分享 (部分引言恕刪) ※ 引述《elic2577 (艾力克)》之銘言: : 答案是3碼的重複率最高(是誰說伊安更新過隨機驗證後,三碼的就不再重覆了) : 但,令人跌破眼鏡的是三碼雖然重複率高,但次數還是少的可憐 : 下列表列一下 : 碼 次數 % : asd 213 0.031 asd好像不符合母子相間的規則... : ero 198 0.028 : 靠腰,不敢算了,不過眾版友應該可以知道如果還要走自動,我們會有什麼樣的情形 : 那,就這樣了嗎?也不是,是要改兵器的讀取方向 : 順便一提,在資料庫內只出現一次的約在10萬出頭多一點 : 也就是這些出現率很少的約也只在10%-20%之間 不知道是以圖計 還是以答案計 小弟認為應該要以圖計 因為一樣的答案可能來自不一樣的圖 : 其他的資料庫內都有了 : 如果目前兵器的讀取方向改一下 : 目前的作法是 : (略) : 如果改成 : 1.去官網讀取圖檔 : 2.攻擊兵用吸他傳檔器將圖檔資料傳給主機(等待時間可以5秒內) : 3.主機搜尋到圖檔資料庫內有一筆答案 : 4.將答案回傳給攻擊手 : 5.若主機查詢不到答案,將圖檔傳給打字兵 : 6.而攻擊手5秒內等不到答案自動更改成20秒後向主機問答案 : 7.打字兵辨識後回傳給主機 : 8.等待10-20秒的攻擊手去問主機有沒有該圖檔的答案 : 9.等到答案的攻擊手攻擊伊安 10.回傳答案是否正確給主機,以便建立正確的資料庫 因為有些圖看起來真的很容易誤會 可能看10次 有8次是錯的 或者打字兵疲勞看錯 按下Enter鍵才發現打錯了(小弟發生過 很歹勢) 如果能建立"回傳答案是否正確"的機制 對資料庫的建立應該是有幫助的 一點看法 討論討論 PS:小弟知道這篇文不對題 但是這樣也好 可以"偽裝"一下.. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.231.64.45
susanchi:我也常在送出後大叫@@" 對不起 07/05 12:12
> -------------------------------------------------------------------------- < 作者: dizzyben (頭暈班尼 @_@) 看板: HOT_Game 標題: Re: [戰報] 07:35~07:49 時間: Thu Jul 5 12:21:26 2007 ※ 引述《sqr (Harvey)》之銘言: : 小弟有一些想法 : 提出來與前輩分享 : (部分引言恕刪) : ※ 引述《elic2577 (艾力克)》之銘言: : : 答案是3碼的重複率最高(是誰說伊安更新過隨機驗證後,三碼的就不再重覆了) : : 但,令人跌破眼鏡的是三碼雖然重複率高,但次數還是少的可憐 : : 下列表列一下 : : 碼 次數 % : : asd 213 0.031 : asd好像不符合母子相間的規則... : : ero 198 0.028 : : 靠腰,不敢算了,不過眾版友應該可以知道如果還要走自動,我們會有什麼樣的情形 : : 那,就這樣了嗎?也不是,是要改兵器的讀取方向 : : 順便一提,在資料庫內只出現一次的約在10萬出頭多一點 : : 也就是這些出現率很少的約也只在10%-20%之間 : 不知道是以圖計 還是以答案計 : 小弟認為應該要以圖計 : 因為一樣的答案可能來自不一樣的圖 : : 其他的資料庫內都有了 : : 如果目前兵器的讀取方向改一下 : : 目前的作法是 : : (略) : : 如果改成 : : 1.去官網讀取圖檔 : : 2.攻擊兵用吸他傳檔器將圖檔資料傳給主機(等待時間可以5秒內) : : 3.主機搜尋到圖檔資料庫內有一筆答案 : : 4.將答案回傳給攻擊手 : : 5.若主機查詢不到答案,將圖檔傳給打字兵 : : 6.而攻擊手5秒內等不到答案自動更改成20秒後向主機問答案 : : 7.打字兵辨識後回傳給主機 : : 8.等待10-20秒的攻擊手去問主機有沒有該圖檔的答案 : : 9.等到答案的攻擊手攻擊伊安 : 10.回傳答案是否正確給主機,以便建立正確的資料庫 : 因為有些圖看起來真的很容易誤會 : 可能看10次 有8次是錯的 : 或者打字兵疲勞看錯 按下Enter鍵才發現打錯了(小弟發生過 很歹勢) : 如果能建立"回傳答案是否正確"的機制 : 對資料庫的建立應該是有幫助的 : 一點看法 討論討論 : PS:小弟知道這篇文不對題 但是這樣也好 可以"偽裝"一下.. 我認為應該可以繼續以 md5 的方式放入 mysql。 在建立資料庫的這段時間,每個人都手動。當圖片的 MD5 與輸入文字不同時,就刪除掉 (或是記錄下來)讓管理資料庫的人決定。 當資料數達到一定數目時,就可以嘗試著"自動 (以量取勝)"進行辨認。 若某一資料庫無法負荷時,建議使用 master DB 定時更新 slave DBs.. 然後由 client 端 (alpha7) 以 rand 方式選擇 slave DB.. 例圖: Master DB / \ Slave DB1 Slave DB(N) //////\\\\\ //\\\\\\\\\ Alpha 7 Clients Alpha 7 Clients 這只是想法... 請少鞭一點 :( -- ◢▅宅灣人▂▁╰(‵▽′)><(‵▽′)╯▁▂宅灣魂▆◣ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.132.106.165 > -------------------------------------------------------------------------- < 作者: invalid (everlasting) 看板: HOT_Game 標題: Re: [戰報] 07:35~07:49 時間: Thu Jul 5 12:28:50 2007 ※ 引述《elic2577 (艾力克)》之銘言: : 這邊,說一下目前的主機的loading : 目前吸他接受來自各地的熱情,使用的CPU約在5%上下(穩定觀察10分鐘) : 所以,吸他主機還很有得撐,他還閑的很 : 另外,有看到我之前的說明的話,應該知道我只怕防火牆 : 那台防火牆是很便宜的野牛牌,好像1000把塊 : 會當機的話,這個可能比較容易掛 : 上週日吸他主機失聯,我一直以為是防火牆掛了 : 後來也知道是有人動主機引起的,跟防火牆無關 : 如果要做這一段的話,主機要被操爆的機會真的不大 : (真的掛了,就當我貢獻國家吧 T__T) 其實...比起CPU使用量 我更想知道現在網路使用量啊 這台機器的水管真大...是放在電信機房裡嗎? : 我的話,估計伊安的圖檔約在20萬上下 : 因為絕大多數都有過2次以上的重複(8成以上) : 雖然最多重複的也只有200次左右 : 但中間份子30-50次的幾乎將近一半 : 因此推估20萬都還高估了呢 : 有請數學系的計算一下機率跟推估圖檔數(我不是周守遜啊啊啊啊啊啊啊啊啊.....) 我本來以為你70萬筆資料是已經去掉重複的了orz.. 剛剛本來想用常態曲線分析一下 結果標準差比平均值還大(汗) 看來還是得拿到分佈曲線才有機會了... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.160.181.22