看板 Soft_Job 關於我們 聯絡資訊
好吧這麽多人有captcha的問題 這邊提供點經驗 事實上來說 captcha就是個圖檔罷了 我的作法就是把這個圖檔抓下來 然後OpenCV後製處理一下 透過處理雜訊侵蝕膨脹之類讓字盡量好讀 然後以寬跟高切分出不同的幾張圖檔出來 每張丟進去OCR讀出各別的字出來組成String OCR也可以針對特定網站調整一下字型 比較好比對字的相似度 然後就送出吧 失敗就重來一次 反正一般captcha猜錯都是叫你重來而已 辨識率能有個5成就夠用了 之前是搞遊戲的大量帳號登入拿獎勵在搞這個XD 小弱弱的我不會什麼機器學習的 會機器學習的透過大量的跑可以提升辨識率了吧 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.147.95 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1484653670.A.800.html
jimmy689: ㄋ肯定沒被googleㄉ我不是機器人電過齁 01/17 19:50
ripple0129: 還真的沒,沒遇到過要處理google我是機器人的需求過XD 01/17 19:53
vi000246: 拓元的captcha是用YII寫的 研究一下發現很麻煩XD 01/17 20:17
vi000246: 怕成功率太低 票就被搶光了 01/17 20:18
gerojeng: https://github.com/naptha/tesseract.js 01/17 20:30
abc01251: 所以週末五月天 大家都抓好外掛了!? 01/17 22:23
brucetu: 好啦 打api給大陸人工答題99%正確 還處理個毛 01/17 23:19
et69523820: 驗證碼直接繞過連破解都不用 程式把驗證碼單獨拉到 01/18 06:16
et69523820: 第一步驟 用肉眼辨識填上驗證碼的答案 開始讓程式自動 01/18 06:18
et69523820: 開始一步一步往下做 等遇到要輸入驗證碼的時候 程式 01/18 06:19
et69523820: 把之前輸入的驗證碼答案 自動帶上送出 01/18 06:19
et69523820: 有個重點要注意到 不能讓對方系統產生新的驗證碼 01/18 06:20
et69523820: 如果產生新的驗證碼 你之前填的驗證答案就不對了 01/18 06:21
et69523820: 這裡有技巧性 可以讓對方驗證碼產生不出來 01/18 06:22
ssccg: 這些都看對方的頁面安全性做的怎樣,case by case吧 01/18 09:48
DWR: 考慮驗證自己打 其他寫程式跑 阿妹搶票沒搶到的怨念 01/18 18:47