看板 DataScience 關於我們 聯絡資訊
※ [本文轉錄自 Python 看板 #1SQN4mLr ] 作者: f496328mm (123) 看板: Python 標題: [心得] 分享 台鐵驗證碼辨識/轉文字 package 時間: Sun Feb 17 22:35:25 2019 https://github.com/linsamtw/TaiwanTrainVerificationCode2text 分享我開發的 package,台鐵驗證碼( 辨識 )轉文字 可直接 pip3 install TaiwanTrainVerificationCode2text 提供各位開發程式訂票,其中驗證碼破解部分的方法,可直接使用此 package 辨識,不 須再回傳 image 用人工方式辨識。 test data 準確率約為 88%,使用 10 萬張圖進行 training ---------------------------------------------------------- demo : input https://imgur.com/aCmz45y.jpg
output WNBA8S --------------------------------------------------------- 使用方法如下 import os from TaiwanTrainVerificationCode2text import verification_code2text from TaiwanTrainVerificationCode2text import work_vcode from TaiwanTrainVerificationCode2text import download import TaiwanTrainVerificationCode2text PATH = TaiwanTrainVerificationCode2text.__path__[0] import cv2 import matplotlib.pyplot as plt import random # 下載我 train 好的 weight,ttf 是驗證碼字形,用於以下生成模擬驗證碼 download.weight() download.ttf() # 生成模擬驗證碼 work_vcode.work_vcode_fun(10,'test_data',5) work_vcode.work_vcode_fun(10,'test_data',6) file_path = '{}/{}/'.format(PATH,'test_data') train_image_path = [file_path + i for i in os.listdir(file_path+'/')] # 隨機取一個當作 demo image_name = train_image_path[random.sample(range(len(train_image_path)),1)[0]] # 讀取圖片 image = cv2.imread(image_name) # 畫圖 plt.imshow(image) # 辨識,驗證碼轉文字 text = verification_code2text.main(image) # 印出最後結果 print(text) ps : 使用 keras 進行建模預測,並將 train 好的 weight 提供下載使用 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.85.190 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1550414128.A.575.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: f496328mm (118.233.85.190), 02/17/2019 22:56:02
hn28082251: 推推 02/17 23:33
Wush978: 小心違法 02/18 00:52
Wush978: 我忘記是哪一條了,但是之前有印象做台鐵驗證碼的OCR可能 02/18 00:54
Wush978: 有觸法之虞,建議低調 02/18 00:55
jasonwu23: 了不起 我支持你 不論技術或分享的心都是 02/18 13:05
sma1033: 認真有心幫助社群只能給推 02/21 11:40
kwht: 推~感謝 05/07 10:53