看板 DataScience 關於我們 聯絡資訊
下載這份中文手寫的dataset出來是.mpf檔,查了下後發現好像是資料庫的檔案, 因為完全沒學過資料庫, 基本概念都不知道, 想知道有沒有甚麼方法可以讓python中pandas直接使用, 還是說一定要下載資料庫開啟 下面是要下載的dataset連結: http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html 中間的 OLHWDB1.1trn (274MB) 和 OLHWDB1.1tst (68MB) 麻煩各位了謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.118.40.184 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1558008192.A.ECB.html
DarkIllusion: 這應該是自定義的資料儲存格式 類似MNIST的.idx那樣 05/16 22:53
DarkIllusion: 你提供的網頁中的pdf檔連結有說明.mpf檔的結構 05/16 22:55
DarkIllusion: 你可以照著上面的說明寫一個函數去讀它 05/16 22:55
RumiManiac: The format of the feature data files is described 05/17 06:56
RumiManiac: in fileFormat-mpf.pdf. 05/17 06:56
RumiManiac: 頁面內容要看 05/17 06:57