精華區beta CSSE 關於我們 聯絡資訊
最近在處理基因序列, 資料的儲存一直讓我很頭痛, 在傳統資料處理時, 我都把column對應到feature, 把row當成一筆資料. 但是現在的問題是MySQL不能處理2000個column (colon dataset), 更別說另一個五萬多個基因的dataset了. 轉成文字模式再用UltraEdit處理, 在4096個字元後就強迫斷行了 = = 雖然可以自己用程式接起來就是了.... 所以我的問題是, 在處理行與列的時候有沒有什麼不同呢? 為什麼我們平常處理文字檔或資料庫的時候, 會偏好row很多而不是column很多? 是檔案結構的問題還是什麼地方的限制呢? 謝謝回答. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 70.171.224.50
cruise:把資料轉成數字編號,然後存二進位檔,應該也沒幾MB吧... 08/18 13:54
cruise:而且基因序列,應該也比較不用考慮動態增減的問題吧? 08/18 13:55
cruise:(這領域不熟)只要不要一個基因,還會有什麼動態feature變 08/18 13:57
cruise:動,應該都可以直接轉成數字編碼 08/18 13:58
micklin:可是為了配合現有程式, 我要塞到資料庫去 orz 08/18 16:25