→ micklin:謝謝您的回答 08/18 16:27
※ 引述《micklin (mick)》之銘言:
: 最近在處理基因序列, 資料的儲存一直讓我很頭痛,
: 在傳統資料處理時, 我都把column對應到feature, 把row當成一筆資料.
: 但是現在的問題是MySQL不能處理2000個column (colon dataset),
: 更別說另一個五萬多個基因的dataset了.
: 轉成文字模式再用UltraEdit處理, 在4096個字元後就強迫斷行了 = =
: 雖然可以自己用程式接起來就是了....
: 所以我的問題是,
: 在處理行與列的時候有沒有什麼不同呢?
: 為什麼我們平常處理文字檔或資料庫的時候,
: 會偏好row很多而不是column很多?
: 是檔案結構的問題還是什麼地方的限制呢?
: 謝謝回答.
因為電腦儲存是循序的,以列當一筆資料,
那麼這筆資料中每一項資訊是連續儲存的,當你要提取一筆資料時,
處理上會較快。(先不論空間破碎的問題)
而以行為一筆,若你一百筆資料,
當你要提取一筆資料時,就變成提出一項,
跳過其餘九十九筆的第一項,再提出第二項,
依此類推,會慢上不少。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.118.175.182