精華區beta CSSE 關於我們 聯絡資訊
※ 引述《micklin (mick)》之銘言: : 最近在處理基因序列, 資料的儲存一直讓我很頭痛, : 在傳統資料處理時, 我都把column對應到feature, 把row當成一筆資料. : 但是現在的問題是MySQL不能處理2000個column (colon dataset), : 更別說另一個五萬多個基因的dataset了. : 轉成文字模式再用UltraEdit處理, 在4096個字元後就強迫斷行了 = = : 雖然可以自己用程式接起來就是了.... : 所以我的問題是, : 在處理行與列的時候有沒有什麼不同呢? : 為什麼我們平常處理文字檔或資料庫的時候, : 會偏好row很多而不是column很多? : 是檔案結構的問題還是什麼地方的限制呢? : 謝謝回答. 因為電腦儲存是循序的,以列當一筆資料, 那麼這筆資料中每一項資訊是連續儲存的,當你要提取一筆資料時, 處理上會較快。(先不論空間破碎的問題) 而以行為一筆,若你一百筆資料, 當你要提取一筆資料時,就變成提出一項, 跳過其餘九十九筆的第一項,再提出第二項, 依此類推,會慢上不少。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.118.175.182
micklin:謝謝您的回答 08/18 16:27