→ andrew43: 在R上承載資料的是什麼物件或類別?整數類矩陣嗎? 03/24 22:50
→ andrew43: 省不省記憶體應該還是和實做過程比較有關係。 03/24 22:51
→ andrew43: 可以的話,提供一個可重複的虛假例子。 03/24 22:51
舉例來說 一張圖片 480*640*3 這樣
因為我想到python做vgg16 所以先用R整理成 224*224*3
但只我轉換5000張圖片後 記憶體就快爆了
※ 編輯: f496328mm (114.42.103.52), 03/24/2017 22:57:00
→ celestialgod: 你怎麼寫? 03/24 23:02
→ andrew43: 如果是迴圈,每次處理完把物件存RData再rm()掉。 03/24 23:02
→ andrew43: 把資料輸出成實體檔案,之後再餵給python 03/24 23:04
→ andrew43: R的整數似乎都是32bit,此時是比較浪費,但應該有辦法處 03/24 23:06
→ andrew43: 理才對。 03/24 23:07
我先抓好每個檔案的位置 然後取5000個出來
之後一次轉一張圖片 最後整理成一個data.table出來這樣
用sapply這樣去做
python的整數是不是佔比較少ram?
因為我train有2萬張圖片 但是test有將近8萬張圖片QQ
※ 編輯: f496328mm (42.78.113.162), 03/24/2017 23:27:05
→ celestialgod: 重點是轉的過程... 03/24 23:40
→ celestialgod: 你應該是在轉的過程過了什麼操作才會用到那麼多RAM 03/24 23:40
→ celestialgod: 你給這樣的資訊,我也沒辦法給什麼建議 03/24 23:41
這是function
https://gist.github.com/f496328mm/a342cb39e8ae3b84f01be29a46bb81da
這是main
https://gist.github.com/f496328mm/44116adf79356f01e761cfe72627d213
※ 編輯: f496328mm (114.42.103.52), 03/25/2017 00:28:24
→ celestialgod: train.variable=cbind( img.name , train.variable) 03/25 00:59
→ celestialgod: 瓶頸在這行 03/25 00:59
→ celestialgod: 還有 colnames(train.variable) 03/25 01:00
→ celestialgod: data.table不是這樣用的... 你這樣會做deep copy... 03/25 01:00
ok 感謝 我晚點改改看
※ 編輯: f496328mm (114.42.103.52), 03/25/2017 01:09:52