→ andrew43: 你熟悉regular expression嗎? 02/22 00:45
→ andrew43: 另外,如果只靠字元數判斷,可靠嗎? 02/22 00:46
→ squallscer: 因為他有自己的codebook 字元數他們已經設定好了! re 02/22 01:00
→ squallscer: gular expressions 我目前還不清楚 >< 02/22 01:00
推 celestialgod: 不知道strsplit可不可以用? 02/22 08:56
推 andrew43: 沒意外的話,此例以正規表達式解決滿單純的。 02/22 12:42
→ andrew43: 耶,id就取前三字元,sex就判斷有沒有"male"即可, 02/22 15:47
→ andrew43: 生日就取最後8字元,income就"e"之後到倒數第9字元。 02/22 15:47
→ andrew43: 這樣的規則夠不夠強韌?可以的話就可以下手了。 02/22 15:48
→ andrew43: sex就判斷有沒有"female"即可。 02/22 15:55
→ celestialgod: substr, regexpr就可以達成了 02/22 20:39
→ squallscer: 感謝各位前輩幫忙,但是資料有2000萬多Row 02/23 17:03
→ squallscer: 分割出來的欄位也有10個以上,發現用substr執行速度 02/23 17:04
→ squallscer: 相當的慢,還在苦惱中~ 02/23 17:05
→ celestialgod: 用 Rcpp加速吧QQ.. 02/23 20:26