看板 R_Language 關於我們 聯絡資訊
[軟體熟悉度]: 入門 [問題敘述]: 我有兩個vectors 分別叫做 sampledata與controldata controldat是從sampledata隨機取樣3750個 現在我想做一個treatmentdata是把 上述兩個vector重複的數字刪掉 然而, 因為sampledata裡面本身就有重複的數字 如果使用 setdiff這個函數就會發生重複數字被刪除兩次 例如 sampledata{2,3,2,7,5,8,9,8} controldata{2,8} 預期得到結果 sampledata{3,2,7,5,9,8} 我也試過%in% 的方式,但發現都無法如預期 由於資料頗大,我無法確認%in%的問題出在哪 希望大家幫幫我 我才剛開始摸索R 感謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 72.33.2.245 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1453617023.A.8F9.html
andrew43: 可以的話不要這樣想。應該先有一個包括所有資料的表格。 01/25 02:22
andrew43: 其中這個表格必須有ID欄。你現在沒有ID,所以怎麼切都會 01/25 02:23
andrew43: 不知道哪裡出問題。 01/25 02:23
andrew43: 又因為你有ID欄,要切資料、取交集聯集都會容易很多。 01/25 02:24
andrew43: 如果 01/25 02:24
oliversu: 謝謝,換個切入點思考就解決了 01/25 14:09