[問題] 如何exclude 兩個vectors重複的數

作者oliversu (su)

看板R_Language

標題[問題] 如何exclude 兩個vectors重複的數

時間Sun Jan 24 14:30:21 2016

[軟體熟悉度]: 入門 [問題敘述]: 我有兩個vectors 分別叫做 sampledata與controldata controldat是從sampledata隨機取樣3750個現在我想做一個treatmentdata是把上述兩個vector重複的數字刪掉然而，因為sampledata裡面本身就有重複的數字如果使用 setdiff這個函數就會發生重複數字被刪除兩次例如 sampledata{2,3,2,7,5,8,9,8} controldata{2,8} 預期得到結果 sampledata{3,2,7,5,9,8} 我也試過%in% 的方式，但發現都無法如預期由於資料頗大，我無法確認%in%的問題出在哪希望大家幫幫我我才剛開始摸索R 感謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 72.33.2.245 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1453617023.A.8F9.html

→ andrew43: 可以的話不要這樣想。應該先有一個包括所有資料的表格。 01/25 02:22

→ andrew43: 其中這個表格必須有ID欄。你現在沒有ID，所以怎麼切都會 01/25 02:23

→ andrew43: 不知道哪裡出問題。 01/25 02:23

→ andrew43: 又因為你有ID欄，要切資料、取交集聯集都會容易很多。 01/25 02:24

→ andrew43: 如果 01/25 02:24

→ oliversu: 謝謝，換個切入點思考就解決了 01/25 14:09