作者west1996 (焦了六年變脆了)
看板Statistics
標題Re: [程式] SAS如何將重複資料分組
時間Fri Mar 5 18:29:05 2010
※ 引述《haoyunwhite (毛毛)》之銘言:
: [軟體程式類別]:
: SAS
: [程式問題]:
: 如何解決重複資料的分組
: [軟體熟悉度]:
: 資料處理的新手
: [問題敘述]:
: 資料內容為
: id1 id2
: 1 A
: 1 B
: 1 C
: 2 A
: 2 B
: 3 A
: 4 B
: 4 D
: 5 C
: 6 E
: 7 F
: 另外一種排序
: id1 id2
: 1 A
: 2 A
: 3 A
: 1 B
: 2 B
: 4 B
: 1 C
: 5 C
: 4 D
: 6 E
: 7 F
: 8 F
: 8 G
: 目的要把id2有重複的歸為一個群組
: 也就是說id1為1的包含A、B、C
: id1為2的包含A、B
: id1為3的包含A
: id1為4的包含B、D
: id1為5的包含C
: 上述的資料id2全部共出現A、B、C、D
: 將資料中id2包含A、B、C、D其中一個就將之分為同一group
: 最終希望將id1分類包含相同id2的類別
: 希望跑出的結果如下:
: id1 group
: 1 a
: 2 a
: 3 a
: 4 a
: 5 a
: 6 b
: 7 c
: 8 c
: 沒有頭緒 拜託各位給一點意見
: -----------------------------------------------------------------------------
幫原po翻譯一下
他想做的應該是類似人際網路的東西
想像每一個id1都是一個人
每一個id2都是一種鑰匙
規則如下:
一個人可以有很多鑰匙
一種鑰匙也可以有很多人同時擁有
只有相同鑰匙的人才會互相認識
不過人也可以藉由認識的人去認識另外的人
例如id1=5的人可以藉由鑰匙C去認識id1=1這個人(他有ABC三把鑰匙)
然後再透過鑰匙A去認識id1=3的人
只要是有辦法經由這樣的多層關係互相認識的人都算是同一組的
根據以上規則
我們可以把所有人分成一個或以上的群組
原po應該是想把這樣的分組結果找出來
以上是我的理解
有錯還請告知:)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.36.126.188
推 kenshin528:以前幫人家處理過網絡資料 真的很頭大XD 03/05 18:47
推 haoyunwhite:先謝謝你的解釋...晚上出門回來再確認.. 03/05 19:03
推 haoyunwhite:仔細看過,就是這個意思!!感謝你的解釋..不知道有沒 03/05 20:25
→ haoyunwhite:有方法可以解決... 03/05 20:25
→ liton:linked?? 03/07 01:02
→ liton:六度空間分隔理論? 03/07 01:04
推 haoyunwhite:我不太確定怎麼使用這方法 ...可以給一點提示嗎 03/08 10:09