看板 Statistics 關於我們 聯絡資訊
某學校有100個社團,每間社團皆有紀錄團員名單並使用Excel紀錄起來。 又該學校有1000名學生,且每位學生可能依照自己的喜好參加0~3個社團, 目前學校希望了解哪幾對社團(希望找出前5對社團)有最多共同參加的學生, 以了解同學們選擇複數社團的喜好及未來整合社團資源的方向。 備註:若社團22一組為一對,100個社團可以有4950種組合 目前自己的想法如下: 步驟1:先給予社團獨立的代碼後,利用社團紀錄的團員名單將100個社團的團員名單整合如下: ┌──────┬──────┐ │社團ID  │學生ID  │ ├──────┼──────│ │AAA11 │E11XX │ ├──────┼──────│ │AAA11 │E12XX │ ├──────┼──────│ │AAA11 │F11XX │ ├──────┼──────│        :        : 步驟2:挑出參加2個以上社團的學生。利用excel的設定格式化條件將學生ID「重複的値」變色,然後使用篩選的依色彩篩選挑出參加2個以上社團的學生後建立新表格。 ┌──────┬──────┐ │社團ID  │學生ID  │ ├──────┼──────│ │AAA11 │E11XX │ ├──────┼──────│ │AAA11 │F11XX │ ├──────┼──────│        :        : 步驟3:計算哪幾對社團(希望找出前5對社團)有最多共同參加的學生這個我就不會了T︿T,我只想到用土法煉鋼的方式,做一張矩陣表(4950種組合…)畫正字記號來算… 有沒有大大可以給我一點靈感或是教我怎麼用excel或是SAS來挑呢?感激不盡T︿T -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.77.190.173 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1514255127.A.BA1.html ※ 編輯: danail (42.77.190.173), 12/26/2017 10:30:12 danail:轉錄至看板 Math 12/26 10:37
tan800630: 雖不知道明確做法 但這問題應該算是標準的購物籃分析 12/26 10:51
tan800630: 也許可以用這個關鍵字去找找看網路教學?(或是關聯法則) 12/26 10:51
recorriendo: 做一個社團X學生的矩陣 有參加記1 沒參加記0 12/27 01:04
recorriendo: 兩社共同人數即對應兩行內積 故全部配對矩陣乘法而已 12/27 01:08
tan800630: 尷尬 剛剛才看到因為網路問題重複推文 抱歉 12/27 11:07