看板 R_Language 關於我們 聯絡資訊
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) [問題敘述]: 我想用apriori做十三種藥物的關聯性分析 [程式範例]: 我是參考這篇 http://www.cc.ntu.edu.tw/chinese/epaper/0036/20160321_3606.html 我的資料是二元檔,共13個變項, beer=read.xlsx("d:\\stella\\R\\beer.xls",header=T,sheetIndex=1) beer=as.matrix(beer) 進行到這裡之後,要計算關聯性 rule=apriori(beer,parameter=list(supp=0.2,conf=0.8)) 可是計算的結果,我的lhs欄位都是空白的,只有rhs有我的13個變項, 想請問是這甚麼原因?謝謝! [環境敘述]: R 3.4.3 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.128.67.236 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1520839553.A.AF0.html
clansoda: 感覺跟前幾篇文章有87%像 03/12 19:01
zhiying: 我有先搜尋"購物籃",版上的文章,但沒看到跟我一樣的問題 03/12 22:42
zhiying: ,但也可能是我是新手看不出來lol我的檔案各個變數已經是 03/12 22:42
zhiying: 0和1,不過我跑了轉換矩陣那行程式後,雖然檔案描述有變成 03/12 22:42
zhiying: 矩陣,可是打開檔案呈現的樣子還是跟轉換前的一樣, 這是 03/12 22:42
zhiying: 正確的嗎?還麻煩各位高手幫忙解惑了! 03/12 22:42
Luluemiko: 關鍵字可以找關聯性分析 03/13 00:22
f496328mm: 你範例能跑成功嗎?如果可以,看看data的差異,或者是 03/13 10:22
f496328mm: 參數的問題 03/13 10:22
clansoda: 建議你調低你的supp跟conf,你這兩個都很高,可以看一下 03/13 10:55
clansoda: document這兩項分別代表什麼,conf 0.8幾乎篩不出任何 03/13 10:56
clansoda: 值是很正常的 03/13 10:56
zhiying: 謝謝大家的回覆!不好意思沒有講清楚,我的樣本數有13000 03/13 12:24
zhiying: ,supp跟conf我都調到小數點下好幾位,但結果都還是跑不出 03/13 12:24
zhiying: 來,這樣是代表我的資料之間沒有關聯性嗎? 03/13 12:24
zhiying: 我跑範例beer那個就跑的出來,觀察了資料,都是0,1的二元 03/13 12:39
zhiying: 檔,差在我的變數和資料比數多很多。 03/13 12:39
clansoda: 很難說,但我的經驗是調低以後,那種空白的現象還是會有 03/13 12:45
clansoda: 但是如果一筆有效資料都沒有的話,可能你還是要檢視自己 03/13 12:46
clansoda: 的資料,究竟有沒有你想要的關係 03/13 12:46
f496328mm: 有辦法公開 DATA 嗎? 這樣會比較清楚問題 03/13 13:04
zhiying: https://i.imgur.com/PiDsqzW.jpg 03/13 18:10
zhiying: 後來又檢查了資料發現是我在合併資料的時候犯錯,難怪都 03/13 18:10
zhiying: 跑不出來。謝謝大家的提醒!然後我想再請問,有辦法設定l 03/13 18:10
zhiying: ift的下限嗎?還有這個網路圖,有辦法加入各個品項的出現 03/13 18:10
zhiying: 頻率大小嗎?謝謝! 03/13 18:10
zhiying: 然後我發現在加上minlen=2這個條件設定就可以避免掉lhs 03/13 18:33
zhiying: 是空白的結果,不知道這樣對不對。 03/13 18:33
Luluemiko: lift不能設下限,只能事後從結果篩出子集合 03/13 18:36