看板 Master_D 關於我們 聯絡資訊
假設我有1000筆資料,品項為10種 我是以人工方式根據品項的次數高低去分組, 分為A、B、C、D四個資料組, suppport為0.1, 把四組分別下去跑關聯規則, 類似多重支持度的概念。 而目前問題是想利用自動化方式去跑關聯規則, 重點是不需要以人去根據次數高低去分組, 不知道有何方法?可以自動化跑多重支持度的方式或者是以次數頻率分析的方法之類的? 麻煩大大謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.42.47.219 ※ 文章網址: https://www.ptt.cc/bbs/Master_D/M.1454314093.A.9F8.html
hsnuyi: 看不太懂你想做啥 是要把1000筆資料自動分成四組? 02/02 01:03
hsnuyi: 然後這四組分別要有高度相關性是嗎? 02/02 01:06
對就是希望能夠自動分組,每組具有高相關性的意思,只是不知道有什麼方法之類的
mosenay: 單純分組的話可以參考一下cluster analysis 02/03 23:29
mosenay: 不過不清楚你說的每組具有相關是指組內還是組間 02/03 23:31
指的是組內,不知道還有沒其他方法之類的?
hsnuyi: clustering有很多種方法啊 你try過哪些了呢? 02/05 01:07
那你可以舉一下用什麼工具或方法直接將資料拆開來嗎? ※ 編輯: jimkukky (36.229.24.205), 02/05/2016 22:22:03
hsnuyi: google clustering algorithm, wiki裡就一大堆 02/06 02:19
hsnuyi: python也有ML的package可以用 應該幾行code就可實作了 02/06 02:23
ok謝謝! ※ 編輯: jimkukky (114.45.112.134), 02/06/2016 18:32:21