看板 Database 關於我們 聯絡資訊
想請問版友有人算過有趣性(Interestingness)的嗎? http://msdn.microsoft.com/zh-tw/library/ms175382.aspx 根據裡面的說明,可以找到有趣性的公式為: Interestingness(Attribute) = - (m - Entropy(Attribute)) * (m - Entropy(Attribute)) m代表整個功能集的entropy (我不太懂這句的意思) 假設有兩個變數 x=2,2,3,4,5,6 y=3,4,4,4,6,8 根據Shannon entropy H(x)= - sum_i p(x_i) * log_2( p(x_i) ) p(x_i)為X的pmf X的entropy H(x)=2.251629 Y的entropy H(y)=1.792481 那請問m及x,y的interestingness是多少呢? 那麼Interestingness是越高越好? 還是越低越好? 因為感覺起來會為負數,跟我原本以為是正數不大一樣 先謝謝各位了!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 113.28.26.107 ※ 文章網址: http://www.ptt.cc/bbs/Database/M.1410104189.A.DF0.html
GoalBased: 你發錯地方了 09/08 13:16