作者cheesemickey (不一樣的夏天)
看板Statistics
標題解釋變數為階層式該如何表示?
時間Thu Oct 30 13:49:45 2014
如果是跟統計軟體有關請重發文章。
如果跟論文有關也煩請您重發文章。
請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
想請問各位大大,如果今天變數有階層關係,舉例來說
變數有銀行,部門,人員。
一個銀行包含三個部門,各部門又包含五個人員。
如此階層關係但變數皆為類別變數(非數值)
今天我用一個方法把資料數值化
假如今天第一間銀行第一個部門第一位員工轉化成資料為111
如果為第一間銀行第二個部門第三個員工轉化為123
依此類推
但這樣去做sas的決策樹會有問題,因為這數值並非真正的大小
(123並非代表真的大於111)
這樣去做決策樹分類或許會有點問題!!
想請問各位統計神人該如何解決這樣的情況
或是有什麼其他的方法來解決這樣階層關係的變數?
感謝各位大大!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.136.219
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1414648201.A.A87.html
→ andrew43: 你的數值化方法並不洽當。為什麼不保留原始的類別資訊? 11/01 14:39
→ andrew43: 另外,你要使用的分析方法又是什麼? 11/01 14:40
→ andrew43: 目前完全看不出來用三個類別變項來描述資料有何不妥。 11/01 14:41