[問題] 特徵選取問題

作者iambakr (123)

看板R_Language

標題[問題] 特徵選取問題

時間Tue Jul 1 00:21:32 2025

經驗諮詢(我想用R作特徵選取，請問大家的經驗) [軟體熟悉度]: 入門(寫過其他程式，只是對語法不熟悉) [問題敘述]: 請簡略描述你所要做的事情，或是這個程式的目的我打算使用 TF-IDF 作文字探勘，碰到以下幾個問題: Q1:我打算用 mutual information 與 mRMR作特徵選取我應該先做 TF-IDF 然後再做特徵選取? 還是反過來? Q2: 承上，我將降維後的詞彙作機器學習分類 (ex: svm, rf, etc) 我需要將這些文字特徵以及其他數值型特徵作標準化嗎? 如下面 code 最後一行以及倒數第二行有註解的 step_nzv() 這個實務上也是需要的嗎? rec <- recipe(Label ~ ., data = train_data) |> step_zv(all_predictors()) |> #step_nzv(all_predictors()) |> step_normalize(all_numeric_predictors()) 謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.214.84 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1751300494.A.77C.html