看板 R_Language 關於我們 聯絡資訊
library(tm) library(tmcn) library(Rwordseg) x1 <-read.csv(file.choose(),header=T)#讀入資料 x2 <-Corpus(VectorSource(x1))#向量格式 x3 <- tm_map(x2, removePunctuation)#去除標點符號 x4 <- tm_map(x3, removeNumbers)#去除數字 x5 <- tm_map(x4, function(word) { gsub("[A-Za-z0-9]", "", word) })#清除大小寫英文與數字 #inspect(d.corpus )#看内容 x6 <- tm_map(x5,segmentCN, nature = TRUE)#斷詞 x7 <- Corpus(VectorSource(x6)) 相同問題 執行到 x7 一樣出現 Error in UseMethod("meta", x) : no applicable method for 'meta' applied to an object of class "character" 應該是升級 tm 包 後產生?? x7有誰知道這段如何改 ※ 引述《nh2 (nh)》之銘言: : [問題類型]: : : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : : [軟體熟悉度]: : 請把以下不需要的部份刪除 : 入門(寫過其他程式,只是對語法不熟悉) : [問題敘述]: : 請簡略描述你所要做的事情,或是這個程式的目的 : [環境敘述]: : : mac Rstudio, R3.2 : : corp = Corpus(DirSource("./text/combine/")) : head(corp) : corp = tm_map(corp, stripWhitespace) : corp = tm_map(corp, removePunctuation) : corp = tm_map(corp, removeNumbers) : corp = tm_map(corp, function(word){ : gsub("[A-Za-z0-9]","",word)}) : corp = tm_map(corp, PlainTextDocument) : corp = tm_map(corp, removeWords,stopwords("english")) : # 中文 stop words : stopss = stopwordsCN() : corp = tm_map(corp,removeWords, stopss) : # 中文斷詞 : corp2 = tm_map(corp, content_transformer(segmentCN)) : corp2 = tm_map(corp, content_transformer(segmentCN), returnType = 'tm') : corp2 <- tm_map(corp, content_transformer(segmentCN), nature = TRUE) : corp2 <- tm_map(corp, function(sentence) { : noun <- lapply(sentence, function(w) { : w[names(w) == "n"] : }) : unlist(noun) : }) : corp3 = Corpus(VectorSource(corp2)) : 跑到最後一行就出現錯誤訊息寫: : Error in UseMethod("meta", x) : : 沒有適用的方法可將 'meta' 套用到 "character" 類別的物件 : 本來有想過是資料夾裡文件編碼的問題 : 但是文件有中有英文,中文小弟用程式轉成UTF8 ~~ : 另一個問題是不知道各位面對很多big5碼,有什麼方式比較快轉成utf8的? -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.22.108 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1435162160.A.55A.html
obarisk: segmentCN得到的結果不是vector 06/25 17:55
psinqoo: 那該如何轉? 06/25 18:00
penolove: x7[i]=paste(unlist(x7[i]),collapse =", ") 06/27 01:13
penolove: *x6才對 自己是這樣做 06/27 01:37
obarisk: 把上面寫成function,餵給tm_map 06/27 06:27