[問題]字串處理和斷字

作者empireisme (empireisme)

看板R_Language

標題[問題]字串處理和斷字

時間Mon May 25 12:20:17 2020

兩個問題 1. 我有斷好的詞彙 sample 像是 text=c(105-, 81.-.----., 出入口, 象具, 排氣管, 30.11., 當外, 推動策略, 球根花卉, 常態化差異植生指標, 碟片, 大且, 輸美量, 高雄139號) 我想要把那些純數字或是數字配合亂碼的index抓出來但是不可以抓出高雄139號這種例子請問我該怎麼抓簡單來說保留純中文或是中文加數字 2. 另外一個問題我有一個句子我叫做林小明來自清華統計所想問該怎麼把這個句子裡面的每個字都存在一個向量向量的第一個位置 = 林第二個位置= 小以此類推 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.72.221.179 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1590380419.A.07A.html

→ andrew43: strsplit("asdf林小明", "")[[1]] 05/25 12:32

→ empireisme: 謝謝 05/25 19:08

推 andrew43: 問題1用grep抓字母與符號應該就夠了 05/26 08:45

推 Gjerry: 可以考慮排除純英文的字串可能會比較容易 05/26 16:31

→ Eliezer0402: 研究生寫作業啊 06/07 10:33