作者empireisme (empireisme)
看板R_Language
標題[問題]字串處理和斷字
時間Mon May 25 12:20:17 2020
兩個問題
1.
我有斷好的詞彙
sample 像是
text=c(105-,
81.-.----.,
出入口,
象具,
排氣管,
30.11.,
當外,
推動策略,
球根花卉,
常態化差異植生指標,
碟片,
大且,
輸美量,
高雄139號)
我想要把那些純數字 或是 數字配合亂碼的index抓出來
但是不可以抓出 高雄139號這種例子
請問我該怎麼抓
簡單來說保留 純中文 或是中文加數字
2.
另外一個問題 我有一個句子 我叫做林小明來自清華統計所
想問該怎麼把這個句子裡面的每個字 都存在一個向量
向量的第一個位置 = 林
第二個位置= 小
以此類推
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.72.221.179 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1590380419.A.07A.html
→ andrew43: strsplit("asdf林小明", "")[[1]] 05/25 12:32
→ empireisme: 謝謝 05/25 19:08
推 andrew43: 問題1用grep抓字母與符號應該就夠了 05/26 08:45
推 Gjerry: 可以考慮排除純英文的字串可能會比較容易 05/26 16:31
→ Eliezer0402: 研究生寫作業啊 06/07 10:33