作者: wanson (望生) 看板: R_Language
標題: [問題] jiebaR 針對文字檔處理
時間: Sun Sep 11 04:17:05 2016
請問一下
他的教學網站中提到"./temp.dat"
可以load 檔案進去
以下是他的說明
支持对文件进行分词:
cc["./temp.dat"] ### 自动判断输入文件编码模式,默认文件输出在同目录下。
## segment( "./temp.dat" , mixseg )
英文說明
You can pipe a file path to cut file.
cutter <= "./temp.dat" ### Auto encoding detection.
## OR segment( "./temp.dat" , cutter )
很奇怪的是我自己怎樣嘗試都無法成功
這是我自己的目錄
setwd("C:/SASMACRO/data/F2+Blank")
mixseg <= "./temp.dat"
另外我如果使用read_table 去讀取txt檔案,如果檔案內只有簡單的幾個字
讀檔可以成功
但如果檔案有點大,而且一開始很多分行
就會失敗
例如下列的檔案 (temp.txt)
https://www.dropbox.com/s/wdwgk8t64xgrlu9/temp.txt?dl=0
怎樣也都無法讀進去
想請教一下版上的高手
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.211.164
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1473538629.A.489.html
※ 編輯: wanson (140.112.211.164), 09/11/2016 04:29:40