作者billdarkest ()
看板Python
標題[問題] 抓取txt特定內容並作註解or計算
時間Thu Feb 6 22:36:36 2020
各位前輩大家好
小弟閒暇時間會上網自學python來優化工作流程
最近遇到一個txt文本處理的問題如下:
https://imgur.com/RDgjPdd
每次收到的檔案中我所要解析的行數並不固定,可能第8行到第15行,可能是10~30。
是否請大佬指點一下要從哪個方向下手才能在txt的相對位置上填上均重?
我目前的進度只到能把文本內容全部list出來而已,可以說是進度0。
for i in range(0, lines.__len__(), 1):
list = []
for word in lines[i].split():
word = word.strip( )
list.append(word);
word = word.strip()
list.append(word);
print(list)
希望各位前輩給個關鍵字或方向指導一下,身邊沒有資訊人可以問,而我只會一點點爬蟲的基礎而已。
所以如果有用詞不精準或敘述不清楚的地方望各位前輩海涵
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.250.224.22 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1580999798.A.AE5.html
推 TitanEric: 讀到標頭之後 讀你要的資料 然後捨棄亂碼 02/06 23:07
推 lemon651: 1.range(len(lines))可以達到一樣效果2.不用加; 02/07 12:45
推 poototo: 正則表示式? 02/07 12:49
→ alvinlin: 首先先問你的文字檔哪來的為什麼有亂碼?然後加上均重後 02/07 14:59
→ alvinlin: 處理好的檔案要做什麼? 02/07 14:59
→ alvinlin: 這幾個模組csv,re應該有幫助 02/07 15:01
→ billdarkest: 大大 其實我只是把我不需要的資料當成亂碼而已 主要 02/07 15:27
→ billdarkest: 是想知道如何找特定的資料做註解再放回指定的位置 02/07 15:27
→ alvinlin: 不能從源頭去加嗎? 02/07 16:17
→ alvinlin: 如果不需要的資料的部分也是格式化的,用csv讀進來再csv 02/07 16:18
→ alvinlin: 寫回去即可 02/07 16:18
→ alvinlin: 或是用seek()定位到要加的位置 02/07 17:42