→ dododavid006: 你可以試著用 Python 內建的 urllib 或是如果你有 04/27 18:08
→ dododavid006: request 也可以 去把你貼的那個網址抓下來後再存檔 04/27 18:08
→ dododavid006: 開你抓下來的檔案應該就會看到 xml 了 04/27 18:09
→ dododavid006: Yahoo 的網站有判斷你是不是用瀏覽器開 如果用瀏覽 04/27 18:10
→ dododavid006: 器開你就會看到訂閱 rss 的說明 04/27 18:10
→ alubasteve: 給dododavid006,多謝你的建議,我有去找資料 04/27 21:23
→ alubasteve: 再者,我也想請教您如何把結果抓下來存檔 04/27 21:40
→ dododavid006: 至於存檔也只是方便你用其它軟體讀而已 就只是開檔 04/27 23:32
→ dododavid006: 再把內容寫進去而已 04/27 23:32
→ dododavid006: with open("檔名.xml", "wb"): 04/27 23:32
→ dododavid006: with open("檔名.xml", "wb") as f: # 更正 04/27 23:33
→ dododavid006: f.write(urllib.request.urlopen("url").read()) 04/27 23:34
→ vi000246: 用這個看就看得到xml格式了 你研究看看是什麼原因造成 04/27 23:51
→ vi000246: 直接用browser跟用rss reader取回來的資料差異 04/27 23:52
→ vi000246: 可能是某個表頭會讓response吐xml 另個表頭是吐回html 04/27 23:52
→ vi000246: 你直接用rss xml python requests當關鍵字搜尋看看 04/27 23:53
→ vi000246: 喔喔 一樓有解答了 04/27 23:53
→ alubasteve: 給dododavid006,感謝你的協助,我照著打你給的程式 04/28 14:07
→ alubasteve: 嘗試,後面就有出現一堆資料,但也因此我發現了新問題 04/28 14:08
→ alubasteve: 出來的結果是網站的原始資料,所以不會出現中文名稱 04/28 14:09
→ alubasteve: 而且結果是連續的出來,即使我轉貼到WORD而比較有結構 04/28 14:11
→ alubasteve: 也依然沒有中文,包含我用vi000246給的網站也是如此 04/28 14:12
→ alubasteve: 請問這是否代表這才是抓資料的常態,也就是要去猜欄位 04/28 14:13
→ alubasteve: 因為我原本是想要讓抓取欄位資料匯出成檔案 04/28 14:14
→ alubasteve: 例如WORD或是EXCEL,但這在那之前我要去懂如何猜欄位 04/28 14:15
→ alubasteve: 與標籤之間的關係才行?請問兩位先進都是怎麼做的呢? 04/28 14:16
→ alubasteve: 另外我也有試著用RSS閱讀器,但不知為何是這樣 04/28 14:17
→ alubasteve: 並沒有出現檔案的網頁程式資料,請問我是挑錯軟體了嗎 04/28 14:20
→ alubasteve: 還是我有地方不對,也想請教大家 04/28 14:21
→ alubasteve: 感謝dododavid006+vi000246,總算試出成果了 04/28 18:49
→ alubasteve: 另外還可以略做調整成這樣(前面已知跳過去) 04/28 18:59