作者NikonD800E (D800E)
看板Python
標題[問題] 字串中符號處理問題
時間Mon Aug 1 18:03:35 2016
小弟最近在練習Python抓資料與字串處理的問題
發現抓下來的文字不知道該如何賦予三引號強制變為字串
用len(a)得到的字串長度為1
原本應該是會得到<div class="unified-baseball-card" ..... </div>
這一段網頁原始碼, 想說可以用引號分割得到第六部分的網址
不知道各位大大是否有更好的方法可以解決小弟的問題呢?
謝謝!!
原始檔如下:
# -*- coding: UTF-8 -*-
import requests
from bs4 import BeautifulSoup
res =
requests.get("
https://social.msdn.microsoft.com/Forums/zh-TW/389e90b5-b2d9-412b-a7eb-91cb9a68d108/vs2015-?forum=230")
soup = BeautifulSoup(res.text.encode('utf-8'))
a = soup.select('.unified-baseball-card')[0]
print a
b = a.split('"',6)
print b[5]
若用文字帶入會得到
https://social.msdn.microsoft.com/Forums/zh-TW/user/threads?user=a670334
也就是我想要得到的解答QQ
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 167.220.232.152
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1470045819.A.DEF.html
推 kenduest: a 不是 text, 那是一個 class 08/01 19:04
→ kenduest: 若你真的要取這個 class 直接用內部顯示名稱的話 08/01 19:05
→ kenduest: 救自己加上 a = str(...) 方式轉一層就好 08/01 19:05
→ NikonD800E: 感謝兩位大師~ 是我學藝不精誤認他為字串 08/02 09:29
→ NikonD800E: 也感謝hoho8幫忙抓出soup裡頭的連結!! 08/02 09:32