[問題] 字串中符號處理問題

作者NikonD800E (D800E)

看板Python

標題[問題] 字串中符號處理問題

時間Mon Aug 1 18:03:35 2016

小弟最近在練習Python抓資料與字串處理的問題發現抓下來的文字不知道該如何賦予三引號強制變為字串用len(a)得到的字串長度為1 原本應該是會得到<div class="unified-baseball-card" ..... </div> 這一段網頁原始碼, 想說可以用引號分割得到第六部分的網址不知道各位大大是否有更好的方法可以解決小弟的問題呢? 謝謝!! 原始檔如下: # -*- coding: UTF-8 -*- import requests from bs4 import BeautifulSoup res = requests.get("https://social.msdn.microsoft.com/Forums/zh-TW/389e90b5-b2d9-412b-a7eb-91cb9a68d108/vs2015-?forum=230") soup = BeautifulSoup(res.text.encode('utf-8')) a = soup.select('.unified-baseball-card')[0] print a b = a.split('"',6) print b[5] 若用文字帶入會得到 https://social.msdn.microsoft.com/Forums/zh-TW/user/threads?user=a670334 也就是我想要得到的解答QQ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 167.220.232.152 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1470045819.A.DEF.html

推 kenduest: a 不是 text, 那是一個 class 08/01 19:04

→ kenduest: 若你真的要取這個 class 直接用內部顯示名稱的話 08/01 19:05

→ kenduest: 救自己加上 a = str(...) 方式轉一層就好 08/01 19:05

推 hoho8: try this http://i.imgur.com/49FkMoh.png 08/02 04:31

→ NikonD800E: 感謝兩位大師~ 是我學藝不精誤認他為字串 08/02 09:29

→ NikonD800E: 也感謝hoho8幫忙抓出soup裡頭的連結!! 08/02 09:32