Python html源代码中的隐藏字符
在Python 3(Pycharm)中,我从Python html源代码中的隐藏字符,python,decoding,Python,Decoding,在Python 3(Pycharm)中,我从 import selenium from selenium import webdriver browser = webdriver.Chrome() browser.get('http.....') pagesource = browser.page_source 那我有 pagesource.replace('</b>', '') pagesource.replace('<b>', '') print (pages
import selenium
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('http.....')
pagesource = browser.page_source
那我有
pagesource.replace('</b>', '')
pagesource.replace('<b>', '')
print (pagesource)
pagesource.replace(“”,“”)
pagesource.replace(“”,“”)
打印(页面来源)
脚本运行正常,但最终输出包含“地址”
我假设有一些隐藏字符阻止标记被删除。如何删除这些字符?您没有保存替换的字符串
pagesource = pagesource.replace('</b>', '')
pagesource = pagesource.replace('<b>', '')
print (pagesource)
pagesource=pagesource.replace(“”,“”)
pagesource=pagesource.replace(“”,“”)
打印(页面来源)
或
打印(pagesource.replace(“”,).replace(“”,))
您停止使用replace作为“就地”替换程序-它返回一个新字符串。相反,您可以使用pg=pagesource.replace(..)
-可能会工作使用文档的功能:新字符串工作,谢谢
print (pagesource.replace('<b>', '').replace('</b>', ''))