Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/349.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python html源代码中的隐藏字符_Python_Decoding - Fatal编程技术网

Python html源代码中的隐藏字符

Python html源代码中的隐藏字符,python,decoding,Python,Decoding,在Python 3(Pycharm)中,我从 import selenium from selenium import webdriver browser = webdriver.Chrome() browser.get('http.....') pagesource = browser.page_source 那我有 pagesource.replace('</b>', '') pagesource.replace('<b>', '') print (pages

在Python 3(Pycharm)中,我从

import  selenium
from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http.....')
pagesource = browser.page_source
那我有

pagesource.replace('</b>', '')
pagesource.replace('<b>', '')

print (pagesource)
pagesource.replace(“”,“”)
pagesource.replace(“”,“”)
打印(页面来源)
脚本运行正常,但最终输出包含“地址”


我假设有一些隐藏字符阻止标记被删除。如何删除这些字符?

您没有保存替换的字符串

pagesource = pagesource.replace('</b>', '')
pagesource = pagesource.replace('<b>', '')
print (pagesource)
pagesource=pagesource.replace(“”,“”)
pagesource=pagesource.replace(“”,“”)
打印(页面来源)

打印(pagesource.replace(“”,).replace(“”,))

您停止使用replace作为“就地”替换程序-它返回一个新字符串。相反,您可以使用
pg=pagesource.replace(..)
-可能会工作使用文档的功能:新字符串工作,谢谢
print (pagesource.replace('<b>', '').replace('</b>', ''))