Python 使用BeautifulSoup解码html实体
我正在尝试使用BeautifulSoup解码实体,但没有运气Python 使用BeautifulSoup解码html实体,python,beautifulsoup,Python,Beautifulsoup,我正在尝试使用BeautifulSoup解码实体,但没有运气 from BeautifulSoup import BeautifulSoup decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES) print decoded 输出根本没有被解码。我在这里找到了很多使用这种方法的答案。 我做错什么了吗 我想使用BeautifulSou
from BeautifulSoup import BeautifulSoup
decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES)
print decoded
输出根本没有被解码。我在这里找到了很多使用这种方法的答案。
我做错什么了吗
我想使用BeautifulSoup来实现这一点,所以请不要麻烦告诉我标准库有一种解码实体的方法。您需要:
>>打印解码
p/p
>>>打印解码内容
[u'']
>>> print decoded
<p> </p>
>>> print decoded.contents
[u'<p> </p>']