Python &;书信电报;转换为<;当你喝上漂亮的汤时

Python &;书信电报;转换为<;当你喝上漂亮的汤时,python,beautifulsoup,html-escape-characters,Python,Beautifulsoup,Html Escape Characters,我正在使用Beauty soup解析包含br>的字符串,Beauty soup将其解释为 有没有一种方法可以让Beauty soup停止这样做,这样br>就不会被碰,而是被当作一个普通的字符串,而则被正常解析?您可以使用formatter=“html”让解释器知道它是原始html。基本上,如果您使用格式化程序选项,就可以得到您想要的。 政府对此有详细说明 我无法立即看到如何应用此功能。使用soup.prettify(formatter=“html”)仍然会给我,而且我的代码中没有使用encode

我正在使用Beauty soup解析包含
br>
的字符串,Beauty soup将其解释为


有没有一种方法可以让Beauty soup停止这样做,这样
br>
就不会被碰,而是被当作一个普通的字符串,而

则被正常解析?

您可以使用
formatter=“html”
让解释器知道它是原始html。基本上,如果您使用
格式化程序
选项,就可以得到您想要的。
政府对此有详细说明

我无法立即看到如何应用此功能。使用
soup.prettify(formatter=“html”)
仍然会给我

,而且我的代码中没有使用encode或decode函数。似乎格式化程序选项仅为encode、decode和prettify函数设置,这些函数都应用于已解析的文档。我想停止的行为发生在解析过程中,因此为时已晚。我目前的解决办法是用其他字符替换
,一旦我使用完beautiful soup,就可以取消替换。