Python &；书信电报；转换为<；当你喝上漂亮的汤时_Python_Beautifulsoup_Html Escape Characters

Python &；书信电报；转换为<；当你喝上漂亮的汤时

python

Python &；书信电报；转换为<；当你喝上漂亮的汤时,python,beautifulsoup,html-escape-characters,Python,Beautifulsoup,Html Escape Characters,我正在使用Beauty soup解析包含br>的字符串，Beauty soup将其解释为有没有一种方法可以让Beauty soup停止这样做，这样br>就不会被碰，而是被当作一个普通的字符串，而则被正常解析？您可以使用formatter=“html”让解释器知道它是原始html。基本上，如果您使用格式化程序选项，就可以得到您想要的。政府对此有详细说明我无法立即看到如何应用此功能。使用soup.prettify（formatter=“html”）仍然会给我，而且我的代码中没有使用encode

我正在使用Beauty soup解析包含

br>

的字符串，Beauty soup将其解释为

有没有一种方法可以让Beauty soup停止这样做，这样

br>

就不会被碰，而是被当作一个普通的字符串，而

则被正常解析？

您可以使用

formatter=“html”

让解释器知道它是原始html。基本上，如果您使用

格式化程序

选项，就可以得到您想要的。

政府对此有详细说明

我无法立即看到如何应用此功能。使用

soup.prettify（formatter=“html”）

仍然会给我

，而且我的代码中没有使用encode或decode函数。似乎格式化程序选项仅为encode、decode和prettify函数设置，这些函数都应用于已解析的文档。我想停止的行为发生在解析过程中，因此为时已晚。我目前的解决办法是用其他字符替换

，一旦我使用完beautiful soup，就可以取消替换。