Python 如何防止BeautifulSoup转换实体?
我有一个名为keyword的BeautifulSoup标记,当我使用Python 如何防止BeautifulSoup转换实体?,python,html,beautifulsoup,Python,Html,Beautifulsoup,我有一个名为keyword的BeautifulSoup标记,当我使用keyword.decode(formatter=None) 为了得到html文本,我得到了这个 val():'a->'a->bool 但是原始html文本是 val():'a->'a->bool 您可以看到已转换为。我只希望文本与原始html文件中的文本完全相同。那么,我如何才能防止这种转换呢?我认为它在原始版本中遗漏了一些东西 val():'a->'a->bool () 或者它有一个额外的 不要使用formatter=
keyword.decode(formatter=None)
为了得到html文本,我得到了这个
val():'a->'a->bool
但是原始html文本是
val():'a->'a->bool
您可以看到
已转换为
。我只希望文本与原始html文件中的文本完全相同。那么,我如何才能防止这种转换呢?我认为它在原始版本中遗漏了一些东西
val():'a->'a->bool
()
或者它有一个额外的
不要使用
formatter=None
,随它去吧。BeautifulSoup不会转换它
>soup.prettify(格式化程序=None)
u'\n\n\n val\n\n()\n\n\n:\n\n\n\a->bool\n
\n\n\n'
>>>汤
val():'a-'a-bool
>>>汤
u'\n\n\n val\n\n()\n\n\n:\n\n\n\a-\'a-bool\n
\n\n\n'
对不起,我不能理解你的意思。你的意思是标签本身格式错误?虽然运行后不确定它是否与您的问题有关,但可以。在上面的示例中,您有一个结束标记,而没有打开标记。我想这可能有关系,但我得到了和alKid一样的东西。清除formatter=None。也许你应该仔细看看我的代码。里面正好有两个开始的
标签和两个结束的
标签。顺便说一句,正如我对alKid的回答所做的评论,删除formatter=None
将导致
转换为
,这也会改变原始html。您到底尝试了什么?除非我弄错了,否则你不必转换任何东西。对不起,这是一个打字错误。当我使用prettify()
时,它会将
转换为
。这就是为什么我尝试使用“decode(formatter=None)”,这也不起作用。原始html代码有时使用
显示
,有时直接使用
。不管怎样,我只想要不变的html文本。
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre>
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
<pre><span id="VAL(<>)"><span class="keyword">val</span> <span>(<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
<span>(<>)</span>
</span>
>>> soup.prettify(formatter=None)
u'<pre>\n <span id="VAL(<>)">\n <span class="keyword">\n val\n </span>\n (<>)\n </span>\n :\n <code class="type">\n \'a -> \'a -> bool\n </code>\n</pre>\n<div class="info ">\n</div>'
>>> soup
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
</div>
>>> soup.prettify()
u'<pre>\n <span id="VAL(<>)">\n <span class="keyword">\n val\n </span>\n (<>)\n </span>\n :\n <code class="type">\n \'a -> \'a -> bool\n </code>\n</pre>\n<div class="info ">\n</div>'