Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/308.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何防止BeautifulSoup转换实体?_Python_Html_Beautifulsoup - Fatal编程技术网

Python 如何防止BeautifulSoup转换实体?

Python 如何防止BeautifulSoup转换实体?,python,html,beautifulsoup,Python,Html,Beautifulsoup,我有一个名为keyword的BeautifulSoup标记,当我使用keyword.decode(formatter=None) 为了得到html文本,我得到了这个 val():'a->'a->bool 但是原始html文本是 val():'a->'a->bool 您可以看到已转换为。我只希望文本与原始html文件中的文本完全相同。那么,我如何才能防止这种转换呢?我认为它在原始版本中遗漏了一些东西 val():'a->'a->bool () 或者它有一个额外的 不要使用formatter=

我有一个名为keyword的BeautifulSoup标记,当我使用
keyword.decode(formatter=None)
为了得到html文本,我得到了这个

val():'a->'a->bool
但是原始html文本是

val():'a->'a->bool

您可以看到
已转换为
。我只希望文本与原始html文件中的文本完全相同。那么,我如何才能防止这种转换呢?

我认为它在原始版本中遗漏了一些东西

val():'a->'a->bool
() 或者它有一个额外的


不要使用
formatter=None
,随它去吧。BeautifulSoup不会转换它

>soup.prettify(格式化程序=None)
u'\n\n\n val\n\n()\n\n\n:\n\n\n\a->bool\n
\n\n\n' >>>汤 val():'a-'a-bool >>>汤 u'\n\n\n val\n\n()\n\n\n:\n\n\n\a-\'a-bool\n\n\n\n'
对不起,我不能理解你的意思。你的意思是标签本身格式错误?虽然运行后不确定它是否与您的问题有关,但可以。在上面的示例中,您有一个结束标记,而没有打开标记。我想这可能有关系,但我得到了和alKid一样的东西。清除formatter=None。也许你应该仔细看看我的代码。里面正好有两个开始的
标签和两个结束的
标签。顺便说一句,正如我对alKid的回答所做的评论,删除
formatter=None
将导致
转换为
,这也会改变原始html。您到底尝试了什么?除非我弄错了,否则你不必转换任何东西。对不起,这是一个打字错误。当我使用
prettify()
时,它会将
转换为
。这就是为什么我尝试使用“decode(formatter=None)”,这也不起作用。原始html代码有时使用
显示
,有时直接使用
。不管怎样,我只想要不变的html文本。
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre>
<pre><span id="VAL(<>)"><span class="keyword">val</span> (&lt;&gt;)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
<pre><span id="VAL(<>)"><span class="keyword">val</span> <span>(&lt;&gt;)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">

<span>(&lt;&gt;)</span>
 </span>
>>> soup.prettify(formatter=None)
u'<pre>\n <span id="VAL(<>)">\n  <span class="keyword">\n   val\n  </span>\n  (<>)\n </span>\n :\n <code class="type">\n  \'a -> \'a -> bool\n </code>\n</pre>\n<div class="info ">\n</div>'
>>> soup
<pre><span id="VAL(&lt;&gt;)"><span class="keyword">val</span> (&lt;&gt;)</span> : <code class="type">'a -&gt; 'a -&gt; bool</code></pre><div class="info ">
</div>
>>> soup.prettify()
u'<pre>\n <span id="VAL(&lt;&gt;)">\n  <span class="keyword">\n   val\n  </span>\n  (&lt;&gt;)\n </span>\n :\n <code class="type">\n  \'a -&gt; \'a -&gt; bool\n </code>\n</pre>\n<div class="info ">\n</div>'