Python 使用lxml更改解析ajax响应html/xml<&燃气轮机;人物
我试图用Python解析一个网页,一个ajax响应,基本上是这样的 xml: 解析网页中的数据时出现问题(请参见下面的示例代码) 结果中,表中的所有字符均更改为Python 使用lxml更改解析ajax响应html/xml<&燃气轮机;人物,python,xml,lxml,Python,Xml,Lxml,我试图用Python解析一个网页,一个ajax响应,基本上是这样的 xml: 解析网页中的数据时出现问题(请参见下面的示例代码) 结果中,表中的所有字符均更改为 <response> <html> <table class="tab02"> <tr> <th>Skrót</th> <th>Peł
<response>
<html>
<table class="tab02">
<tr>
<th>Skrót</th>
<th>Pełna nazwa</th>
</tr>
etc.
表class=“tab02”
tr
thSkrót/th
蒂佩纳·纳兹瓦/th
/tr
等
我也尝试过用urlib处理第一个链接,将其解析为html,但我总是失败。谁能给我一个提示吗
from lxml import etree
root = etree.fromstring(xml)
print etree.tounicode(root) # print etree.tostring(root)
magical_parser = etree.XMLParser(encoding='utf-8', recover=True)
root = etree.parse(link2page, magical_parser)
print etree.tounicode(root)
<response>
<html>
<table class="tab02">
<tr>
<th>Skrót</th>
<th>Pełna nazwa</th>
</tr>
etc.