Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用python中的lxml获取表的内容_Python_Xpath_Lxml - Fatal编程技术网

用python中的lxml获取表的内容

用python中的lxml获取表的内容,python,xpath,lxml,Python,Xpath,Lxml,我有这张桌子: <table class='table_small' style='width: 700px;'> .. <tr class=''> <td style='text-align: center;'><span class='' style='white-space:nowrap'> 1</span></td> <td>&l

我有这张桌子:

<table class='table_small' style='width: 700px;'>
..

 <tr class=''>
                  <td style='text-align: center;'><span class='' style='white-space:nowrap'> 1</span></td>
                  <td></td>
                  <td>
                      <img src='https://apps.powerplaymanager.com/images/ppm/flags/gab.gif' style='vertical-align: middle;' title='' alt='' />&nbsp;<a href='./news/profile?id=1441'>besser </a>                  </td>
                  <td style='text-align: center;'>8</td>
                  <td style='text-align: center;'><span style='color: #FFFFFF; font-size:14px; text-decoration: none;'></span></td>
                  <td style='text-align: right;' title='Money won in the last 7 days.'>< <span class='' style='white-space:nowrap'>$ 10 000</span></td>
                </tr>


                    <tr class='td_grey'>
                  <td style='text-align: center;'><span class='' style='white-space:nowrap'> 2</span></td>
                  <td></td>
                  <td>
                      <img src='https://apps.powerplaymanager.com/images/ppm/flags/kna.gif' style='vertical-align: middle;' title='' alt='' />&nbsp;<a href='./news/profile?id=5931'>Kserks </a>                  </td>
                  <td style='text-align: center;'>9</td>
                  <td style='text-align: center;'><span style='color: #FFFFFF; font-size:14px; text-decoration: none;'></span></td>
                  <td style='text-align: right;' title='Money won in the last 7 days.'>< <span class='' style='white-space:nowrap'>$ 10 000</span></td>
                </tr>

.. Keeps going.
其中“generateTree”是html.fromstring的简单包装器,用于为lxml生成“可读”页面,即树

问题是,对于代码,我的输出是:

[None, None, '\n                      ', '8', None, '$ 10 000']
[None, None, '\n                      ', '9', None, '$ 10 000']
[None, None, '\n                      ', '9', None, '$ 10 000']
[None, None, '\n                      ', '9', None, '$ 10 000']
我希望能够获得每个tr类的内容,比如:

tr 1[link : www.link.com, level : 3, money : 10,000]
tr 2[link : www.link.com, level : 6, money : 15,000]
..
尝试了上面的代码和大量的XPath,但是没有任何效果


编辑:请各位。q、 q

在没有
generateTree
包装器的情况下是否可以复制?我没有这方面的源代码,因此无法运行您的代码。请看一下。当然可以,绝对可以。下面是我的函数源代码:它的作用是获取一个链接(我在这里列出的表)并执行一个fromstring,这样我们就可以使用lxml进行解析,而不会出现任何问题。请更加努力地提供一个最小的、完整的、可验证的示例。编辑问题,而不是链接到注释中的代码段。是否可以在不使用
generateTree
包装的情况下复制此问题?我没有这方面的源代码,因此无法运行您的代码。请看一下。当然可以,绝对可以。下面是我的函数源代码:它的作用是获取一个链接(我在这里列出的表)并执行一个fromstring,这样我们就可以使用lxml进行解析,而不会出现任何问题。请更加努力地提供一个最小的、完整的、可验证的示例。编辑问题,而不是链接到注释中的代码段。
tr 1[link : www.link.com, level : 3, money : 10,000]
tr 2[link : www.link.com, level : 6, money : 15,000]
..