Python 如何使用BeautifulSoup获取带有rowspan标记的行

Python 如何使用BeautifulSoup获取带有rowspan标记的行,python,html,dataframe,web-scraping,beautifulsoup,Python,Html,Dataframe,Web Scraping,Beautifulsoup,我正在尝试使用BeautifulSoup从html表中创建一个pandas数据框,并且我正确地获取了所有行,除了那些包含rowspan标记的行,即1 此行被排除在我的数据帧之外。我试图用其他东西(例如class)替换rowspan标记,但结果仍然相同。我使用html5lib解析器是因为xml和lxml不起作用。 有人能帮我找到所有的行吗,包括那些带有rowspan标记的行?给你一个使用简化文档的例子 from simplified_scrapy.simplified_doc import Sim

我正在尝试使用BeautifulSoup从html表中创建一个pandas数据框,并且我正确地获取了所有行,除了那些包含rowspan标记的行,即1 此行被排除在我的数据帧之外。我试图用其他东西(例如class)替换rowspan标记,但结果仍然相同。我使用html5lib解析器是因为xml和lxml不起作用。
有人能帮我找到所有的行吗,包括那些带有rowspan标记的行?

给你一个使用简化文档的例子

from simplified_scrapy.simplified_doc import SimplifiedDoc 
html = '''<table><tr rowspan="1"><td>11</td><td>12</td></tr>
<tr><td>21</td><td>22</td></tr></table>'''
doc = SimplifiedDoc(html)
rows = doc.getElementByTag('table').trs
print ('-'*10,'all')
print (rows)
print ('-'*10,'contains rowspan')
print (rows.contains('','rowspan'))
print ('-'*10,'not contains rowspan')
print (rows.notContains('','rowspan'))
print ('-'*10,'td')
for row in rows:
  tds = [td.text for td in row.tds]
  print(tds)
从simplified_scrapy.simplified_文档导入SimplifiedDoc
html='''1112
2122'''
doc=SimplifiedDoc(html)
行=doc.getElementByTag('table').trs
打印('-'*10,“全部”)
打印(行)
打印('-'*10,'包含行span')
打印(rows.contains(“”,'rowspan'))
打印('-'*10,'不包含行span')
打印(rows.notContains(“”,'rowspan'))
打印('-'*10,'td')
对于行中的行:
tds=[td.text代表第行中的td.tds]
打印(tds)
结果:

---------- all
[{'rowspan': '1', 'tag': 'tr', 'html': '<td>11</td><td>12</td>'}, {'tag': 'tr', 'html': '<td>21</td><td>22</td>'}]
---------- contains rowspan
[{'rowspan': '1', 'tag': 'tr', 'html': '<td>11</td><td>12</td>'}]
---------- not contains rowspan
[{'tag': 'tr', 'html': '<td>21</td><td>22</td>'}]
---------- td
['11', '12']
['21', '22']
------------all
[{'rowspan':'1','tag':'tr','html':'1112'},{'tag':'tr','html':'2122'}]
----------包含行跨度
[{'rowspan':'1','tag':'tr','html':'1112'}]
----------不包含行跨度
[{'tag':'tr','html':'2122'}]
----------运输署
['11', '12']
['21', '22']

请添加有关html的代码和示例…等等