Python 尝试使用BeautifulSoup在HTML文档中查找特定表
我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的,因为它具有唯一的Python 尝试使用BeautifulSoup在HTML文档中查找特定表,python,html,beautifulsoup,Python,Html,Beautifulsoup,我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的,因为它具有唯一的,而且并非所有表都有标题 以下是该结构的一个片段: <table class="wikitable"> <caption>Very long caption</caption> <tbody> <tr align="center" bgcolor="#efefef"> 但返回一个None对象 soup.find('table
,而且并非所有表都有标题
以下是该结构的一个片段:
<table class="wikitable">
<caption>Very long caption</caption>
<tbody>
<tr align="center" bgcolor="#efefef">
但返回一个None
对象
soup.find('table',caption=“Very long caption”)
这基本上意味着-定位一个表
元素,该元素具有标题
属性,该属性具有非常长的标题
值。这显然没有任何回报
我要做的是通过文本定位标题
元素并获得:
谢谢,这正是我需要的。
soup = BeautifulSoup(r.text, "html.parser")
table1 = soup.find('table', caption="Very long caption")
soup.find("caption", text="Very long caption").find_parent("table")