Python 尝试使用BeautifulSoup在HTML文档中查找特定表_Python_Html_Beautifulsoup

Python 尝试使用BeautifulSoup在HTML文档中查找特定表

python html

Python 尝试使用BeautifulSoup在HTML文档中查找特定表,python,html,beautifulsoup,Python,Html,Beautifulsoup,我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的，因为它具有唯一的，而且并非所有表都有标题以下是该结构的一个片段： <table class="wikitable"> <caption>Very long caption</caption> <tbody> <tr align="center" bgcolor="#efefef"> 但返回一个None对象 soup.find（'table

我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的，因为它具有唯一的

，而且并非所有表都有标题

以下是该结构的一个片段：

<table class="wikitable">
    <caption>Very long caption</caption>
    <tbody>
        <tr align="center" bgcolor="#efefef">

但返回一个

None

对象

soup.find（'table'，caption=“Very long caption”）

这基本上意味着-定位一个

表

元素，该元素具有

标题

属性，该属性具有

非常长的标题

值。这显然没有任何回报

我要做的是通过文本定位

标题

元素并获得：

谢谢，这正是我需要的。

soup = BeautifulSoup(r.text, "html.parser")
table1 = soup.find('table', caption="Very long caption")

soup.find("caption", text="Very long caption").find_parent("table")