Python 尝试使用BeautifulSoup在HTML文档中查找特定表

Python 尝试使用BeautifulSoup在HTML文档中查找特定表,python,html,beautifulsoup,Python,Html,Beautifulsoup,我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的,因为它具有唯一的,而且并非所有表都有标题 以下是该结构的一个片段: <table class="wikitable"> <caption>Very long caption</caption> <tbody> <tr align="center" bgcolor="#efefef"> 但返回一个None对象 soup.find('table

我试图阅读的HTLM页面有21个表。我试图引用的特定表是唯一的,因为它具有唯一的
,而且并非所有表都有标题

以下是该结构的一个片段:

<table class="wikitable">
    <caption>Very long caption</caption>
    <tbody>
        <tr align="center" bgcolor="#efefef">
但返回一个
None
对象

soup.find('table',caption=“Very long caption”)

这基本上意味着-定位一个
元素,该元素具有
标题
属性,该属性具有
非常长的标题
值。这显然没有任何回报

我要做的是通过文本定位
标题
元素并获得:


谢谢,这正是我需要的。
soup = BeautifulSoup(r.text, "html.parser")
table1 = soup.find('table', caption="Very long caption")
soup.find("caption", text="Very long caption").find_parent("table")