Python 从多表wikipedia中删除表

Python 从多表wikipedia中删除表,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我试图从这个url中删除表 . 那里有5张不同的桌子。但我的目标是这里显示的第一张表。它没有太多的标识,那个表只包含这个标识 class="wikitable sortable jquery-tablesorter" 其中另一个表具有相同的标识。我看到一些来源,我应该采取的id。但这个表没有id 这 我现在就是这样刮的 问题 我们如何只选择没有id的表呢?获取所有表并存储在数组中,然后从[0]索引中获取表。通过这种方式,您可以提取第一个不带任何id的表。获取所有表并存储在数

我试图从这个url中删除表 . 那里有5张不同的桌子。但我的目标是这里显示的第一张表。它没有太多的标识,那个表只包含这个标识

class="wikitable sortable jquery-tablesorter"
其中另一个表具有相同的标识。我看到一些来源,我应该采取的id。但这个表没有id

这 我现在就是这样刮的

问题
我们如何只选择没有id的表呢?获取所有表并存储在数组中,然后从[0]索引中获取表。通过这种方式,您可以提取第一个不带任何id的表。

获取所有表并存储在数组中,然后从[0]索引获取表。通过这种方式,您可以提取第一个没有任何id的表。

您可以使用soup选择第一个表。查找所有“表”[1]


您可以使用soup选择第一张桌子。查找所有“桌子”[1]


我会这样做:

import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)

我会这样做:

import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)

您好,非常感谢您的回复,您能告诉我如何修改代码吗?您好,非常感谢您的回复,您能告诉我如何修改代码吗?您好,非常感谢您的回复,我想知道如何在代码中使用它。不客气,我已经用代码示例编辑了我的答案。您好,非常感谢您的回复,我想知道如何在代码中使用它。不客气-我已经用代码示例编辑了我的答案。与df=df_列表[2]或df=df_列表[3]或df=df_列表[4]或df=df_列表[5]链接的任何表格与df=df_列表[2]或df=df_列表[3]或df=df_列表[4]或df=df_列表[5]链接
import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)