Python 从多表wikipedia中删除表_Python_Html_Web Scraping_Beautifulsoup

Python 从多表wikipedia中删除表

python html web-scraping

Python 从多表wikipedia中删除表,python,html,web-scraping,beautifulsoup,Python,Html,Web Scraping,Beautifulsoup,我试图从这个url中删除表 . 那里有5张不同的桌子。但我的目标是这里显示的第一张表。它没有太多的标识，那个表只包含这个标识 class="wikitable sortable jquery-tablesorter" 其中另一个表具有相同的标识。我看到一些来源，我应该采取的id。但这个表没有id 这我现在就是这样刮的问题我们如何只选择没有id的表呢？获取所有表并存储在数组中，然后从[0]索引中获取表。通过这种方式，您可以提取第一个不带任何id的表。获取所有表并存储在数

我试图从这个url中删除表 . 那里有5张不同的桌子。但我的目标是这里显示的第一张表。它没有太多的标识，那个表只包含这个标识

class="wikitable sortable jquery-tablesorter"

其中另一个表具有相同的标识。我看到一些来源，我应该采取的id。但这个表没有id

这我现在就是这样刮的

问题

我们如何只选择没有id的表呢？获取所有表并存储在数组中，然后从[0]索引中获取表。通过这种方式，您可以提取第一个不带任何id的表。

获取所有表并存储在数组中，然后从[0]索引获取表。通过这种方式，您可以提取第一个没有任何id的表。

您可以使用soup选择第一个表。查找所有“表”[1]

您可以使用soup选择第一张桌子。查找所有“桌子”[1]

我会这样做：

import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)

我会这样做：

import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)

您好，非常感谢您的回复，您能告诉我如何修改代码吗？您好，非常感谢您的回复，您能告诉我如何修改代码吗？您好，非常感谢您的回复，我想知道如何在代码中使用它。不客气，我已经用代码示例编辑了我的答案。您好，非常感谢您的回复，我想知道如何在代码中使用它。不客气-我已经用代码示例编辑了我的答案。与df=df_列表[2]或df=df_列表[3]或df=df_列表[4]或df=df_列表[5]链接的任何表格与df=df_列表[2]或df=df_列表[3]或df=df_列表[4]或df=df_列表[5]链接

import pandas as pd
url = 'https://id.wikipedia.org/wiki/Demografi_Indonesia#Jumlah_penduduk_menurut_provinsi'
df_list = pd.read_html(url)
df = df_list[1]
print(df)