Python 尝试使用bs4从维基百科获取一些信息_Python_Web Scraping_Beautifulsoup

Python 尝试使用bs4从维基百科获取一些信息

python web-scraping

Python 尝试使用bs4从维基百科获取一些信息,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,今年我开始学习python作为新年决心；P我在自学刮网时遇到了一些问题。这可能是一个愚蠢的问题，但我希望有人能指出我的代码的问题。提前谢谢我想从维基百科诺贝尔经济奖上搜刮网页 #我先拿到整张桌子 wiki_table=soup.find（'table'，{'class'：'wikitable'}）打印（wiki_表） #并获取td信息 name\u list=wiki\u表（'td'）打印（姓名列表）类型（名称列表）#bs4.element.ResultSet 类型（名称列表[0:]）

今年我开始学习python作为新年决心；P我在自学刮网时遇到了一些问题。这可能是一个愚蠢的问题，但我希望有人能指出我的代码的问题。提前谢谢

我想从维基百科诺贝尔经济奖上搜刮网页

#我先拿到整张桌子
wiki_table=soup.find（'table'，{'class'：'wikitable'}）
打印（wiki_表）
#并获取td信息
name\u list=wiki\u表（'td'）
打印（姓名列表）
类型（名称列表）#bs4.element.ResultSet
类型（名称列表[0:]）列表
#我的目标是将laureate的名字从其他描述中分离出来，例如国家、年份……我计划做的是首先获得一些包含人名的列表，然后清除其他不需要的字符串。
#我尝试循环bs4类型和列表类型
月桂酸盐=[]
对于in name_列表：
laurates.append（name\u list.find\u all（class='a'））
印刷品（月桂酸酯）
#我在这里循环了一个，因为html就像```。我认为这个名字是有代码的（或者我解释错了？）

最简单的方法（在本例中）就是将表加载到pandas数据帧中，然后使用常用的pandas方法从中提取所需的任何项。所以

import pandas as pd
url = "https://en.wikipedia.org/wiki/List_of_Nobel_Memorial_Prize_laureates_in_Economics"

pd.read_html(url)

将输出该页上的表

import pandas as pd
url = "https://en.wikipedia.org/wiki/List_of_Nobel_Memorial_Prize_laureates_in_Economics"

pd.read_html(url)