Python 尝试使用bs4从维基百科获取一些信息

Python 尝试使用bs4从维基百科获取一些信息,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,今年我开始学习python作为新年决心;P我在自学刮网时遇到了一些问题。这可能是一个愚蠢的问题,但我希望有人能指出我的代码的问题。 提前谢谢 我想从维基百科诺贝尔经济奖上搜刮网页 #我先拿到整张桌子 wiki_table=soup.find('table',{'class':'wikitable'}) 打印(wiki_表) #并获取td信息 name\u list=wiki\u表('td') 打印(姓名列表) 类型(名称列表)#bs4.element.ResultSet 类型(名称列表[0:])

今年我开始学习python作为新年决心;P我在自学刮网时遇到了一些问题。这可能是一个愚蠢的问题,但我希望有人能指出我的代码的问题。 提前谢谢

我想从维基百科诺贝尔经济奖上搜刮网页

#我先拿到整张桌子
wiki_table=soup.find('table',{'class':'wikitable'})
打印(wiki_表)
#并获取td信息
name\u list=wiki\u表('td')
打印(姓名列表)
类型(名称列表)#bs4.element.ResultSet
类型(名称列表[0:])列表
#我的目标是将laureate的名字从其他描述中分离出来,例如国家、年份……我计划做的是首先获得一些包含人名的列表,然后清除其他不需要的字符串。
#我尝试循环bs4类型和列表类型
月桂酸盐=[]
对于in name_列表:
laurates.append(name\u list.find\u all(class='a'))
印刷品(月桂酸酯)
#我在这里循环了一个,因为html就像```。我认为这个名字是有代码的(或者我解释错了?)
最简单的方法(在本例中)就是将表加载到pandas数据帧中,然后使用常用的pandas方法从中提取所需的任何项。所以

import pandas as pd
url = "https://en.wikipedia.org/wiki/List_of_Nobel_Memorial_Prize_laureates_in_Economics"

pd.read_html(url)
将输出该页上的表

import pandas as pd
url = "https://en.wikipedia.org/wiki/List_of_Nobel_Memorial_Prize_laureates_in_Economics"

pd.read_html(url)