Pandas read_html无法读取表格
我正在使用以下代码:Pandas read_html无法读取表格,pandas,beautifulsoup,python-3.8,Pandas,Beautifulsoup,Python 3.8,我正在使用以下代码: import requests, pandas as pd from bs4 import BeautifulSoup if __name__ == '__main__': url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' list_of_dataframes = pd.read_html(url) 但是,在\u数据框列表中,没有学校信
import requests, pandas as pd
from bs4 import BeautifulSoup
if __name__ == '__main__':
url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601'
list_of_dataframes = pd.read_html(url)
但是,在\u数据框列表中,没有学校信息可在上述url页面底部找到
我想知道如何在数据帧中获得以下信息,如下所示:
School Stars Rating
BRIARGROVE Elementary School 4 Good
TANGLEWOOD Middle School 4 Good
WISDOM High School High 3 Average
TIA你无法获得熊猫学校的信息,因为这不是一张桌子。这些只是常规的div,因此您必须解析HTML,然后将数据转储到pd.DataFrame 以下是如何做到这一点: 作为pd进口熊猫 导入请求 从bs4导入BeautifulSoup 如果uuuu name uuuuuu='\uuuuuuu main\uuuuuuu': url='1〕https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' soup=BeautifulSouprequests.geturl.text,lxml.finddiv,{id:SCHOOLS} 学校=soup.find\u alldiv,班级=border\u行 学校_数据=[] 学校中的学校: name=school.finda.getText stars=len[i代表我在学校。如果在i[src]中找到star,则查找allimg] 评级=school.getText.split[-2] 学校(u data.append) [ 名称 星星, 评级 ] printpd.DataFrameschools\u数据,列=[学校,星级,评级] 输出:
School Stars Rating
0 BRIARGROVE Elementary School 4 Good
1 TANGLEWOOD Middle School 4 Good
2 WISDOM High School 3 Average