Pandas read_html无法读取表格_Pandas_Beautifulsoup_Python 3.8

Pandas read_html无法读取表格

pandas

Pandas read_html无法读取表格,pandas,beautifulsoup,python-3.8,Pandas,Beautifulsoup,Python 3.8,我正在使用以下代码： import requests, pandas as pd from bs4 import BeautifulSoup if __name__ == '__main__': url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' list_of_dataframes = pd.read_html(url) 但是，在\u数据框列表中，没有学校信

我正在使用以下代码：

import requests, pandas as pd
from bs4 import BeautifulSoup

if __name__ == '__main__':
    url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601'
    list_of_dataframes = pd.read_html(url)

但是，在\u数据框列表中，没有学校信息可在上述url页面底部找到

我想知道如何在数据帧中获得以下信息，如下所示：

School                         Stars  Rating
BRIARGROVE Elementary School   4      Good
TANGLEWOOD Middle School       4      Good
WISDOM High School High        3      Average

TIA

你无法获得熊猫学校的信息，因为这不是一张桌子。这些只是常规的div，因此您必须解析HTML，然后将数据转储到pd.DataFrame

以下是如何做到这一点：

作为pd进口熊猫导入请求从bs4导入BeautifulSoup 如果uuuu name uuuuuu='\uuuuuuu main\uuuuuuu'： url='1〕https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' soup=BeautifulSouprequests.geturl.text，lxml.finddiv，{id:SCHOOLS} 学校=soup.find\u alldiv，班级=border\u行学校_数据=[] 学校中的学校： name=school.finda.getText stars=len[i代表我在学校。如果在i[src]中找到star，则查找allimg] 评级=school.getText.split[-2] 学校(u data.append) [ 名称星星，评级 ] printpd.DataFrameschools\u数据，列=[学校，星级，评级] 输出：

                         School  Stars   Rating
0  BRIARGROVE Elementary School      4     Good
1      TANGLEWOOD Middle School      4     Good
2            WISDOM High School      3  Average