Pandas read_html无法读取表格

Pandas read_html无法读取表格,pandas,beautifulsoup,python-3.8,Pandas,Beautifulsoup,Python 3.8,我正在使用以下代码: import requests, pandas as pd from bs4 import BeautifulSoup if __name__ == '__main__': url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' list_of_dataframes = pd.read_html(url) 但是,在\u数据框列表中,没有学校信

我正在使用以下代码:

import requests, pandas as pd
from bs4 import BeautifulSoup

if __name__ == '__main__':
    url = 'https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601'
    list_of_dataframes = pd.read_html(url)
但是,在\u数据框列表中,没有学校信息可在上述url页面底部找到

我想知道如何在数据帧中获得以下信息,如下所示:

School                         Stars  Rating
BRIARGROVE Elementary School   4      Good
TANGLEWOOD Middle School       4      Good
WISDOM High School High        3      Average

TIA

你无法获得熊猫学校的信息,因为这不是一张桌子。这些只是常规的div,因此您必须解析HTML,然后将数据转储到pd.DataFrame

以下是如何做到这一点:

作为pd进口熊猫 导入请求 从bs4导入BeautifulSoup 如果uuuu name uuuuuu='\uuuuuuu main\uuuuuuu': url='1〕https://www.har.com/homedetail/6408-burgoyne-rd-157-houston-tx-77057/3380601' soup=BeautifulSouprequests.geturl.text,lxml.finddiv,{id:SCHOOLS} 学校=soup.find\u alldiv,班级=border\u行 学校_数据=[] 学校中的学校: name=school.finda.getText stars=len[i代表我在学校。如果在i[src]中找到star,则查找allimg] 评级=school.getText.split[-2] 学校(u data.append) [ 名称 星星, 评级 ] printpd.DataFrameschools\u数据,列=[学校,星级,评级] 输出:

                         School  Stars   Rating
0  BRIARGROVE Elementary School      4     Good
1      TANGLEWOOD Middle School      4     Good
2            WISDOM High School      3  Average