Python 使用漂亮的汤从Tableau仪表板上刮下悬停框

Python 使用漂亮的汤从Tableau仪表板上刮下悬停框,python,web-scraping,beautifulsoup,mousehover,Python,Web Scraping,Beautifulsoup,Mousehover,我正在尝试从该网站上获取悬停框信息: 我已经尝试在Python中使用TableauScraper包,但是它返回了错误的数据。科科尼诺县应该有一个“15.2%更大”的值或实际县数据的一些衍生值,但我不能加、减、除或乘以使数据一致 以下是我在TableauScraper库中的代码: from tableauscraper import TableauScraper as TS import pandas as pd url = 'https://www.bcbs.com/the-health-

我正在尝试从该网站上获取悬停框信息:

我已经尝试在Python中使用
TableauScraper
包,但是它返回了错误的数据。科科尼诺县应该有一个“15.2%更大”的值或实际县数据的一些衍生值,但我不能加、减、除或乘以使数据一致

以下是我在TableauScraper库中的代码:

from tableauscraper import TableauScraper as TS
import pandas as pd

url = 'https://www.bcbs.com/the-health-of-america/health-index/impact-high-cholesterol'

ts = TS()
ts.loads(url)
workbook = ts.getWorkbook()

for t in workbook.worksheets:
    # if ts.getWorksheet(t.name).data.shape[0] != 0:
    print(f'worksheet name : {t.name}')

ws = ts.getWorksheet('County Map')

cholesterol_data = ws.data
cholesterol_data.to_csv('../data/cholesterol.csv', index=False)
使用TableauScraper的失败让我不得不手动清理网站。在inspector模式下,当我将鼠标悬停在县上并按F8键时,我可以暂停检查并检查悬停框。但是,每当我再次移动鼠标时,HTML就会更新,数据就会丢失

我还试着检查是否有JSON响应,但看起来不像。似乎Tableauscraper软件包正在删除这个1.1MB文件,而文件中似乎没有“15.2%的值更大”


所以我的问题仍然是,有没有办法模仿鼠标悬停然后刮取HTML?我对几乎任何技术都持开放态度,但python,更具体地说是BeautifulSoup,是我的谋生之道。一旦我找到一种模仿鼠标移动的方法,我就可以从那里抓取网页。

似乎只有从美国才能访问,所以我无法尝试(即使使用代理)。如果打开chrome开发控制台/网络选项卡,当您将鼠标悬停在一个县上时,是否有类似于
/render tooltip server
的调用返回数据?在1.1MB文件调用之后是否有包含数据的命令调用?似乎不是这样。看起来,当您加载页面时,它会将数据直接加载到仪表板中(不确定如何工作)。移动鼠标不会下载任何内容。除非我点击某个特定的县(这会更新仪表板并重新下载该1.1MB文件),否则网络中不会有其他内容。你能在1.1MB请求上右键单击“复制为卷曲”并将其粘贴到github gist或其他可以共享的内容中吗