Python 正在读取的URL不显示其内容

Python 正在读取的URL不显示其内容,python,html,url,Python,Html,Url,我正试图完全按照建议读取URL 然而,我在输出中得到的内容与我在网站上看到的内容不一样 myfile = f.read() link = "http://www.primatiming.com/#/participant/11/40/37380" f = urllib.request.urlopen(link) myfile = f.read() print(myfile) b'<!doctype html>\n<html lang="en">\n<head&g

我正试图完全按照建议读取URL

然而,我在输出中得到的内容与我在网站上看到的内容不一样

myfile = f.read()
link = "http://www.primatiming.com/#/participant/11/40/37380"
f = urllib.request.urlopen(link)
myfile = f.read()
print(myfile)


b'<!doctype html>\n<html lang="en">\n<head>\n  <meta charset="utf-8">\n
<title>primatiming</title>\n  <base href="/">\n\n  <meta name="viewport"
content="width=device-width, initial-scale=1">\n  <link rel="icon" type="image/x-icon"
href="favicon.ico">\n<link rel="stylesheet" href="styles.1b97fe46abe0706759da.css">
</head>\n<body>\n  <app-root></app-root>\n<script type="text/javascript"
src="runtime.a66f828dca56eeb90e02.js"></script><script type="text/javascript"
src="polyfills.7b309130c7fc8668d4f8.js"></script><script type="text/javascript" 
src="scripts.8e2ccd20353c3cf5326a.js"></script><script type="text/javascript" 
src="main.a865153f87c564c09e4f.js"></script></body>\n</html>\n'
myfile=f.read()
链接=”http://www.primatiming.com/#/participant/11/40/37380"
f=urllib.request.urlopen(链接)
myfile=f.read()
打印(myfile)
b'\n\n\n\n
primatiming\n\n\n\n\n
\n\n\n\n\n'
我想知道是否有人可以建议阅读这一页的方法

这样做的原因是,我只想从primetiming url中的多个页面下载站点中的表,以便对它们进行一些数据分析


谢谢。

我不太明白你的问题,但我想你想从这个页面获得信息吗

所以我建议您将xpath和libxml一起使用


在web上进行一些研究,以便进行抓取

看起来您需要某种无头web浏览器(或)来处理和呈现javascript,以便获得生成的html。

这是因为该网站使用xhr,而您需要使用无头浏览器,或者直接尝试他们的公共api


正如您所看到的,您得到了一些带有脚本标记的html:其中的javascript应该在您访问页面时单独运行和下载内容

当您正常访问页面时,浏览器会自动为您执行此操作。要验证这一点,请转到浏览器的“开发工具”网络部分,选中“保留日志”,然后尝试访问目标页面。如果您看到的结果与使用urllib得到的结果相同。因此,您需要能够运行javascript的东西来获取数据


一种流行的方法是使用Selenium,如。

如果你不理解这个问题,不要回答-发表评论要求澄清。@Brunodesshuilliers完全正确,他已经超过50名代表