Python 正在读取的URL不显示其内容_Python_Html_Url

Python 正在读取的URL不显示其内容

python html url

Python 正在读取的URL不显示其内容,python,html,url,Python,Html,Url,我正试图完全按照建议读取URL 然而，我在输出中得到的内容与我在网站上看到的内容不一样 myfile = f.read() link = "http://www.primatiming.com/#/participant/11/40/37380" f = urllib.request.urlopen(link) myfile = f.read() print(myfile) b'<!doctype html>\n<html lang="en">\n<head&g

我正试图完全按照建议读取URL

然而，我在输出中得到的内容与我在网站上看到的内容不一样

myfile = f.read()
link = "http://www.primatiming.com/#/participant/11/40/37380"
f = urllib.request.urlopen(link)
myfile = f.read()
print(myfile)


b'<!doctype html>\n<html lang="en">\n<head>\n  <meta charset="utf-8">\n
<title>primatiming</title>\n  <base href="/">\n\n  <meta name="viewport"
content="width=device-width, initial-scale=1">\n  <link rel="icon" type="image/x-icon"
href="favicon.ico">\n<link rel="stylesheet" href="styles.1b97fe46abe0706759da.css">
</head>\n<body>\n  <app-root></app-root>\n<script type="text/javascript"
src="runtime.a66f828dca56eeb90e02.js"></script><script type="text/javascript"
src="polyfills.7b309130c7fc8668d4f8.js"></script><script type="text/javascript" 
src="scripts.8e2ccd20353c3cf5326a.js"></script><script type="text/javascript" 
src="main.a865153f87c564c09e4f.js"></script></body>\n</html>\n'

myfile=f.read（）
链接=”http://www.primatiming.com/#/participant/11/40/37380"
f=urllib.request.urlopen（链接）
myfile=f.read（）
打印（myfile）
b'\n\n\n\n
primatiming\n\n\n\n\n
\n\n\n\n\n'

我想知道是否有人可以建议阅读这一页的方法

这样做的原因是，我只想从primetiming url中的多个页面下载站点中的表，以便对它们进行一些数据分析

谢谢。

我不太明白你的问题，但我想你想从这个页面获得信息吗

所以我建议您将xpath和libxml一起使用

在web上进行一些研究，以便进行抓取

看起来您需要某种无头web浏览器（或）来处理和呈现javascript，以便获得生成的html。

这是因为该网站使用xhr，而您需要使用无头浏览器，或者直接尝试他们的公共api

正如您所看到的，您得到了一些带有脚本标记的html：其中的javascript应该在您访问页面时单独运行和下载内容

当您正常访问页面时，浏览器会自动为您执行此操作。要验证这一点，请转到浏览器的“开发工具”网络部分，选中“保留日志”，然后尝试访问目标页面。如果您看到的结果与使用urllib得到的结果相同。因此，您需要能够运行javascript的东西来获取数据

一种流行的方法是使用Selenium，如。

如果你不理解这个问题，不要回答-发表评论要求澄清。@Brunodesshuilliers完全正确，他已经超过50名代表