Python 3.7 urllib.request reurns&；而不是内容_Python_Html

Python 3.7 urllib.request reurns&；而不是内容

python html

Python 3.7 urllib.request reurns&；而不是内容,python,html,Python,Html,所以我编写了一个代码，可以读取和打印HTML代码中指定文本之间的所有内容，例如，读取段落之间的所有内容-这会被打印出来。这是sentdex课程中的内容- 代码并没有问题，而是出现了什么问题。我用非常具体的标准进行筛选 paragraphs = re.findall(r'<div style="font-size: 23px; margin-top: 20px;" class="jsdfx-sentiment-present">(.*?)</div>',str(resp

所以我编写了一个代码，可以读取和打印HTML代码中指定文本之间的所有内容，例如，读取段落之间的所有内容-这会被打印出来。这是sentdex课程中的内容-

代码并没有问题，而是出现了什么问题。我用非常具体的标准进行筛选

paragraphs = re.findall(r'<div style="font-size: 23px; margin-top: 20px;" class="jsdfx-sentiment-present">(.*?)</div>',str(respData))

parations=re.findall（r'（.*？），str（respData））

如前所述，它是有效的。稍后将打印内容并进行打印 . 据我所知，这是HTML中的非制动空间。我希望看到的不是空间，而是数字。在本网站中，此位置的号码每隔几秒钟更新一次

我如何才能获得这些数字而不是收到

问候

这取决于你下载网页的确切方式以及从何处下载，但因为你说在网络浏览器中查看网页时，值会不断变化，所以我敢打赌，当你下载网页时，该

正是该div中的内容-当您实际查看页面时，页面会通过javascript或其他方式动态更改它。您的教程使用静态标记，该标记在每次加载页面时都是相同的，而不是在页面已处于活动状态后动态设置的标记

在web开发中，为动态值执行此操作非常常见—将占位符值放入div中，然后根据需要动态编辑内容。当然，如果您只是对页面进行快照（甚至如果您在javascript代码之前进行快照，以及其他可能会填充该值的东西有机会运行），您将看不到更改，并且您只会获得默认值，而不会填充数字

根据您链接的教程，您可能正在使用

urllib

。如果您想从HTML页面获取动态内容，这可能不是最好的工具-您应该查看

selenium

和

BeautifulSoup

。详细介绍了有效解决此问题的方法。

谢谢，感谢您如此深入地回答：）