Python 3.7 urllib.request reurns&;而不是内容
所以我编写了一个代码,可以读取和打印HTML代码中指定文本之间的所有内容,例如,读取段落之间的所有内容-这会被打印出来。 这是sentdex课程中的内容- 代码并没有问题,而是出现了什么问题。 我用非常具体的标准进行筛选Python 3.7 urllib.request reurns&;而不是内容,python,html,Python,Html,所以我编写了一个代码,可以读取和打印HTML代码中指定文本之间的所有内容,例如,读取段落之间的所有内容-这会被打印出来。 这是sentdex课程中的内容- 代码并没有问题,而是出现了什么问题。 我用非常具体的标准进行筛选 paragraphs = re.findall(r'<div style="font-size: 23px; margin-top: 20px;" class="jsdfx-sentiment-present">(.*?)</div>',str(resp
paragraphs = re.findall(r'<div style="font-size: 23px; margin-top: 20px;" class="jsdfx-sentiment-present">(.*?)</div>',str(respData))
parations=re.findall(r'(.*?),str(respData))
如前所述,它是有效的。稍后将打印内容并进行打印
 
. 据我所知,这是HTML中的非制动空间。我希望看到的不是空间,而是数字。在本网站中,此位置的号码每隔几秒钟更新一次
我如何才能获得这些数字而不是收到
问候 这取决于你下载网页的确切方式以及从何处下载,但因为你说在网络浏览器中查看网页时,值会不断变化,所以我敢打赌,当你下载网页时,该
正是该div中的内容-当您实际查看页面时,页面会通过javascript或其他方式动态更改它。您的教程使用静态标记,该标记在每次加载页面时都是相同的,而不是在页面已处于活动状态后动态设置的标记
在web开发中,为动态值执行此操作非常常见—将占位符值放入div中,然后根据需要动态编辑内容。当然,如果您只是对页面进行快照(甚至如果您在javascript代码之前进行快照,以及其他可能会填充该值的东西有机会运行),您将看不到更改,并且您只会获得默认值,而不会填充数字
根据您链接的教程,您可能正在使用
urllib
。如果您想从HTML页面获取动态内容,这可能不是最好的工具-您应该查看selenium
和BeautifulSoup
。详细介绍了有效解决此问题的方法。谢谢,感谢您如此深入地回答:)