Python 3.x 如何使用网络爬虫打印页面上的所有标题?

Python 3.x 如何使用网络爬虫打印页面上的所有标题?,python-3.x,pycharm,Python 3.x,Pycharm,我正在尝试编写一个应用程序,它显示去镇上的公共汽车的时刻表。你能帮帮我吗 这是我写的东西,但它不起作用(我只想在页面上显示巴士的标题或“时间”) 正如我所说,我想知道公共汽车开动的时间。你能看到我忘记了什么或做错了什么吗?原因是你的输出是错误的 Process finished with exit code 0 基本上是因为您的代码没有到达任何打印语句 更详细地说,这意味着soup变量是while循环的第一个(也是唯一一个)iteraction的空列表 无论如何,我已经查看了您在脚本中使用的

我正在尝试编写一个应用程序,它显示去镇上的公共汽车的时刻表。你能帮帮我吗

这是我写的东西,但它不起作用(我只想在页面上显示巴士的标题或“时间”)



正如我所说,我想知道公共汽车开动的时间。你能看到我忘记了什么或做错了什么吗?原因是你的输出是错误的

Process finished with exit code 0
基本上是因为您的代码没有到达任何打印语句

更详细地说,这意味着
soup
变量是while循环的第一个(也是唯一一个)iteraction的空列表

无论如何,我已经查看了您在脚本中使用的页面,我认为这不可能像您这样访问信息,因为页面是通过AngularJS呈现的。事实上,我试图通过以下方式更改for循环:

for link in soup.findAll('strong'):
因为我已经分析了源代码,想要的信息可以在
元素中找到,但是结果如下:

{{travel.routeName}}
{{travel.formattedDepartureTime}} – {{travel.formattedArrivalTime}}
{{deviation.heading}}
{{deviation.heading}}
{{remark.heading}}
{{deviation.heading}}

我的另一个想法是,在浏览器的开发者工具(控制台)中搜索是否有任何XHR或JS来获取请求的信息,可能是通过json,但我没有找到任何信息。

总线时间是通过Angular呈现的,因此您可能需要JavaScript解析器来获取时间
for link in soup.findAll('strong'):
{{travel.routeName}}
{{travel.formattedDepartureTime}} – {{travel.formattedArrivalTime}}
{{deviation.heading}}
{{deviation.heading}}
{{remark.heading}}
{{deviation.heading}}