webscraping Fox新闻站点时,标题节点为空

webscraping Fox新闻站点时,标题节点为空,r,web-scraping,xml2,R,Web Scraping,Xml2,我正在为各种新闻网站用R编写一个小型情绪分析程序,当我试图访问他们的“趋势”新闻网站时,福克斯新闻给了我一些麻烦 我正在使用优秀的xml2包阅读网页,然后尝试访问包含文章标题的节点。从Chrome的“Inspect”功能中,我可以看到这些都被标记为节点,所以我想访问所有h3节点并获取它们的信息。执行此操作的代码如下所示: 库(xml2) 网页不确定这是否对您有帮助,但如果您只是向发出get请求,您将得到JSON响应,其中包含一些信息。它还为您提供实际文章的url(您可以请求以收集更多信息)。始终

我正在为各种新闻网站用R编写一个小型情绪分析程序,当我试图访问他们的“趋势”新闻网站时,福克斯新闻给了我一些麻烦

我正在使用优秀的xml2包阅读网页,然后尝试访问包含文章标题的节点。从Chrome的“Inspect”功能中,我可以看到这些都被标记为
节点,所以我想访问所有h3节点并获取它们的信息。执行此操作的代码如下所示:

库(xml2)

网页不确定这是否对您有帮助,但如果您只是向发出
get
请求,您将得到
JSON
响应,其中包含一些信息。它还为您提供实际文章的url(您可以
请求
以收集更多信息)。始终确保检查所有发出的
请求。很多时候,有比解析
HTML
更好的方法来收集数据。
//*[@id="id_Helicopter"]/a/div[2]/h3