Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/amazon-s3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使用新闻库获取基于发布日期的新闻_Python_Feed - Fatal编程技术网

Python 如何使用新闻库获取基于发布日期的新闻

Python 如何使用新闻库获取基于发布日期的新闻,python,feed,Python,Feed,我试图从不同的媒体渠道策划报道同一故事的新闻文章,我正在使用新闻库。下面的代码使用给定的URL为我提供新闻,但我希望获得多篇新闻文章(基于特定日期或日期范围)。有人知道我怎么做吗 这是使用特定URL获取新闻的代码: from newsplease import NewsPlease article = NewsPlease.from_url('https://www.nytimes.com/2017/02/23/us/politics/cpac-stephen-bannon-reince-pr

我试图从不同的媒体渠道策划报道同一故事的新闻文章,我正在使用新闻库。下面的代码使用给定的URL为我提供新闻,但我希望获得多篇新闻文章(基于特定日期或日期范围)。有人知道我怎么做吗

这是使用特定URL获取新闻的代码:

from newsplease import NewsPlease

article = NewsPlease.from_url('https://www.nytimes.com/2017/02/23/us/politics/cpac-stephen-bannon-reince-priebus.html?hp')

print(article.title)

可以通过从创建的文章对象中提取发布日期或使用文件来实现这一点


文档中提供了更多信息:

当您想从公共爬网新闻存档(也称为公共爬网新闻爬网,或CCNC)中获取许多文章时,Shishdem的答案非常好


但是,如果您正在查找的只是几篇文章,您可以使用
newsleep.from_url([url1,url2,…],timeout=6)
对这些文章进行爬网(请参阅)。注意,此命令不支持开箱即用的过滤,但如果您只想有几篇文章,我仍然更喜欢它(以及后续的文章过滤,由您自己实现),而不是常见的新闻爬网新闻存档变体news please。这样做的一个原因是,为了从CCNC获得文章的过滤子集,理论上您需要处理完整的CCNC,因为CCNC中的文章不一定按发布日期排序。例如,新闻媒体A发布的2018年1月1日的一篇文章可能会在一天后被CCNC抓取,而发行商B发布的2018年1月2日的另一篇文章可能会在一个月甚至一年后被抓取。

您有URL列表吗?