Python 限制报纸的URL输出
我正在使用newspaper3从news.google中提取URL,但问题是我一直在获取所有URL(我禁用了memoize,因为我需要完整的列表)。我想只打印前5个链接或5个随机链接并不重要。 我试过设定一个最大值,但没用。有什么想法吗Python 限制报纸的URL输出,python,url,web-scraping,python-newspaper,Python,Url,Web Scraping,Python Newspaper,我正在使用newspaper3从news.google中提取URL,但问题是我一直在获取所有URL(我禁用了memoize,因为我需要完整的列表)。我想只打印前5个链接或5个随机链接并不重要。 我试过设定一个最大值,但没用。有什么想法吗 导入报纸 新闻=报纸https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?oc=3&ceid=US:en,memoize_articles=
导入报纸
新闻=报纸https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?oc=3&ceid=US:en,memoize_articles=False)
有关news.articles中的文章:
打印(article.url)
此代码片段应该正是您想要的。它不使用报纸功能,而是随机选择一定数量的URL。报纸的输出不是列表,因此必须使用append函数将其转换为列表。享受吧
导入报纸
商业新闻=报纸.buildhttps://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?hl=en-US&gl=US&ceid=US%3Aen',语言为'en',备忘录化\u文章为假)
myList=[]
有关business_news.articles中的文章:
myList.append(str(article.url))
打印(myList)#仅出于显示目的不需要
随机输入
aselect=myList
randarticles=random.sample(选择5)
打印(randarticles)
如果您想打印前五篇文章和您的新闻。articles
是一个iterable(如列表或元组),您可能可以对新闻中的文章执行。articles[:5]