Python 如何访问新闻纸中的缓存文章3K
报纸是一个非常棒的图书馆,允许抓取网络数据,但是我对文章缓存有点困惑。它缓存文章以加速操作,但如何访问这些文章 我有这样的东西。现在,当我对同一组文章运行此命令两次时,第二次得到返回类型Python 如何访问新闻纸中的缓存文章3K,python,python-3.x,web-scraping,python-newspaper,Python,Python 3.x,Web Scraping,Python Newspaper,报纸是一个非常棒的图书馆,允许抓取网络数据,但是我对文章缓存有点困惑。它缓存文章以加速操作,但如何访问这些文章 我有这样的东西。现在,当我对同一组文章运行此命令两次时,第二次得到返回类型None。如何访问以前缓存的文章进行处理 paper\u articles=[链接中url的文章(url)]看看这个:中的缓存方法“cache\u disk”似乎有一个bug。它确实会将结果缓存到磁盘(搜索文件夹“.paper_scraper”),但之后不会加载它们 一种解决方法是在构建报纸或使用Config类时
None
。如何访问以前缓存的文章进行处理
paper\u articles=[链接中url的文章(url)]
看看这个:中的缓存方法“cache\u disk”似乎有一个bug。它确实会将结果缓存到磁盘(搜索文件夹“.paper_scraper”),但之后不会加载它们
一种解决方法是在构建报纸或使用Config类时将memoize_articles=False设置为False
newspaper.build(url, memoize_articles=False)
从源代码检查后,这取决于 因此,在python解释器中运行此命令以获取缓存的位置
import tempfile
tempfile.gettempdir()
import tempfile
tempfile.gettempdir()