Python报纸函数在循环期间不读取文章URL?

Python报纸函数在循环期间不读取文章URL?,python,python-newspaper,Python,Python Newspaper,如果这是一个愚蠢的问题,我深表歉意-我是Python新手,更熟悉excel VBA 我试图让Python在excel文档中的多个文章URL之间循环,并创建各种URL的摘要。目标是将文章标题、摘要和URL导出到新的excel(或其他选项卡)。(最终目标是搜集相关新闻并进行总结,但我正在努力!) 然而,我在获取报纸文章函数以读取我创建的列表中传递的URL时遇到了问题。当我打印URL时,它看起来就像我刚刚复制粘贴并设置URL='复制粘贴值'时一样。但是,当我在该URL上运行“Article”函数时,它

如果这是一个愚蠢的问题,我深表歉意-我是Python新手,更熟悉excel VBA

我试图让Python在excel文档中的多个文章URL之间循环,并创建各种URL的摘要。目标是将文章标题、摘要和URL导出到新的excel(或其他选项卡)。(最终目标是搜集相关新闻并进行总结,但我正在努力!)

然而,我在获取报纸文章函数以读取我创建的列表中传递的URL时遇到了问题。当我打印URL时,它看起来就像我刚刚复制粘贴并设置URL='复制粘贴值'时一样。但是,当我在该URL上运行“Article”函数时,它似乎没有正确读取URL。它们作为字符串存储在列表中。不确定我可能做错了什么。任何帮助都将不胜感激

# Import the libraries
import nltk
from newspaper import Article
import openpyxl

# import the URLs from the Excel
from openpyxl import load_workbook
wb = load_workbook(r'C:\Users\Python\RunPythonScript.xlsm')  # Work Book
ws = wb.get_sheet_by_name('URLs')  # Work Sheet
column = ws['A']  # Column
column_list = [column[x].value for x in range(len(column))] # create a list
url_list = list(filter(None, column_list)) # remove blanks
url_list.pop(0) # remove title

# start loop
x = 0
while x < len(url_list):


   url = str("'" + url_list[x] + "'") # set url  
   article = Article(url) # Get the article ### seems to be where error is ###
   print(article)

   x = x + 1 # move to next url
#导入库
导入nltk
从报纸进口文章
导入openpyxl
#从Excel导入URL
从openpyxl导入加载工作簿
wb=load_工作簿(r'C:\Users\Python\RunPythonScript.xlsm')#工作手册
ws=wb.get_sheet_by_name('url')#工作表
column=ws['A']#column
column_list=[column[x]。范围内x的值(len(column))]#创建一个列表
url_list=list(过滤器(无,列_list))#删除空格
url_list.pop(0)#删除标题
#起动回路
x=0
当x
我从python获得以下输出:

<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>

不是打印文章,而是在URL上出错

有什么见解吗?提前谢谢

在对象上调用
print()
时,通过调用对象的方法创建对象的字符串表示形式

如果您需要打印
文章
中的一些数据,例如它的url,请执行以下操作:

print(article.url)
有关
文章的更多信息,请参见:

文档非常清晰

似乎您必须将代码修改为以下内容:

...
while x < len(url_list):


   url = str("'" + url_list[x] + "'") # set url  
   article = Article(url)
   article.download()
   article.parse()
   print(article.authors)
   print(article.publish_date)
   print(article.text)
   print(article.top_image)  
   # And so on and so far...

   x = x + 1 # move to next url
。。。
当x
发生了什么错误?输出是文章对象的字符串表示。以前从未使用过该库,这里似乎是它的文档:签出它,然后只打印您需要的每一篇文章的数据?命令运行(猜测它没有具体出错),但是输出应该是URL的文章文本?它似乎在URL上出错了。你为什么这么说?另一方面,while循环几乎肯定应该是一个for循环,而不是使用range。