Web scraping 如何使用Python 3.7中的Beautifulsoup从《今日美国》报纸的文章中收集内容?

Web scraping 如何使用Python 3.7中的Beautifulsoup从《今日美国》报纸的文章中收集内容?,web-scraping,beautifulsoup,python-3.7,Web Scraping,Beautifulsoup,Python 3.7,我正在收集《今日美国》报纸上的日期、标题和内容。我可以得到日期,标题,甚至内容,但随着内容,我得到一些不想要的东西。我不知道我应该在我的代码中修改什么才能只得到内容(文章) 我期待每篇文章的日期、标题和内容。我试图通过 contentTag = sauce.find_all('p',{"class": "p-text"}) 内容的条件是 if isinstance(contentTag,list): content = [] for c in contentTag:

我正在收集《今日美国》报纸上的日期、标题和内容。我可以得到日期,标题,甚至内容,但随着内容,我得到一些不想要的东西。我不知道我应该在我的代码中修改什么才能只得到内容(文章)


我期待每篇文章的日期、标题和内容。

我试图通过

contentTag = sauce.find_all('p',{"class": "p-text"})
内容的条件是

if isinstance(contentTag,list):
    content = []
    for c in contentTag:
        content.append(c.get_text().strip())
    content = ' '.join(content)
它起作用了

if isinstance(contentTag,list):
    content = []
    for c in contentTag:
        content.append(c.get_text().strip())
    content = ' '.join(content)