Web scraping 如何使用Python 3.7中的Beautifulsoup从《今日美国》报纸的文章中收集内容？_Web Scraping_Beautifulsoup_Python 3.7

Web scraping 如何使用Python 3.7中的Beautifulsoup从《今日美国》报纸的文章中收集内容？

web-scraping

Web scraping 如何使用Python 3.7中的Beautifulsoup从《今日美国》报纸的文章中收集内容？,web-scraping,beautifulsoup,python-3.7,Web Scraping,Beautifulsoup,Python 3.7,我正在收集《今日美国》报纸上的日期、标题和内容。我可以得到日期，标题，甚至内容，但随着内容，我得到一些不想要的东西。我不知道我应该在我的代码中修改什么才能只得到内容（文章）我期待每篇文章的日期、标题和内容。我试图通过 contentTag = sauce.find_all('p',{"class": "p-text"}) 内容的条件是 if isinstance(contentTag,list): content = [] for c in contentTag:

我正在收集《今日美国》报纸上的日期、标题和内容。我可以得到日期，标题，甚至内容，但随着内容，我得到一些不想要的东西。我不知道我应该在我的代码中修改什么才能只得到内容（文章）

我期待每篇文章的日期、标题和内容。

我试图通过

contentTag = sauce.find_all('p',{"class": "p-text"})

内容的条件是

if isinstance(contentTag,list):
    content = []
    for c in contentTag:
        content.append(c.get_text().strip())
    content = ' '.join(content)

它起作用了

if isinstance(contentTag,list):
    content = []
    for c in contentTag:
        content.append(c.get_text().strip())
    content = ' '.join(content)