Python 3.x Python:在大量div中解析大量元素?

Python 3.x Python:在大量div中解析大量元素?,python-3.x,web-scraping,beautifulsoup,Python 3.x,Web Scraping,Beautifulsoup,我正在尝试解析一个网页,该网页看起来与BeautifulSoup类似 我必须从带有类“quote mediumText”的每个div标记中提取我圈出的文本。您可以使用列表理解语法在一行中完成此任务: myList = [elem.text for elem in soup.findAll("div",{'class':'quoteText'})] 要获取链接中的红色圆圈文本,请尝试以下操作: import bs4 as bs import requests source = requests

我正在尝试解析一个网页,该网页看起来与BeautifulSoup类似
我必须从带有类“quote mediumText”的每个div标记中提取我圈出的文本。您可以使用列表理解语法在一行中完成此任务:

myList = [elem.text for elem in soup.findAll("div",{'class':'quoteText'})]

要获取链接中的红色圆圈文本,请尝试以下操作:

import bs4 as bs
import requests

source = requests.get("https://www.goodreads.com/quotes/tag/fear").text
soup = bs.BeautifulSoup(source, "lxml")
# Remove script tags.
[s.extract() for s in soup('script')]
divs = soup.findAll("div",{'class':'quoteText'})
for div in divs:
    print (div.text.replace('\n', ' ').replace('\r', ''))

更新以删除脚本标记换行符和回车符,

而不是elem.text和elem我必须放入div quoteText?否,请尝试执行这一行。它将提取
.findAll
返回列表中每个
.elem
元素的
.text
。它不应该,在图像中,圈出的文本有
class=“quoteText”
,但是你提到你想要带有
class=“quote mediumText”
的文本。哦,我明白了,我误解了你,使用了
类:“quoteText”
那么就应该这样做了。与上面丹·德夫的回答类似:)不用担心!不需要道歉这是你的代码?我已经做了你做的,但问题是做它你不需要olso文本,而是olso div中的其他东西你能给我一个例子吗?我不知道为什么它需要olso脚本中的数据tag://Updated 回答删除脚本标记换行符和回车符,