Python BeautifulSoup从find_all获取_文本
这是我第一次使用网页抓取。到目前为止,我能够导航并找到我想要的HTML部分。我也可以打印出来。问题是只打印文本,这不起作用。我在尝试时遇到以下错误:Python BeautifulSoup从find_all获取_文本,python,beautifulsoup,urllib,Python,Beautifulsoup,Urllib,这是我第一次使用网页抓取。到目前为止,我能够导航并找到我想要的HTML部分。我也可以打印出来。问题是只打印文本,这不起作用。我在尝试时遇到以下错误:AttributeError:'ResultSet'对象没有属性'get\u text' 这是我的代码: from bs4 import BeautifulSoup import urllib page = urllib.urlopen('some url') soup = BeautifulSoup(page) zeug = soup.fin
AttributeError:'ResultSet'对象没有属性'get\u text'
这是我的代码:
from bs4 import BeautifulSoup
import urllib
page = urllib.urlopen('some url')
soup = BeautifulSoup(page)
zeug = soup.find_all('div', attrs={'class': 'fm_linkeSpalte'}).get_text()
print zeug
find_all()
返回元素数组。你应该浏览所有这些,然后选择你需要的。然后调用get\u text()
UPD例如:
for el in soup.find_all('div', attrs={'class': 'fm_linkeSpalte'}):
print el.get_text()
但请注意,您可能有不止一个元素。我将以重复的形式结束本期,并将您链接到另一个我发现可以回答此问题的元素,但我认为我没有缓和此问题所需的声誉。。。所以 代码:
用于汤中的el.findAll('div',attrs={'class':'fm_linkespate'}):
打印“”。连接(el.findAll(text=True))
如果国防部想结束这个问题,这会很有帮助。在获取数据的列表中尝试
for
,如下所示:
zeug = [x.get_text() for x in soup.find_all('div', attrs={'class': 'fm_linkeSpalte'})]