Python 如何使用bs4刮取XML网站?

Python 如何使用bs4刮取XML网站?,python,xml,web-scraping,beautifulsoup,Python,Xml,Web Scraping,Beautifulsoup,我正在解析销售电子产品的网站。。 具体来说,我希望收集产品的名称和价格 我在解析基于xml的站点时遇到了一个小问题 这是我的密码: >>> import urllib2 >>> from bs4 import BeautifulSoup >>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all") >>&

我正在解析销售电子产品的网站。。 具体来说,我希望收集产品的名称和价格 我在解析基于xml的站点时遇到了一个小问题

这是我的密码:

>>> import urllib2  
>>> from bs4 import BeautifulSoup  
>>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all")  
>>> soup=BeautifulSoup(url,"xml")  
>>> data=soup.find_all(colspan="2")  
上述代码有效
现在当我这样做时(因为名称在强标记中)

它告诉我:

Traceback (most recent call last):  
  File "<pyshell#10>", line 1, in <module>  
    data.strong  
AttributeError: 'ResultSet' object has no attribute 'strong'  
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
data.strong
AttributeError:“ResultSet”对象没有属性“strong”

回溯(最近一次呼叫最后一次):
文件“”,第1行,在
data.find_all('a'))
AttributeError:“ResultSet”对象没有“find_all”属性
我正在尝试迭代并尝试了解更多信息。

任何指针都会非常有用

find_all
返回匹配的元素列表,而不是一个。在结果集上循环以获取单个项:

for element in data:
    element.attrs

欢迎来到堆栈溢出!我已经为您格式化了代码块;下次查看帮助。还要注意,在堆栈溢出时,我们都可以通过编辑来帮助改进您的帖子。如果您回滚这些编辑,您将撤消那些试图帮助您的人的工作。@MartijnPieters我很抱歉,谢谢您的友好:)嘿,您能帮我收集产品的价格吗?(有时在某些产品列表中也有制造商的名称,有时没有,产品信息由br标记分隔)研究BeautifulSoup文档,再使用一些库,我相信您会找到它。如果遇到具体问题,请在堆栈溢出上搜索此处(此处有大量BeautifulSoup答案),如果找不到问题的答案,请提出新问题。
Traceback (most recent call last):  
  File "<pyshell#10>", line 1, in <module>  
    data.strong  
AttributeError: 'ResultSet' object has no attribute 'strong'  
Traceback (most recent call last):  
  File "<pyshell#17>", line 1, in <module>  
    data.find_all('a')  
AttributeError: 'ResultSet' object has no attribute 'find_all'  
for element in data:
    element.attrs