Python 如何使用bs4刮取XML网站？_Python_Xml_Web Scraping_Beautifulsoup

Python 如何使用bs4刮取XML网站？

python xml web-scraping

Python 如何使用bs4刮取XML网站？,python,xml,web-scraping,beautifulsoup,Python,Xml,Web Scraping,Beautifulsoup,我正在解析销售电子产品的网站。。具体来说，我希望收集产品的名称和价格我在解析基于xml的站点时遇到了一个小问题这是我的密码： >>> import urllib2 >>> from bs4 import BeautifulSoup >>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all") >>&

我正在解析销售电子产品的网站。。具体来说，我希望收集产品的名称和价格我在解析基于xml的站点时遇到了一个小问题

这是我的密码：

>>> import urllib2  
>>> from bs4 import BeautifulSoup  
>>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all")  
>>> soup=BeautifulSoup(url,"xml")  
>>> data=soup.find_all(colspan="2")

上述代码有效
现在当我这样做时（因为名称在强标记中）

或

它告诉我：

Traceback (most recent call last):  
  File "<pyshell#10>", line 1, in <module>  
    data.strong  
AttributeError: 'ResultSet' object has no attribute 'strong'

回溯（最近一次呼叫最后一次）：
文件“”，第1行，在
data.strong
AttributeError:“ResultSet”对象没有属性“strong”

或

回溯（最近一次呼叫最后一次）：
文件“”，第1行，在
data.find_all（'a'））
AttributeError:“ResultSet”对象没有“find_all”属性

我正在尝试迭代并尝试了解更多信息。

任何指针都会非常有用

find_all

返回匹配的元素列表，而不是一个。在结果集上循环以获取单个项：

for element in data:
    element.attrs

欢迎来到堆栈溢出！我已经为您格式化了代码块；下次查看帮助。还要注意，在堆栈溢出时，我们都可以通过编辑来帮助改进您的帖子。如果您回滚这些编辑，您将撤消那些试图帮助您的人的工作。@MartijnPieters我很抱歉，谢谢您的友好：）嘿，您能帮我收集产品的价格吗？（有时在某些产品列表中也有制造商的名称，有时没有，产品信息由br标记分隔）研究BeautifulSoup文档，再使用一些库，我相信您会找到它。如果遇到具体问题，请在堆栈溢出上搜索此处（此处有大量BeautifulSoup答案），如果找不到问题的答案，请提出新问题。

Traceback (most recent call last):  
  File "<pyshell#10>", line 1, in <module>  
    data.strong  
AttributeError: 'ResultSet' object has no attribute 'strong'

Traceback (most recent call last):  
  File "<pyshell#17>", line 1, in <module>  
    data.find_all('a')  
AttributeError: 'ResultSet' object has no attribute 'find_all'

for element in data:
    element.attrs