带有BeautifulSoup的Python XMl解析器。如何删除标签?

带有BeautifulSoup的Python XMl解析器。如何删除标签?,python,beautifulsoup,Python,Beautifulsoup,为了一个项目,我决定制作一个应用程序,帮助人们在Twitter上找到朋友 我已经能够从xml页面获取用户名。例如,使用我当前的代码,我可以得到http://twitter.com/username,但我想使用删除和标记 这是我目前的代码: import urllib import BeautifulSoup doc = urllib.urlopen("http://search.twitter.com/search.atom?q=travel").read() soup = Beautifu

为了一个项目,我决定制作一个应用程序,帮助人们在Twitter上找到朋友

我已经能够从xml页面获取用户名。例如,使用我当前的代码,我可以得到
http://twitter.com/username
,但我想使用删除
标记

这是我目前的代码:

import urllib
import BeautifulSoup

doc = urllib.urlopen("http://search.twitter.com/search.atom?q=travel").read()

soup = BeautifulStoneSoup(''.join(doc))
data = soup.findAll("uri")

要回答有关BeautifulSoup的问题,
文本是您需要抓取每个
标记内容的内容。在这里,我将信息提取到列表中:

>>> uris = [uri.text for uri in soup.findAll('uri')]
>>> len(uris)
15
>>> print uris[0]
http://twitter.com/MarieJeppesen

但是,这是一种更好的查询Twitter的方法。

要回答您关于BeautifulSoup的问题,您需要获取每个
标记的内容。在这里,我将信息提取到列表中:

>>> uris = [uri.text for uri in soup.findAll('uri')]
>>> len(uris)
15
>>> print uris[0]
http://twitter.com/MarieJeppesen

但是,这是查询Twitter的更好方法。

不要使用BeautifulSoup解析Twitter,使用他们的(也不要使用BeautifulSoup,使用)。回答你的问题:

import urllib
from BeautifulSoup import BeautifulSoup

resp = urllib.urlopen("http://search.twitter.com/search.atom?q=travel")
soup = BeautifulSoup(resp.read())
for uri in soup.findAll('uri'):
    uri.extract()

不要使用BeautifulSoup解析twitter,使用他们的(也不要使用BeautifulSoup,使用)。回答你的问题:

import urllib
from BeautifulSoup import BeautifulSoup

resp = urllib.urlopen("http://search.twitter.com/search.atom?q=travel")
soup = BeautifulSoup(resp.read())
for uri in soup.findAll('uri'):
    uri.extract()

你给我的代码在twitter.com/username之间仍然有Uri标记不应该,所有的标记都应该从
soup
str(soup.find('Uri')==-1
。你给我的代码在twitter.com/username之间仍然有Uri标记不应该,所有的标记都应该从
soup
中剥离,
str(soup).find('uri')==-1
。下面的答案是否有帮助?下面的答案是否有帮助?