带有BeautifulSoup的Python XMl解析器。如何删除标签？_Python_Beautifulsoup

带有BeautifulSoup的Python XMl解析器。如何删除标签？

python

带有BeautifulSoup的Python XMl解析器。如何删除标签？,python,beautifulsoup,Python,Beautifulsoup,为了一个项目，我决定制作一个应用程序，帮助人们在Twitter上找到朋友我已经能够从xml页面获取用户名。例如，使用我当前的代码，我可以得到http://twitter.com/username，但我想使用删除和标记这是我目前的代码： import urllib import BeautifulSoup doc = urllib.urlopen("http://search.twitter.com/search.atom?q=travel").read() soup = Beautifu

为了一个项目，我决定制作一个应用程序，帮助人们在Twitter上找到朋友

我已经能够从xml页面获取用户名。例如，使用我当前的代码，我可以得到

http://twitter.com/username

，但我想使用删除

和

标记

这是我目前的代码：

import urllib
import BeautifulSoup

doc = urllib.urlopen("http://search.twitter.com/search.atom?q=travel").read()

soup = BeautifulStoneSoup(''.join(doc))
data = soup.findAll("uri")

要回答有关BeautifulSoup的问题，

文本是您需要抓取每个
标记内容的内容。在这里，我将信息提取到列表中：
>>> uris = [uri.text for uri in soup.findAll('uri')]
>>> len(uris)
15
>>> print uris[0]
http://twitter.com/MarieJeppesen

但是，这是一种更好的查询Twitter的方法。
要回答您关于BeautifulSoup的问题，您需要获取每个
标记的内容。在这里，我将信息提取到列表中：
>>> uris = [uri.text for uri in soup.findAll('uri')]
>>> len(uris)
15
>>> print uris[0]
http://twitter.com/MarieJeppesen

但是，这是查询Twitter的更好方法。
不要使用BeautifulSoup解析Twitter，使用他们的（也不要使用BeautifulSoup，使用）。回答你的问题：
import urllib
from BeautifulSoup import BeautifulSoup

resp = urllib.urlopen("http://search.twitter.com/search.atom?q=travel")
soup = BeautifulSoup(resp.read())
for uri in soup.findAll('uri'):
    uri.extract()

不要使用BeautifulSoup解析twitter，使用他们的（也不要使用BeautifulSoup，使用）。回答你的问题：
import urllib
from BeautifulSoup import BeautifulSoup

resp = urllib.urlopen("http://search.twitter.com/search.atom?q=travel")
soup = BeautifulSoup(resp.read())
for uri in soup.findAll('uri'):
    uri.extract()

你给我的代码在twitter.com/username之间仍然有Uri标记不应该，所有的标记都应该从soup
，str（soup.find（'Uri'）==-1
。你给我的代码在twitter.com/username之间仍然有Uri标记不应该，所有的标记都应该从soup
中剥离，str（soup）.find（'uri'）==-1
。下面的答案是否有帮助？下面的答案是否有帮助？