Python 使用beautifulsoup从html中的标记中提取文本

Python 使用beautifulsoup从html中的标记中提取文本,python,html,beautifulsoup,text-extraction,Python,Html,Beautifulsoup,Text Extraction,这是html代码的一部分,表示我想从网页中提取的信息。我的目的是提取b标记之间的名称和值。我期望的结果是这样的列表:[On,DVI,3962035251] 出了什么问题?仅供参考,我是初学者,请耐心等待。试试看 data=[b.string for b in main_div.findAll('b')] 试一试 也许是这样的 import BeautifulSoup html = '''<div class="txt"><br> \nPower: <b>

这是html代码的一部分,表示我想从网页中提取的信息。我的目的是提取b标记之间的名称和值。我期望的结果是这样的列表:[On,DVI,3962035251]

出了什么问题?仅供参考,我是初学者,请耐心等待。

试试看

data=[b.string for b in main_div.findAll('b')]
试一试


也许是这样的

import BeautifulSoup

html = '''<div class="txt"><br> 
\nPower: <b>On</b><br><br>
\nSource: <b>DVI</b><br><br>
\nLamp runtime: <b>396</b> hours<br>
\nLamp remaining: <b>2035</b> hours<br>
\nTotal operation: <b>2551</b> hours<br>
\n</div>'''

soup = BeautifulSoup.BeautifulSoup(html)
bTags = [] 

for i in soup.findAll('b'):
    bTags.append(i.text)

也许是这样的

import BeautifulSoup

html = '''<div class="txt"><br> 
\nPower: <b>On</b><br><br>
\nSource: <b>DVI</b><br><br>
\nLamp runtime: <b>396</b> hours<br>
\nLamp remaining: <b>2035</b> hours<br>
\nTotal operation: <b>2551</b> hours<br>
\n</div>'''

soup = BeautifulSoup.BeautifulSoup(html)
bTags = [] 

for i in soup.findAll('b'):
    bTags.append(i.text)

我只想在这个特殊的div选项卡中的b标签中包含文本,该选项卡具有名为txt的类。。在我的html中还有其他带有b标签的div标签。因此,如果我在html文件中找到所有的b标签,就像在你的代码中一样,将会有很多b标签。但是谢谢你的帮助。。如果只有1个div标签,这是另一种方法。我只想在这个特殊的div标签中的b标签中包含文本,类名为txt。。在我的html中还有其他带有b标签的div标签。因此,如果我在html文件中找到所有的b标签,就像在你的代码中一样,将会有很多b标签。但是谢谢你的帮助。。如果只有一个div标记,这是另一种方法。
import BeautifulSoup

html = '''<div class="txt"><br> 
\nPower: <b>On</b><br><br>
\nSource: <b>DVI</b><br><br>
\nLamp runtime: <b>396</b> hours<br>
\nLamp remaining: <b>2035</b> hours<br>
\nTotal operation: <b>2551</b> hours<br>
\n</div>'''

soup = BeautifulSoup.BeautifulSoup(html)
bTags = [] 

for i in soup.findAll('b'):
    bTags.append(i.text)
[u'On', u'DVI', u'396', u'2035', u'2551']