使用Python从HTML中提取歌曲长度和大小
我正在从一个网站制作一个简单的mp3下载器。在这样做时,我在解析音频的时间和大小时卡住了:使用Python从HTML中提取歌曲长度和大小,python,python-3.x,Python,Python 3.x,我正在从一个网站制作一个简单的mp3下载器。在这样做时,我在解析音频的时间和大小时卡住了: <div class="mp3-info"> 1.69 mins <br/> 2.33 mb </div> 1.69分钟 2.33 mb 现在我需要从上面的HTML解析1.69分钟和2.33 mb。我使用的是python 3.4,您可以使用库从HTML中提取文本 下面是一个相关的问题 将长度和大小作为文本输出后,再将其拆分。例如 text =
<div class="mp3-info">
1.69 mins
<br/>
2.33 mb
</div>
1.69分钟
2.33 mb
现在我需要从上面的HTML解析
1.69分钟
和2.33 mb
。我使用的是python 3.4,您可以使用库从HTML中提取文本
下面是一个相关的问题
将长度和大小作为文本输出后,再将其拆分。例如
text = ... extract element text using lxml
minutes, min_suffix, megabytes, mega_suffix = text.split()
seconds = float(minutes) * 60.0
我会用它来解析你的HTML。见文件
另外,因为它是一个类,页面上可能有多个类…你所说的“解析”到底是什么意思?@skyline75489以获得时间和大小的价值下面的答案满足你的需要?@skyline75489一点也不,但我得到了答案,
import BeautifulSoup
soup = BeautifulSoup.BeautifulSoup(your_html_string)
soup.findAll("div", {"class": "mp3-info"})
# Now extract the text