Python Beautifulsoup css数据提取
我试图从html文档中提取css数据。 数据点是用户在图像上生成并导出到html中的可变数量的圆x-y坐标,如下所示:Python Beautifulsoup css数据提取,python,css,beautifulsoup,Python,Css,Beautifulsoup,我试图从html文档中提取css数据。 数据点是用户在图像上生成并导出到html中的可变数量的圆x-y坐标,如下所示: #shapes a#rage_circle1{ top: 248px; left: 231px; width: 18px; height: 18px; border: 1px solid #000000; background-image: none; } 我想要一个顶部和左侧像素数的输出 更新: 这就是我到目前为止所做的 fr
#shapes a#rage_circle1{
top: 248px;
left: 231px;
width: 18px;
height: 18px;
border: 1px solid #000000;
background-image: none;
}
我想要一个顶部和左侧像素数的输出
更新:
这就是我到目前为止所做的
from bs4 import BeautifulSoup
import re
soup = BeautifulSoup (open ('index.html'))
x= soup.findAll(text=re.compile('left'))
print (x)
生成的输出是上面大括号之间的所有数据,并且不只是选择“left”字符串。我不确定为什么我的脚本没有在大括号之间选择特定的数据。有什么建议吗?我认为这是解决你问题的正确选择。下面的代码片段将简单地输出所有top
和left
属性的值
import cssutils
css = cssutils.parseFile('index.html')
for rule in css.cssRules:
print(rule.style.top)
print(rule.style.left)
你可以使用正则表达式,我认为BeautifulSoup.find_all()可以使用正则表达式作为输入。我认为BeautifulSoup很有用。也看看。谢谢你,这个正则表达式对于我打算做的任务来说太复杂了。正在抛出一些错误,但至少这是一个开始。