Python 基于字体大小从CSS中提取文本
我编写了一个函数,它根据头的标记(h1/2…)解析所有头。现在,我想对其进行扩展,并添加一个基于字体大小解析文本的功能—比如说20px或1.5em,而不考虑标题。我想要一个功能,使任何文字写在字体大小大于X,无论它在网页上。该函数将json文件作为输入,其中包含随机HTML(以及任何网站可能包含的内容,如CSS等) 基于这一点,一个可能的选择似乎是使用soup.fetch(),但是,我还没有找到很多用于此目的的示例 由于字体大小可能会出现在CSS组件下,我不确定Python 基于字体大小从CSS中提取文本,python,html,css,web-scraping,beautifulsoup,Python,Html,Css,Web Scraping,Beautifulsoup,我编写了一个函数,它根据头的标记(h1/2…)解析所有头。现在,我想对其进行扩展,并添加一个基于字体大小解析文本的功能—比如说20px或1.5em,而不考虑标题。我想要一个功能,使任何文字写在字体大小大于X,无论它在网页上。该函数将json文件作为输入,其中包含随机HTML(以及任何网站可能包含的内容,如CSS等) 基于这一点,一个可能的选择似乎是使用soup.fetch(),但是,我还没有找到很多用于此目的的示例 由于字体大小可能会出现在CSS组件下,我不确定bs4是否适合它。我假设答案包括c
bs4
是否适合它。我假设答案包括cssutils
或tinycss
,但尚未找到将其用于此任务的最佳方法
作为参考-已发布标题标记的我的代码以供审阅:
我检查过的帖子:
;;
;
;
;
非常感谢,它如何根据字体大小解析文本?你的意思是你知道哪个标题标签的字体大小吗?谢谢@MoonCheesez的评论。我的意思是,不管标题是什么,我都想要一个功能,可以让任何文本的字体大小大于X。为了清晰起见,我会进行编辑-谢谢。它如何根据字体大小解析文本?你的意思是你知道哪个标题标签的字体大小吗?谢谢@MoonCheesez的评论。我的意思是,不管标题是什么,我都希望有一个功能,可以让任何字体大于X的文字都能显示出来。为了清晰起见,我会进行编辑-谢谢。