Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/87.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于字体大小从CSS中提取文本_Python_Html_Css_Web Scraping_Beautifulsoup - Fatal编程技术网

Python 基于字体大小从CSS中提取文本

Python 基于字体大小从CSS中提取文本,python,html,css,web-scraping,beautifulsoup,Python,Html,Css,Web Scraping,Beautifulsoup,我编写了一个函数,它根据头的标记(h1/2…)解析所有头。现在,我想对其进行扩展,并添加一个基于字体大小解析文本的功能—比如说20px或1.5em,而不考虑标题。我想要一个功能,使任何文字写在字体大小大于X,无论它在网页上。该函数将json文件作为输入,其中包含随机HTML(以及任何网站可能包含的内容,如CSS等) 基于这一点,一个可能的选择似乎是使用soup.fetch(),但是,我还没有找到很多用于此目的的示例 由于字体大小可能会出现在CSS组件下,我不确定bs4是否适合它。我假设答案包括c

我编写了一个函数,它根据头的标记(h1/2…)解析所有头。现在,我想对其进行扩展,并添加一个基于字体大小解析文本的功能—比如说20px或1.5em,而不考虑标题。我想要一个功能,使任何文字写在字体大小大于X,无论它在网页上。该函数将json文件作为输入,其中包含随机HTML(以及任何网站可能包含的内容,如CSS等)

基于这一点,一个可能的选择似乎是使用soup.fetch(),但是,我还没有找到很多用于此目的的示例

由于字体大小可能会出现在CSS组件下,我不确定
bs4
是否适合它。我假设答案包括
cssutils
tinycss
,但尚未找到将其用于此任务的最佳方法

作为参考-已发布标题标记的我的代码以供审阅:

我检查过的帖子: ;
;
;
;
;


非常感谢,

它如何根据字体大小解析文本?你的意思是你知道哪个标题标签的字体大小吗?谢谢@MoonCheesez的评论。我的意思是,不管标题是什么,我都想要一个功能,可以让任何文本的字体大小大于X。为了清晰起见,我会进行编辑-谢谢。它如何根据字体大小解析文本?你的意思是你知道哪个标题标签的字体大小吗?谢谢@MoonCheesez的评论。我的意思是,不管标题是什么,我都希望有一个功能,可以让任何字体大于X的文字都能显示出来。为了清晰起见,我会进行编辑-谢谢。