Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/406.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 检查字符串是否为有效的HTML标记_Python - Fatal编程技术网

Python 检查字符串是否为有效的HTML标记

Python 检查字符串是否为有效的HTML标记,python,Python,我正在使用beautifulsoup和lxml解析器解析python中的html文档。 这些html文档可能非常脏,几乎有任意字符串作为标记名 我想检查给定的标记名是否是有效的html标记。除了手动创建一个包含所有有效html标记的列表之外,python中还有其他方法可以做到这一点吗?这不是您想要的,但我想指出的是,列表方法是有效的,并且列表不会太长,无法放在某个文件中:哦,这个列表一点也不长!出于某种原因,我认为有效html标记的列表要大得多。有效标签的白名单似乎是一个不错的方法。尽管出于可维

我正在使用beautifulsoup和lxml解析器解析python中的html文档。 这些html文档可能非常脏,几乎有任意字符串作为标记名


我想检查给定的标记名是否是有效的html标记。除了手动创建一个包含所有有效html标记的列表之外,python中还有其他方法可以做到这一点吗?

这不是您想要的,但我想指出的是,列表方法是有效的,并且列表不会太长,无法放在某个文件中:哦,这个列表一点也不长!出于某种原因,我认为有效html标记的列表要大得多。有效标签的白名单似乎是一个不错的方法。尽管出于可维护性考虑,如果有某种方法可以通过编程从确定的源中检索最新的列表,以防添加新的标记,那就太好了。