Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/359.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/82.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
(python)sgmlparser以及如何在标记之间而不是属性/值之间提取数据_Python_Html - Fatal编程技术网

(python)sgmlparser以及如何在标记之间而不是属性/值之间提取数据

(python)sgmlparser以及如何在标记之间而不是属性/值之间提取数据,python,html,Python,Html,我看到的每个sgmlparser示例都涉及到查找标记,然后查找标记的属性/值。因此,对于谷歌来说,这将是一种提取“google.com”的能力。但是我想要标签之间的数据。所以,如果我使用sgmlparser,我将查找并提取该div中的所有内容,直到它成为结束标记。这是sgmlparser的工作,还是我使用了错误的库?因为你提到了div,我想你想要解析HTML。为了做到这一点,你最好的选择是

我看到的每个sgmlparser示例都涉及到查找标记,然后查找标记的属性/值。因此,对于谷歌来说,这将是一种提取“google.com”的能力。但是我想要标签之间的数据。所以,如果我使用sgmlparser,我将查找并提取该div中的所有内容,直到它成为结束标记。这是sgmlparser的工作,还是我使用了错误的库?

因为你提到了div,我想你想要解析HTML。为了做到这一点,你最好的选择是