(python)sgmlparser以及如何在标记之间而不是属性/值之间提取数据
我看到的每个sgmlparser示例都涉及到查找标记,然后查找标记的属性/值。因此,对于谷歌来说,这将是一种提取“google.com”的能力。但是我想要标签之间的数据。所以,如果我使用sgmlparser,我将查找并提取该div中的所有内容,直到它成为结束标记。这是sgmlparser的工作,还是我使用了错误的库?因为你提到了div,我想你想要解析HTML。为了做到这一点,你最好的选择是(python)sgmlparser以及如何在标记之间而不是属性/值之间提取数据,python,html,Python,Html,我看到的每个sgmlparser示例都涉及到查找标记,然后查找标记的属性/值。因此,对于谷歌来说,这将是一种提取“google.com”的能力。但是我想要标签之间的数据。所以,如果我使用sgmlparser,我将查找并提取该div中的所有内容,直到它成为结束标记。这是sgmlparser的工作,还是我使用了错误的库?因为你提到了div,我想你想要解析HTML。为了做到这一点,你最好的选择是