Beautifulsoup 有没有办法在HTML文件中查找字符串并返回其XPath?

Beautifulsoup 有没有办法在HTML文件中查找字符串并返回其XPath?,beautifulsoup,scrapy,lxml,python-3.7,Beautifulsoup,Scrapy,Lxml,Python 3.7,我正试图在一个铲运机中进行逆向工程,以生成一个模型来提取数据 因此,我知道页面的标题,我想在HTML代码中查找它,然后将XPath或CSS选择器返回到此位置 我在我的项目中使用了,但是,对于这个逆向工程,我想也许结合lxml解析器也可以帮助我。我只是没有找到任何关于它的文件 有人知道有没有办法做到这一点吗?如果您实际使用的是lxml,您可以使用 从lxml导入etree xml=”“” 福 酒吧 """ tree=etree.fromstring(xml) 对于tree.xpath中的匹配(“/

我正试图在一个铲运机中进行逆向工程,以生成一个模型来提取数据

因此,我知道页面的标题,我想在HTML代码中查找它,然后将XPath或CSS选择器返回到此位置

我在我的项目中使用了,但是,对于这个逆向工程,我想也许结合lxml解析器也可以帮助我。我只是没有找到任何关于它的文件


有人知道有没有办法做到这一点吗?

如果您实际使用的是lxml,您可以使用

从lxml导入etree
xml=”“”
福
酒吧
"""
tree=etree.fromstring(xml)
对于tree.xpath中的匹配(“/*[包含(text(),'bar')]”):
打印(etree.ElementTree(树).getpath(匹配))
这张照片是:

/doc/one/two[2]/test

如果您实际使用的是lxml,则可以使用

从lxml导入etree
xml=”“”
福
酒吧
"""
tree=etree.fromstring(xml)
对于tree.xpath中的匹配(“/*[包含(text(),'bar')]”):
打印(etree.ElementTree(树).getpath(匹配))
这张照片是:

/doc/one/two[2]/test

yes。。您可以在构建xpath的DOM中进行冗长的遍历,直到找到所需的元素为止。但这个问题太宽泛/离题了。是的。。您可以在构建xpath的DOM中进行冗长的遍历,直到找到所需的元素为止。但这个问题太宽泛/离题了。谢谢,丹尼尔!它实际上完全符合我的需要!谢谢,丹尼尔!它实际上完全符合我的需要!