Beautifulsoup 有没有办法在HTML文件中查找字符串并返回其XPath？_Beautifulsoup_Scrapy_Lxml_Python 3.7

Beautifulsoup 有没有办法在HTML文件中查找字符串并返回其XPath？

scrapy

Beautifulsoup 有没有办法在HTML文件中查找字符串并返回其XPath？,beautifulsoup,scrapy,lxml,python-3.7,Beautifulsoup,Scrapy,Lxml,Python 3.7,我正试图在一个铲运机中进行逆向工程，以生成一个模型来提取数据因此，我知道页面的标题，我想在HTML代码中查找它，然后将XPath或CSS选择器返回到此位置我在我的项目中使用了，但是，对于这个逆向工程，我想也许结合lxml解析器也可以帮助我。我只是没有找到任何关于它的文件有人知道有没有办法做到这一点吗？如果您实际使用的是lxml，您可以使用从lxml导入etree xml=”“” 福酒吧 """ tree=etree.fromstring（xml）对于tree.xpath中的匹配（“/

我正试图在一个铲运机中进行逆向工程，以生成一个模型来提取数据

因此，我知道页面的标题，我想在HTML代码中查找它，然后将XPath或CSS选择器返回到此位置

我在我的项目中使用了，但是，对于这个逆向工程，我想也许结合lxml解析器也可以帮助我。我只是没有找到任何关于它的文件

有人知道有没有办法做到这一点吗？

如果您实际使用的是lxml，您可以使用

从lxml导入etree
xml=”“”
福
酒吧
"""
tree=etree.fromstring（xml）
对于tree.xpath中的匹配（“/*[包含（text（），'bar'）]”）：
打印（etree.ElementTree（树）.getpath（匹配））

这张照片是：

/doc/one/two[2]/test

如果您实际使用的是lxml，则可以使用

从lxml导入etree
xml=”“”
福
酒吧
"""
tree=etree.fromstring（xml）
对于tree.xpath中的匹配（“/*[包含（text（），'bar'）]”）：
打印（etree.ElementTree（树）.getpath（匹配））

这张照片是：

/doc/one/two[2]/test

yes。。您可以在构建xpath的DOM中进行冗长的遍历，直到找到所需的元素为止。但这个问题太宽泛/离题了。是的。。您可以在构建xpath的DOM中进行冗长的遍历，直到找到所需的元素为止。但这个问题太宽泛/离题了。谢谢，丹尼尔！它实际上完全符合我的需要！谢谢，丹尼尔！它实际上完全符合我的需要！