Python 试图从网站表中提取值的Xpath查询

Python 试图从网站表中提取值的Xpath查询,python,html,xpath,sec,Python,Html,Xpath,Sec,我试着做一个循环,进入sec.report上的公司简介列表,收集他们的“注册状态”,但只得到空白结果 例如,在上,我尝试使用Xpath函数提取值“Delaware”。我正在使用以下代码,其中包含一个xpath,我在google chrome的开发者视图中仔细检查了该xpath: sec=tree.xpath('/body/div[1]/div/div[3]/div[2]/table/tbody/tr[3]/text()) 有人能告诉我哪里出了问题吗?是否因为“注册国”不是一个定义的类别 我还提取

我试着做一个循环,进入sec.report上的公司简介列表,收集他们的“注册状态”,但只得到空白结果

例如,在上,我尝试使用Xpath函数提取值“Delaware”。我正在使用以下代码,其中包含一个xpath,我在google chrome的开发者视图中仔细检查了该xpath:
sec=tree.xpath('/body/div[1]/div/div[3]/div[2]/table/tbody/tr[3]/text())

有人能告诉我哪里出了问题吗?是否因为“注册国”不是一个定义的类别

我还提取了每家公司的CIK编号,但这些值都是使用非常相似的代码成功实现的,因此我不太确定哪里出了问题:
sec=tree.xpath('//div[1]/div/h2[1]/text())

如果使用下面的xpath,您的第一个xpath可能会工作,但这些xpath很脆弱。点击此网站,它将教你如何编写更好的路径-

你可以试试这些:

特拉华州:

//div[@class='panel panel-default'][1]/following::table[1]//td[text()='State of Incorporation']/following-sibling::td
CIK:


万分感谢,XPath太脆弱了。我已经按照你的建议进行了更新,看起来不错!很高兴它成功了。
//div[@class='panel panel-default'][1]/following::table[1]//td[text()='State of Incorporation']/following-sibling::td
//h2[contains(text(), 'SEC')]