Python 使用XPATH从特定表/网站获取数据_Python_Xml_Xpath

Python 使用XPATH从特定表/网站获取数据

python xml xpath

Python 使用XPATH从特定表/网站获取数据,python,xml,xpath,Python,Xml,Xpath,我试图使用xpath从网站获取一些值。如果你看右上角，应该有一个表，上面有一些值。我想要得到的是标题“Adhan”下的6个编号值，意思是： 4.39、6.20等我知道您需要在html代码中找到一些独特的东西，我发现： //*[@id='slideshow-305-57546dc930cff'] 但我不知道如何从那里继续前进，实现我想要的价值观。我正在尝试这样的事情： dict = {} url = "http://irvingmasjid.org/index.php" rows_xp

我试图使用xpath从网站获取一些值。

如果你看右上角，应该有一个表，上面有一些值。我想要得到的是标题“Adhan”下的6个编号值，意思是：

4.39、6.20等

我知道您需要在html代码中找到一些独特的东西，我发现：

//*[@id='slideshow-305-57546dc930cff']

但我不知道如何从那里继续前进，实现我想要的价值观。我正在尝试这样的事情：

dict = {}

url = "http://irvingmasjid.org/index.php"

rows_xpath = XPath("//*[@id='slideshow-305-57546dc930cff']/")


for id,row in enumerate(blabla:::)
    get the values here...

从未使用过太多python，也很抱歉不能提供更多信息。如果您有代码示例，将不胜感激

在Google Chrome中，如果您检查一个元素，然后右键单击它并选择“复制>复制XPath”，它应该生成您需要的XPath

我不确定该id值是从哪里获得的，除非它定期更改。当前，该div的id值是slideshow-305-575473207d5b6

编辑：好的，是的，看起来这个div的id是随机生成的（刷新页面几次…每次都应该不同）。所以用这个作为起点是没有用的。也可以直接转到

td

元素，因为它们有自己的id。

这个案例的有趣之处在于，您甚至不需要解析HTML—您正在使用的数据是从不同的URL检索的：

>>> from pprint import pprint
>>> import requests
>>> 
>>> url = "http://irvingmasjid.org/salah2016.php"
>>> response = requests.get(url)
>>> 
>>> pprint(response.json())
{u'_day_of_year': u'157',
 u'adhan_asr': u'5:09',
 u'adhan_dhuhr': u'1:29',
 u'adhan_fajr': u'4:39',
 u'adhan_isha': u'9:49',
 u'adhan_maghrib': u'8:37',
 u'day': u'12:37',
 u'j_asr': u'6:00',
 u'j_dhuhr': u'1:45',
 u'j_fajr': u'5:15',
 u'j_isha': u'10:15',
 u'jumuah_1': u'1:45',
 u'jumuah_2': u'2:45',
 u'midnight': u'12:37',
 u'month_date': u'12:37',
 u'sunrise': u'6:20',
 u'tahajjud': u'1:57'}

非常感谢。从中我们学到了很多。