Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/289.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用python从弹出页面提取文本信息_Python_Web Crawler - Fatal编程技术网

使用python从弹出页面提取文本信息

使用python从弹出页面提取文本信息,python,web-crawler,Python,Web Crawler,是否可以使用python自动从弹出页面提取文本信息? 我有google play store应用程序链接: 如果您向下滚动到“附加信息”部分,您将找到“权限”。单击下面的“查看详细信息”将弹出一个页面。弹出窗口中的文本信息是否可提取? 如果可行,我如何从主页源获取信息? 非常感谢。这将是一个相当复杂的问题:您必须仔细阅读HTML以了解按钮的作用(链接实际上是一个按钮元素)。最好使用Google Play Store API,目前尚不存在。因此,最简单的选择是使用第三方API,为您爬网Play S

是否可以使用python自动从弹出页面提取文本信息? 我有google play store应用程序链接: 如果您向下滚动到“附加信息”部分,您将找到“权限”。单击下面的“查看详细信息”将弹出一个页面。弹出窗口中的文本信息是否可提取? 如果可行,我如何从主页源获取信息?
非常感谢。

这将是一个相当复杂的问题:您必须仔细阅读HTML以了解按钮的作用(链接实际上是一个
按钮
元素)。最好使用Google Play Store API,目前尚不存在。因此,最简单的选择是使用第三方API,为您爬网Play Store。下面是一个示例


我不会引导您完成整个过程,但您可能必须使用该模块。

您需要执行以下操作:

1) 设置webdriver以控制网站

2) 右键单击“查看详细信息”并选择“检查源代码”。这将打开页面的源代码。突出显示的部分对应于该按钮。您可以右键单击并复制xpath,并使用该按钮调用click函数


3) 打开新页面后,将驱动程序导航到此页面,并按照步骤2中相同的说明选择所需的文本。然后,您可以使用innerhtml函数从该元素中获取文本。

谢谢。我可以使用curl来提取数据。权限数据在JSON输出中可用。新的挑战是获取类别列表与数据匹配。仍在挣扎。谢谢你的建议。我不熟悉webdriver。我尝试了不同的选项。到目前为止,我能得到的最好的是没有类别标题的权限数据。需要研究一下webdriver,看看它是否能帮上忙。最后我让webdriver工作了。得到了我想要的。谢谢这又是方向。太棒了!现在你有了一些方便的代码供以后使用。如果你不介意的话,请选择我的答案好吗?