Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/384.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用Jsoup提取图像id_Java_Web Scraping_Jsoup - Fatal编程技术网

Java 使用Jsoup提取图像id

Java 使用Jsoup提取图像id,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,我试图使用api Jsoup提取特定的captcha图像id,html图像标记如下: 这是我获取属性的代码id=“wlspispHIPBimg03256465465dsd5456”: 问题是我无法获取captcha图像的id,您需要在html中找到一些区别文档中任何其他标记的img标记的内容。从您发布的代码中无法推断,因此我在这里运用我的想象力: Element imageEl = doc.select("img[scr*=rnd]").first(); 这利用了图像源在其路径中包含“rnd

我试图使用api Jsoup提取特定的captcha图像id,html图像标记如下:

这是我获取属性的代码
id=“wlspispHIPBimg03256465465dsd5456”


问题是我无法获取captcha图像的id,您需要在html中找到一些区别文档中任何其他标记的img标记的内容。从您发布的代码中无法推断,因此我在这里运用我的想象力:

Element imageEl = doc.select("img[scr*=rnd]").first();

这利用了图像源在其路径中包含“rnd”的漏洞。为了得到最好的解决方案,你必须审视自己。另外,如果您学习Jsoup的CSS选择器,它也会有很大帮助。

您需要在html中找到一些区别文档中任何其他标记的img标记的内容。从您发布的代码中无法推断,因此我在这里运用我的想象力:

Element imageEl = doc.select("img[scr*=rnd]").first();

这利用了图像源在其路径中包含“rnd”的漏洞。为了得到最好的解决方案,你必须审视自己。另外,如果您学习Jsoup的CSS选择器,它也会有很大帮助。

我认为您仅仅使用Jsoup是无法实现这一点的,DOM是在运行时用javascript修改的,Jsoup根本不会执行它


还可以查看另一个。

我认为仅使用Jsoup是无法实现这一点的,DOM是在运行时使用javascript修改的,Jsoup只是不执行它


也可以查看其他代码。

这段代码对我来说很好。请提出您的问题并发布。另外,
doc.select(“img[src~=(?i)”);
doc.select(“img[src]”)相同;
因为
(?i)
只是一个使所用正则表达式不区分大小写的标志,但一开始就没有正则表达式,而且您的选择器甚至没有用
]
关闭。谢谢您的回答,我还尝试使用img[^id=“wlspispHIPBimg”],但它不起作用。该代码对我来说很好。请提出您的问题并发布。另外,
doc.select(“img[src~=(?i)”);
doc.select(“img[src]”)相同;
因为
(?i)
只是一个使所用正则表达式不区分大小写的标志,但一开始就没有正则表达式,而且您的选择器甚至没有用
]
关闭。谢谢您的回答,我还尝试使用img[^id=“wlspispHIPBimg”],但它不起作用