Javascript 使用xpath jsonpath或任何其他工具进行Web抓取,以提取以.jpg结尾的文件名

Javascript 使用xpath jsonpath或任何其他工具进行Web抓取,以提取以.jpg结尾的文件名,javascript,ruby-on-rails,xpath,web-scraping,jsonpath,Javascript,Ruby On Rails,Xpath,Web Scraping,Jsonpath,这是另一个寻求帮助的请求,因为我的请求从未得到真正的答复。我将尝试一种不同的方法 我需要能够刮从一个网站的所有图像文件名。 我将RubyonRails与Nokogiri(以及Mechanize)一起使用。我能找到那一页。 然而,一旦我得到了这个页面,我就不知道如何使用xpath来获取所需的文件名(我希望能够使用以“http://”开头,以“.jpg”结尾的xpath,但还不知道如何使用) 一个示例url是臭名昭著的亚马逊产品页面: 主产品以粉色连衣裙开始,但我也想要灰色和黑色连衣裙。使用xpat

这是另一个寻求帮助的请求,因为我的请求从未得到真正的答复。我将尝试一种不同的方法

我需要能够刮从一个网站的所有图像文件名。 我将RubyonRails与Nokogiri(以及Mechanize)一起使用。我能找到那一页。 然而,一旦我得到了这个页面,我就不知道如何使用xpath来获取所需的文件名(我希望能够使用以“http://”开头,以“.jpg”结尾的xpath,但还不知道如何使用)

一个示例url是臭名昭著的亚马逊产品页面:

主产品以粉色连衣裙开始,但我也想要灰色和黑色连衣裙。使用xpath的
//img/@src
我可以得到粉红色的裙子,但不能得到另外两件。(另一方面,当我在Chrome的XPather插件中尝试xpath的
//img
时,返回了很多图像,但当我尝试在Ruby中仅使用
//img
时,我得到了一个错误;确切的代码是:

tmp2 = Nokogiri::HTML(open(recommendation_url))
   tmp2.xpath('//img/@src').each do |i_img|
end
还有一件事,当我在amazon页面上创建一个运行以下javascript代码的bookmarklet时,它工作得非常好!!:

    for (a=0;a<document.images.length;a++){
       x+='<img src='+document.images[a].src+'><br>'};
       if(x!='' {
          document.write('<center>'+x+'</center>');
          void(document.close())
       }else{
          alert('No images!')
       }
     }
(a=0;a)的