Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/23.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby on rails 使用regex解析使用Nokogiri的src图像中的换行符和美元符号_Ruby On Rails_Ruby_Regex_Ruby On Rails 4_Nokogiri - Fatal编程技术网

Ruby on rails 使用regex解析使用Nokogiri的src图像中的换行符和美元符号

Ruby on rails 使用regex解析使用Nokogiri的src图像中的换行符和美元符号,ruby-on-rails,ruby,regex,ruby-on-rails-4,nokogiri,Ruby On Rails,Ruby,Regex,Ruby On Rails 4,Nokogiri,我在rails 4应用程序中使用nokogiri从网站上抓取图像,其中一些在出现错误后给我意外的“$” 例如,下面是一个示例图像url输出: <img src="http://x.example.com/images/detail/ln9502/1_ln-9502--- grh_375.jpg" alt="" style="display: block;"> 其中,我有属于某个库的项,并在每个库中设置css选择器。除非有更简单的解决方案,否则我可以使用什么正则表达式来忽略

我在rails 4应用程序中使用nokogiri从网站上抓取图像,其中一些在出现错误后给我意外的“$”

例如,下面是一个示例图像url输出:

  <img src="http://x.example.com/images/detail/ln9502/1_ln-9502---

  grh_375.jpg" alt="" style="display: block;">

其中,我有属于某个库的项,并在每个库中设置css选择器。除非有更简单的解决方案,否则我可以使用什么正则表达式来忽略换行符和美元符号?

您可以使用.gsub删除字符串中的新行和空格

我假设…属性'src'。value返回src标记的内容


对于记录,正则表达式与字符串的最后一个字符匹配。您可能想检查一下是否发送了正则表达式。

如果您将问题变得更具体,您可能更容易得到有用的答案。有什么想法吗?它是非常开放的。也许你会问,你将如何完成一些关于这些网址的具体事情。另外,我建议在开始编写代码之前,多写一些文字来描述a你想要什么,b你在得到结果时遇到了什么问题。我很抱歉!我还是个新手,希望这是一个明显的解决办法,因为我的大多数问题似乎都是这样的。我对我的问题进行了编辑。我认为错误后出现意外的“$”是由错误的css查询造成的,该查询包含$–what is library.image_selector?它会提取存储在每个库中的css图像选择器。这两个库的图像的css选择器都不包含$Thanks,您的re:src标记是正确的。我仍然在抓取页面,但问题似乎出在Nokogiri的解析上……所以我在操作值本身之前就遇到了一个错误。这有意义吗?我在nokogiri的唯一经验就是努力安装它,所以我不能帮你。其他人知道,你应该用你的新信息更新你的问题。我建议您尝试使用page.search。。单独查看该输出/是否有效。
  <img class="abc" src="http://xxx.example.com/is/image/Sample/503508739_1?$sample_size$">
  item_imageurl = page.search(library.image_selector).first.attribute('src').value(/(.|\n|\r)*/).to_s
  item_imageurl = page.search(library.image_selector).first.attribute('src').value().to_s.gsub(/[\n ]/, "")