Ruby 转换HTML文档中的URL?

Ruby 转换HTML文档中的URL?,ruby,regex,url,nokogiri,Ruby,Regex,Url,Nokogiri,我在foo.com上有一个HTML文档,它由链接、表单、资源URL(图像/JavaScript)组成 我想在bar.com上提供没有框架的服务。我还希望将所有相对URL转换为主机名为“bar.com”的绝对URL、资产URL和表单操作URL 我从foo.com获取了HTML文档。使用Nokogiri转换其中URL的下一步是什么?Nokogiri是一个HTML/XML解析器。您可以按照以下步骤了解如何解析文档 以下是一个例子: require 'rubygems' require 'nokogir

我在foo.com上有一个HTML文档,它由链接、表单、资源URL(图像/JavaScript)组成

我想在bar.com上提供没有框架的服务。我还希望将所有相对URL转换为主机名为“bar.com”的绝对URL、资产URL和表单操作URL


我从foo.com获取了HTML文档。使用Nokogiri转换其中URL的下一步是什么?

Nokogiri是一个HTML/XML解析器。您可以按照以下步骤了解如何解析文档

以下是一个例子:

require 'rubygems'
require 'nokogiri'
# Open the remote document, or from local file
require 'open-uri' # load open-uri library if the input is from the Internet
doc = Nokogiri::HTML(open(URL_OR_PATH_TO_DOCUMENT))

# Search for img tags:
doc.css('img').each do |img|
  # modify its attribute
  img['src'] = "#{URL_PREFIX}/#{img['src']}"
end

# print the modified html
puts doc.to_html
require 'nokogiri'
require 'open-uri'

url = 'http://www.google.com'
doc = Nokogiri::HTML(open(url))
doc.xpath('//a').each do |d|
  rel_url = d.get_attribute('href')
  d.set_attribute('href', 'http://www.xyz.com/' + rel_url)
end