Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ruby-on-rails/53.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/23.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby on rails 数据刮取多个数组的创建和排序_Ruby On Rails_Ruby_Web Scraping_Nokogiri_Mechanize - Fatal编程技术网

Ruby on rails 数据刮取多个数组的创建和排序

Ruby on rails 数据刮取多个数组的创建和排序,ruby-on-rails,ruby,web-scraping,nokogiri,mechanize,Ruby On Rails,Ruby,Web Scraping,Nokogiri,Mechanize,我们正在尝试刮取课程名称、资格和课程持续时间,并将它们存储在一个单独的数组中。通过下面的内容,我们了解了所有这些内容,但它似乎是以随机顺序排列的,有些部分可能是按页面等顺序排列的。我们想知道是否有人能够提供帮助 require 'mechanize' mechanize = Mechanize.new @duration_array = [] @qual_array = [] @courses_array = [] page = mechanize.get('http://search.u

我们正在尝试刮取课程名称、资格和课程持续时间,并将它们存储在一个单独的数组中。通过下面的内容,我们了解了所有这些内容,但它似乎是以随机顺序排列的,有些部分可能是按页面等顺序排列的。我们想知道是否有人能够提供帮助

require 'mechanize'


mechanize = Mechanize.new
@duration_array = []
@qual_array = []
@courses_array = []

page = mechanize.get('http://search.ucas.com/search/results?Vac=2&AvailableIn=2016&IsFeatherProcessed=True&page=1&providerids=41')


page.search('div.courseinfoduration').each do |x|
puts x.text.strip
page.search('div.courseinfooutcome').each do |y|
puts y.text.strip

end

while next_page_link = page.at('.pager a[text()=">"]')
  page = mechanize.get(next_page_link['href'])

page.search('div.courseinfoduration').each do |x|
    name = x
    @duration_array.push(name)
    puts x.text.strip
  end
end
while next_page_link = page.at('.pager a[text()=">"]')
  page = mechanize.get(next_page_link['href'])

page.search('div.courseinfooutcome').each do |y|
    name = y
    @qual_array.push(name)
    puts y.text.strip
  end
end
page.search('div.coursenamearea h4').each do |h4|
puts h4.text.strip

end

while next_page_link = page.at('.pager a[text()=">"]')
  page = mechanize.get(next_page_link['href'])

page.search('div.coursenamearea h4').each do |h4|
    name = h4.text
    @courses_array.push(name)
    puts h4.text.strip
  end
end
end

您的问题是什么?想知道是否有人可以帮助订购输出。因此,要么所有课程都被挤出,然后是持续时间,然后是资格,或者如果每门课程的持续时间和资格可以与课程名称配对。如果我不清楚,很抱歉。这是你问题的部分副本?想知道是否有人可以帮助订购输出。因此,要么所有课程都被挤出,然后是持续时间,然后是资格,或者如果每门课程的持续时间和资格可以与课程名称配对。对不起,如果我不清楚的话。这是的部分副本