Ruby 这篇文章是从哪里来的?
我第一次体验到这种宝石或水豚,就这一点而言,我正在用恶鬼来刮我图书馆的网站。它工作得很好。太好了Ruby 这篇文章是从哪里来的?,ruby,capybara,poltergeist,Ruby,Capybara,Poltergeist,我第一次体验到这种宝石或水豚,就这一点而言,我正在用恶鬼来刮我图书馆的网站。它工作得很好。太好了 def self.scrape_book_list(url) session = Capybara::Session.new(:poltergeist) session.visit(url) books = session.all('.js-titleCard') books_hash = books.map { |book| # getting info
def self.scrape_book_list(url)
session = Capybara::Session.new(:poltergeist)
session.visit(url)
books = session.all('.js-titleCard')
books_hash = books.map { |book|
# getting info from the session
}
books_hash
end
但是,在session.visitorl行之后,在它执行任何其他操作之前,它会打印以下内容:
你好!这个网站由OverDrive提供动力,我们的愿景是一个由阅读启发的世界。也许像你这样好奇的猫能帮上忙
我试着用Chrome查看页面,甚至偷看了一些js源代码,但我似乎不知道这篇文章是从哪里来的
我想问题是为什么/如何做这件事?我认为搜索html或js代码会在标题中的某个标记中打开文本,poltergeist在访问页面或其他内容时可能总是打印该标题,可能有一种不同的方法将url传递给visit,而visit不会这样做。但是没有运气
我像他们提到的那只猫一样好奇!有什么想法吗?该文本将来自控制台。日志。。。声明中的某个位置。默认情况下,Poltergeist会将所有JS控制台日志输出到stdout。您访问了哪个URL?谢谢!你知道有没有办法抑制这种情况吗?@JonathanTuzman将“:phantomjs_logger”选项设置为IO对象应该将其重定向到你想要的任何地方-