Ruby 如何处理Nokogiri中的404未发现错误
我用Nokogiri来刮网页。很少有URL需要猜测,当它们不存在时,返回404 not found错误。是否有方法捕获此异常Ruby 如何处理Nokogiri中的404未发现错误,ruby,http-status-code-404,nokogiri,Ruby,Http Status Code 404,Nokogiri,我用Nokogiri来刮网页。很少有URL需要猜测,当它们不存在时,返回404 not found错误。是否有方法捕获此异常 http://yoursite/page/38475 #=> page number 38475 doesn't exist 我尝试了以下方法,但没有成功 url = "http://yoursite/page/38475" doc = Nokogiri::HTML(open(url)) do begin rescue Exception =>
http://yoursite/page/38475 #=> page number 38475 doesn't exist
我尝试了以下方法,但没有成功
url = "http://yoursite/page/38475"
doc = Nokogiri::HTML(open(url)) do
begin
rescue Exception => e
puts "Try again later"
end
end
它不起作用,因为您没有拯救代码的一部分(它是
open(url)
call),在查找404状态时会引发错误。以下代码应该可以工作:
url = 'http://yoursite/page/38475'
begin
file = open(url)
doc = Nokogiri::HTML(file) do
# handle doc
end
rescue OpenURI::HTTPError => e
if e.message == '404 Not Found'
# handle 404 error
else
raise e
end
end
顺便说一句,关于营救异常
:
I最好使用
e.io.not\u found?