Asp.net 使用ruby Mechanize抓取aspx站点时出错。Mechanize::ResponseCodeError:404=>;Net::HTTPNotFound

Asp.net 使用ruby Mechanize抓取aspx站点时出错。Mechanize::ResponseCodeError:404=>;Net::HTTPNotFound,asp.net,ruby-on-rails,ruby,web-scraping,http-status-code-404,Asp.net,Ruby On Rails,Ruby,Web Scraping,Http Status Code 404,我正试图用Ruby的mechanize刮去一个评级网站,但我遇到了很多麻烦。我的代码非常简单: require "mechanize" @client.get("http://cape.ucsd.edu/responses/Results.aspx") 此时,您将看到404错误 我尝试了一些方法,包括HTTParty搜索重定向;禁用SSL检查;甚至在本地保存html文件(以获取正确的查询表单),然后尝试直接从连接到主站点的代理发出它。所有这些都会导致相同的错误 我对刮擦还不太熟悉,我希望我在做

我正试图用Ruby的mechanize刮去一个评级网站,但我遇到了很多麻烦。我的代码非常简单:

require "mechanize"
@client.get("http://cape.ucsd.edu/responses/Results.aspx")
此时,您将看到404错误

我尝试了一些方法,包括HTTParty搜索重定向;禁用SSL检查;甚至在本地保存html文件(以获取正确的查询表单),然后尝试直接从连接到主站点的代理发出它。所有这些都会导致相同的错误


我对刮擦还不太熟悉,我希望我在做些傻事。任何帮助都将不胜感激

是的,它是用户代理。要设置用户代理,请执行以下操作:

@client = Mechanize.new
@client.user_agent = 'Mozilla'

我想如果你把URL指向其他地方,它会工作吗?如果是这样,我怀疑用户代理..欢迎使用堆栈溢出。请阅读“及”。示例代码不正确,返回错误。花点时间确保我们可以使用您的问题代码进行测试,这一点非常重要。不要指望我们重写它只是为了帮助解决问题,因为这可能导致各种各样的帮助。你希望我们帮助你,所以请提供我们所需要的。如果你得到的是404,那是因为你的URL错误或者资源不再可用。您需要确定正确的URL。