使用Ruby Mechanize访问网站部分有困难
我正在尝试访问airbnb列表上的日历数据,但迄今为止未成功。我在Ruby中使用Mechanize gem,当我尝试访问链接以访问表时,遇到以下错误:使用Ruby Mechanize访问网站部分有困难,ruby,mechanize,Ruby,Mechanize,我正在尝试访问airbnb列表上的日历数据,但迄今为止未成功。我在Ruby中使用Mechanize gem,当我尝试访问链接以访问表时,遇到以下错误: require 'mechanize' agent = Mechanize.new page1=agent.get("https://www.airbnb.com/rooms/726348") page2=agent.get("https://www.airbnb.com/rooms/calendar_tab_inner2/73944?cal_m
require 'mechanize'
agent = Mechanize.new
page1=agent.get("https://www.airbnb.com/rooms/726348")
page2=agent.get("https://www.airbnb.com/rooms/calendar_tab_inner2/73944?cal_month=11&cal_year=2013¤cy=USD")
Mechanize::ResponseCodeError: 400 => Net::HTTPBadRequest for https://www.airbnb.com/rooms/calendar_tab_inner2/726348?cal_month=11&cal_year=2013¤cy=USD -- unhandled response
我还尝试用以下代码单击生成表的选项卡,但这样做只是从原始url生成html
agent = Mechanize.new
page1=agent.get("https://www.airbnb.com/rooms/726348")
page2=agent.click(page1.link_with(:href => '#calendar'))
任何帮助都将不胜感激。谢谢 我发现了问题,您需要检查请求头:
page = agent.get url, nil, nil, {'X-Requested-With' => 'XMLHttpRequest'}
您的
page2
链接对我无效。但是这一个没有https://www.airbnb.co.uk/rooms/calendar_tab_inner2/726348?cal_month=11&cal_year=2013¤cy=GBP
不幸的是,这一切都不起作用。看起来您需要能够处理javascript的东西