Ruby Nokogiri抓取未命中HTML
Nokogiri没有抓取Ruby Nokogiri抓取未命中HTML,ruby,web-scraping,nokogiri,Ruby,Web Scraping,Nokogiri,Nokogiri没有抓取iframe标记下面的任何东西 doc.search(“iframe”)只返回iframe标记文档搜索(“body.content frame”)返回空文档错误也返回空。为什么Nokogiri不在iframe下注册HTML?我怎么能抓住它 <html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"> <head></head> <body
iframe
标记下面的任何东西
doc.search(“iframe”)
只返回iframe
标记<代码>文档搜索(“body.content frame”)返回空<代码>文档错误也返回空。为什么Nokogiri不在iframe下注册HTML?我怎么能抓住它
<html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head></head>
<body onunload="clearMyTimeInterval()">
<iframe id="content-frame" frameborder="0" src="/sportsbook/betting-lines/baseball/2014-08-21/?range=day" onload="javascript:checkLoadedFrame(this);" style="background-color: rgb(34, 34, 34); height: 1875px;" name="content-frame" scrolling="no" border="0">
#document
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head></head>
<body class="content-frame">
#ETC.......
#文件
#等等。。。。。。。
这是因为iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意iframe
的src
属性)。您必须单独获取该内容,这是浏览器的工作方式。这是因为iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意iframe
的src
属性)。您必须单独获取该内容,这是浏览器的工作方式。这是因为iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意iframe
的src
属性)。您必须单独获取该内容,这是浏览器的工作方式。这是因为iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意iframe
的src
属性)。您必须单独获取该内容,这是浏览器的工作方式。以下是处理该内容的代码:
page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content
下面是处理它的代码:
page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content
下面是处理它的代码:
page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content
下面是处理它的代码:
page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content
如果你想让我发布更多的HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。在回答时,解释代码如何工作以及为什么它应该是选定的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们正在努力进行教育,而不仅仅是提供代码。