Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/20.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby Nokogiri抓取未命中HTML_Ruby_Web Scraping_Nokogiri - Fatal编程技术网

Ruby Nokogiri抓取未命中HTML

Ruby Nokogiri抓取未命中HTML,ruby,web-scraping,nokogiri,Ruby,Web Scraping,Nokogiri,Nokogiri没有抓取iframe标记下面的任何东西 doc.search(“iframe”)只返回iframe标记文档搜索(“body.content frame”)返回空文档错误也返回空。为什么Nokogiri不在iframe下注册HTML?我怎么能抓住它 <html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"> <head></head> <body

Nokogiri没有抓取
iframe
标记下面的任何东西

doc.search(“iframe”)
只返回
iframe
标记<代码>文档搜索(“body.content frame”)返回空<代码>文档错误也返回空。为什么Nokogiri不在iframe下注册HTML?我怎么能抓住它

<html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">

    <head></head>
    <body onunload="clearMyTimeInterval()">
       <iframe id="content-frame" frameborder="0" src="/sportsbook/betting-lines/baseball/2014-08-21/?range=day" onload="javascript:checkLoadedFrame(this);" style="background-color: rgb(34, 34, 34); height: 1875px;" name="content-frame" scrolling="no" border="0">
           #document
           <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
           <html lang="en" xml:lang="en" xmlns="http://www.w3.org/1999/xhtml">
            <head></head>
            <body class="content-frame">
             #ETC.......

#文件
#等等。。。。。。。

这是因为
iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意
iframe
src
属性)。您必须单独获取该内容,这是浏览器的工作方式。

这是因为
iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意
iframe
src
属性)。您必须单独获取该内容,这是浏览器的工作方式。

这是因为
iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意
iframe
src
属性)。您必须单独获取该内容,这是浏览器的工作方式。

这是因为
iframe
的内容不是页面的一部分。事实上,它们位于完全不同的位置(请注意
iframe
src
属性)。您必须单独获取该内容,这是浏览器的工作方式。

以下是处理该内容的代码:

page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content

下面是处理它的代码:

page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content

下面是处理它的代码:

page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content

下面是处理它的代码:

page = Mechanize.new.get "http://page_u_need"
page.iframe_with(id: 'beatles').content

如果你想让我发布更多的HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。如果您希望我发布更多HTML,请告诉我。我尝试将HTML剪切到所需的格式。关闭浏览器中的JavaScript,重新加载页面,然后在浏览器窗格和源代码中查看页面。源代码是Nokogiri将接收和使用的。在回答时,解释代码如何工作以及为什么它应该是选定的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们试图进行教育,而不仅仅是提供代码。在回答问题时,解释代码是如何工作的以及为什么它应该是选择的答案更有用。我们正在努力进行教育,而不仅仅是提供代码。