使用Relium抓取具有多个框架/文档的网站

使用Relium抓取具有多个框架/文档的网站,r,selenium,web-scraping,R,Selenium,Web Scraping,我正试图用Relium刮一个网站。但是,我被卡住了,因为该网站似乎有多个框架/文档,并且使用getElementbyXpath无法访问内部框架。我找到了一个关于如何使用SeleniumWebDriver实现这一点的相关链接。但是我不能用relium来解决这个问题。源代码如下所示: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dt

我正试图用Relium刮一个网站。但是,我被卡住了,因为该网站似乎有多个框架/文档,并且使用getElementbyXpath无法访问内部框架。我找到了一个关于如何使用SeleniumWebDriver实现这一点的相关链接。但是我不能用relium来解决这个问题。源代码如下所示:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
    <head>...</head>
    <frameset rows="80,*" style="border: 1px black;" noresize="noresize">
      <frame name="surftopframe" src="gpt.php?v=timer&amp;user=satoshimines&amp;pretime=1405388100&amp;id=1025&amp;sid=24526TVM0eU16RTFOVE0&amp;sid2=24526&amp;type=ptc&amp;siduid=24526&amp;" scrolling="no" marginheight="2" marginwidth="2" noresize="noresize">
        #document
         <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
         <html xmlns="http://www.w3.org/1999/xhtml">
            <head>...</head>
            <body marginwidth="2" marginheight="2">
            <!--
            <div id="banner"><a href="bannerclick.php?id=228" target="_blank"><img src="http://click2dad.net/_static/_css/img/click2dad_en.gif" alt="Banner Advertisement" /></a></div>
            -->
            <div id="timer">...</div>
            <div id="buttons" style="display: block;">...</div>
            <div id="menu">...</div>
任何关于Relium是否以及如何处理这些案例的例子都是非常好的


谢谢

据我所知,Relium不处理相框。找到了解决方案。虽然这在Relium中是不可能的,但还有另一个包-硒。它轻而易举地完成了这项任务。这是相关的教程,非常好,我应该说,在这段对话变成暮色地带之前,我是RSelenium的作者,就像…@jdharrison-你可以给我一个提示!!!但我想通过这种方式学习会更好:-使用RSelenium做得很好,感谢您提供了如此清晰的教程。只是现在我才意识到我共享的链接中的名字是匹配的,这很愚蠢。我想知道为什么这个包裹没有得到那么多的推广。从现在起,这将是我的第一选择。