如何在客户端使用javascript提取文本

如何在客户端使用javascript提取文本,java,javascript,php,xpath,web-scraping,Java,Javascript,Php,Xpath,Web Scraping,我想开发一个脚本,当他输入我们网站的url时,它将从客户端提取某些信息 对于exmaple-:如果他输入url www.example.com,代码将初始化并从客户端提取某些信息。对于每个用户,如facebook电子邮件等,这将是不同的 因此,我考虑了这个选项,并认为这几乎是不可能的,除非我有某种javascript代码,每当他访问网站时,这些代码都会在客户端执行。我还考虑了一些库,如Jsoup、selenium等,但我猜它们只是在本地执行,这并没有解决我的问题 我想提取的文本在iframe中,

我想开发一个脚本,当他输入我们网站的url时,它将从客户端提取某些信息

对于exmaple-:如果他输入url www.example.com,代码将初始化并从客户端提取某些信息。对于每个用户,如facebook电子邮件等,这将是不同的

因此,我考虑了这个选项,并认为这几乎是不可能的,除非我有某种javascript代码,每当他访问网站时,这些代码都会在客户端执行。我还考虑了一些库,如Jsoup、selenium等,但我猜它们只是在本地执行,这并没有解决我的问题

我想提取的文本在iframe中,在表中更进一步。那么,是否可以编写一个代码(javascript或其他东西),我将其包含在index.php页面中,并在客户端执行,提取信息并将结果存储在数据库中


这个场景是,如果用户已经在同一个浏览器上登录到facebook,那么当他访问我的网站时,它会自动显示他与facebook相关的电子邮件id。所以我想提取该电子邮件id。有什么建议吗

编辑-->>

我正在尝试以下代码移动到框架,然后获取内容,但它返回的是空内容文档

var iframe = document.evaluate('//iframe[contains(@src, \"//my.leadpages.net/forms/5620062778032128/5654100301578240/5645914630782976/html/?lp-in-iframe=1\")]',document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).contentDocument;alert(iframe);

另外,如果您可以指导我如何移动到框架,然后通过节点获取其内容。如果框架没有id,名称等,所以我使用了xpath方式。它将帧检测为结果XpathResult,但我不确定如何移动到其中,然后为各个节点提取文本。这必须是Javascript。

我非常确定浏览器不会允许您访问iframe的内容。
还有,你想实现的这件事听起来有点可疑。你为什么要获取用户没有明确提供给你的数据?

好吧,为了做一些与每个用户相关和特定的事情,你需要在服务器端有一个成员系统;换句话说,您的用户必须登录。这是一个相当复杂的系统,而不是一小段代码,但在伪代码中,它可能如下所示

// on you server side, using PHP, C#, Java ...
if(is_current_user_logged_in(some_user)){
    // at this point you know who's the user so
    // do whatever you need
}

正确的方法是要求用户使用他们的facebook帐户登录您的网站


请参阅,以了解一种更为普遍的方法(让用户可以控制接下来发生的事情)

@DavidPostill如果用户已经在同一浏览器上登录到facebook,那么当他访问我的网站时,它会自动显示他与facebook相关的电子邮件id。所以我想提取该电子邮件id。有什么建议吗?如果我访问你的网站,你会自动检索我的facebook登录电子邮件吗?不,谢谢!正确的方法是让用户使用他们的facebook帐户登录你的网站。请参阅以获得更为普遍的方法(这将让用户控制接下来发生的事情)@DavidPostill如果用户在同一浏览器上维护了facebook会话,那么该网站将自动知道用户的facebook电子邮件(我不知道如何可能是oAuth等)。当用户单击按钮时,它会在iframe中显示一个弹出窗口,显示用户的facebook名称和电子邮件,并要求用户确认他想登录acc。我想要的是已经是他们的帐户。@Anishharma您在提供的代码中检查过了吗?你说的是facebook,但它与此链接无关。我看到一张空表格。但是,如果该iframe在页面/位置a)上已经有内容,为什么要将其注入到另一个页面/位置b)以获得相同的内容?!如果用户已经在同一浏览器上登录到facebook,那么当他访问我的网站时,它会自动显示他与facebook相关的电子邮件id。所以我想提取该电子邮件id。有什么建议吗?@pctr当然我可以访问iframe的内容,或者html的任何部分(源页面)。如果用户已经在同一个浏览器上登录到facebook,那么当他访问我的网站时,它将自动显示他与facebook相关的电子邮件id。因此,我想提取该电子邮件id。有什么建议吗?如果您需要一种正确/干净的方式来执行此操作,这可能会对您有所帮助。但是你的评论听起来像是想从源页面/html(在本例中)中提取/删除该数据;如果是这样,请向我展示该数据写入的html代码片段。如果用户在同一浏览器上维护了facebook会话,则该网站会自动知道用户的facebook电子邮件(我不知道怎么可能是oAuth等)。当用户单击按钮时,它会在iframe中显示一个弹出窗口,显示用户的facebook名称和电子邮件,并要求他确认他想登录acc。我想要的是已经是他们的。如果用户在同一浏览器上维护了facebook会话,则该网站会自动知道用户的facebook电子邮件(我不知道怎么可能是一些oAuth等)。当用户点击一个按钮,然后它会显示一个弹出窗口,在一个iframe中显示用户的facebook名称和电子邮件,并要求他确认他想登录acc。我想要的是已经是他们的。