在javascript/php中使用YQL刮取文章html?

在javascript/php中使用YQL刮取文章html?,php,javascript,html,yql,Php,Javascript,Html,Yql,我是YQL新手,只是想学习如何做一些相当简单的任务 假设我有一个URL列表,我想在javascript中以字符串的形式获取它们的HTML源代码(这样我可以稍后通过ajax将其插入数据库)。我将如何用Javascript获取这些信息?还是我必须用PHP来做?我对任何一种都没意见,真的-任何能起作用的都可以 下面是我在其控制台上运行的示例查询: 从url=”的html中选择*http://en.wikipedia.org/wiki/Baroque_music" 我们的目标是将HTML或者仅仅是文本或

我是YQL新手,只是想学习如何做一些相当简单的任务

假设我有一个URL列表,我想在javascript中以字符串的形式获取它们的HTML源代码(这样我可以稍后通过ajax将其插入数据库)。我将如何用Javascript获取这些信息?还是我必须用PHP来做?我对任何一种都没意见,真的-任何能起作用的都可以

下面是我在其控制台上运行的示例查询:

从url=”的html中选择*http://en.wikipedia.org/wiki/Baroque_music"

我们的目标是将HTML或者仅仅是文本或者其他东西保存为字符串

我该怎么做呢?我有些了解查询是如何工作的,但并不真正了解如何与javascript和/或php集成(比如说,我有一个URL列表,我想循环浏览它们,在每个URL处获取html并将其保存在某个位置)


谢谢

由于web浏览器中内置的安全功能,您无法使用Javascript读取其他页面。它被称为

通常的方法是使用PHP从服务器上刮取这些站点的内容

javascript还有另一个选项,称为

您可以在书签栏中添加bookmarklet,每次需要站点内容时,单击书签

脚本将加载到主机页,它可以读取内容并将其发布回服务器

奇怪的是,同源策略并不阻止您将数据从此主机页发布到您的域。您需要将表单发布到IFRAME,该IFRAME的源托管在您的域中

您将无法阅读从帖子中得到的回复。

但是,您可以使用
setInterval
调用您的域进行轮询,以了解帖子是否成功。

您希望使用JavaScript获取HTML/文本,然后通过AJAX将其保存到服务器上,这有什么特别的原因吗?在保存之前,您是否会在浏览器中操作内容?