使用Javascript/html5的所见即所得web抓取/爬网设置?

使用Javascript/html5的所见即所得web抓取/爬网设置?,javascript,html,screen-scraping,wysiwyg,web-crawler,Javascript,Html,Screen Scraping,Wysiwyg,Web Crawler,我的目标是让经验不足的人设置从网站上获取信息所需的参数 其思想是用户输入一个URL,然后将该URL加载到一个框架中。然后,用户应该能够选择此框架内的文本,这将为我提供足够的信息,以便在此特定文本动态更改时再次获取此信息 问题是,是否有可能检测到外部站点源的哪个部分对应于用户在一个框架中的选择 如果没有,还有其他选择吗 提前谢谢 问候,, Tom简短的回答是否定的。如果你不能控制iframe中的内容,你就无法与它进行交互 但是,您可以制作一个书签,它可以像您所描述的那样工作,或者制作一个浏览器插件

我的目标是让经验不足的人设置从网站上获取信息所需的参数

其思想是用户输入一个URL,然后将该URL加载到一个框架中。然后,用户应该能够选择此框架内的文本,这将为我提供足够的信息,以便在此特定文本动态更改时再次获取此信息

问题是,是否有可能检测到外部站点源的哪个部分对应于用户在一个框架中的选择

如果没有,还有其他选择吗

提前谢谢

问候,,
Tom

简短的回答是否定的。如果你不能控制iframe中的内容,你就无法与它进行交互


但是,您可以制作一个书签,它可以像您所描述的那样工作,或者制作一个浏览器插件

以前有人尝试使用基于视觉的刮刀,但它们很快变得比编写代码更麻烦、更复杂。通过一些抽象(一个用于刮取的函数,一个用于按ID选择表并将其转换为数组的函数等),您可以制作一些仍然适合初学者的东西。

简单的答案是否定的。如果您不控制iframe中的内容,则无法与之交互。但是,您可以制作一个书签,它可以像您所描述的那样工作,或者制作一个浏览器插件。我没有完全遵循的部分是“当这个特定的文本动态变化时,它应该给我足够的信息来再次刮取这些信息”部分。@georgemandis将您的评论作为一个答案。这实际上是一个完整的答案@Geogermandis,如果我复制源代码,并将内部链接和图像源设置为外部,以便在我拥有的框架中运行此功能,这将允许我做我想做的事情?你可能可以,但我不确定你想做什么:)@拉希姆,好主意-谢谢!稍后我会再问一个问题。谢谢