Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/391.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 输入URL并扫描网页中的特定单词(请求规划建议) 出身背景_Javascript - Fatal编程技术网

Javascript 输入URL并扫描网页中的特定单词(请求规划建议) 出身背景

Javascript 输入URL并扫描网页中的特定单词(请求规划建议) 出身背景,javascript,Javascript,我想在我的网站上创建一个在线工具,其中: 用户输入URL或用户输入复制/粘贴的文本块,然后单击提交按钮; 表单从输入URL的网页中提取文本; 扫描我将创建的列表中的特定单词的文本; 输出这些特定单词的点击次数以及这些单词出现在网页上的次数; 最后在页面底部给出报告和建议。 类似 它与那些关键字密度检查或字数统计网站非常相似,但当我检查这些页面的页面源时,我不太能够对它们进行反向工程来找出答案。我发现的JS不完整,这让我想知道它们背后的一些大脑是否发生在一个单独的文件PHP文件?中 从哪里开始?

我想在我的网站上创建一个在线工具,其中:

用户输入URL或用户输入复制/粘贴的文本块,然后单击提交按钮; 表单从输入URL的网页中提取文本; 扫描我将创建的列表中的特定单词的文本; 输出这些特定单词的点击次数以及这些单词出现在网页上的次数; 最后在页面底部给出报告和建议。 类似 它与那些关键字密度检查或字数统计网站非常相似,但当我检查这些页面的页面源时,我不太能够对它们进行反向工程来找出答案。我发现的JS不完整,这让我想知道它们背后的一些大脑是否发生在一个单独的文件PHP文件?中

从哪里开始? 经过13年的网站修补工作,我对HTML和CSS很有经验,但对JS和PHP的理解一般是业余爱好者/不太深入

我认为我需要首先创建一个HTML表单、div和按钮,然后创建JS来验证URL,从URL中提取信息,分析它,然后提供建议。我需要使用AJAX、PHP等吗

在这个阶段,我只要求提供从哪里开始的信息。我已经搜索了StackOverflow论坛和不同的Google搜索,但还没有找到我要搜索的内容,所以我欢迎一些专家提供指导。如果有人知道关于这个主题的任何其他示例或教程,我欢迎任何有用的链接

再一次,我想做举重,这样我可以从这个过程中学习


提前感谢。

为了方便起见,我将创建一个PHP api。拥有一个脚本,该脚本将根据用户操作调用其他脚本。要处理URL刮取,使用CURL就足够了。匹配部分可以是常规的旧字符串比较,也可以是奇特的KMP算法,所有这些都是用PHP实现的。

是的,你的直觉是正确的。大多数网页扫描器都是从后台工作的,并且是用PHP、java、C++和任何其他你能想到的语言编写的。 但是,可以使用纯javascript编写这样的扫描仪,并在没有后端的情况下从浏览器运行它

我建议你检查一下角度框架——如果你想扩展你的技能,这是一个很好的方向

如果您使用的是NG aNGular,这就是它的外观,请注意,这只是一个代码片段,完整的工作示例将需要更多的代码

重要提示:纯JS解决方案可能会遇到一些CORS挑战!你需要进行实验

getText(url: string) {
  // The Observable returned by get() is of type Observable<string>
  // because a text response was specified.
  // There's no need to pass a <string> type parameter to get().
  return this.http.get(url, {responseType: 'text'})
    .pipe(
      tap( // Log the result or error
        data => {
           this.log(filename, data);
           // here you can split your data into words and do your statistics
        },
        error => this.logError(filename, error)
      )
    );
}

创建JS以。。。从URL获取信息谢谢@Phil,非常感谢。我只是想从更大的角度来开始,然后反向工程到更小的细节。我需要使用什么来将网页中的文本拉入我的工具进行分析?您将遇到的另一个问题是,许多网站内容是通过JavaScript动态呈现的,因此它不会出现在初始页面源中。StackOverflow上还有很多其他帖子供你阅读。您想要搜索的术语是web scrapingYou将需要php或任何其他服务器端语言,因为客户端代码在cors等方面会失败很多,而且许多站点是SPA,您无法使用php的域文档进行解析。但是,如果您只想计算一个单词在文档正文中出现的次数,请获取它,将其解析为文本,拆分为单词,循环遍历每个单词,然后计算您的WOD匹配的次数。还有其他的考虑,比如检查robots.txt etcThanks@Phil,是的,我确实认为这就是发生的事情。我会查那些搜索词的。谢谢。谢谢@Deian,我一定会检查一下角度框架。理想情况下,我希望保持这个相对简单但有效的方法。我要一个修补匠。感谢@Voxum,很高兴知道我可以通过PHP实现这一点。我知道它有一些活动部件,所以最好有所有的选择。为回应干杯。