Javascript 输入URL并扫描网页中的特定单词（请求规划建议）出身背景_Javascript

Javascript 输入URL并扫描网页中的特定单词（请求规划建议）出身背景

javascript

Javascript 输入URL并扫描网页中的特定单词（请求规划建议）出身背景,javascript,Javascript,我想在我的网站上创建一个在线工具，其中：用户输入URL或用户输入复制/粘贴的文本块，然后单击提交按钮；表单从输入URL的网页中提取文本；扫描我将创建的列表中的特定单词的文本；输出这些特定单词的点击次数以及这些单词出现在网页上的次数；最后在页面底部给出报告和建议。类似它与那些关键字密度检查或字数统计网站非常相似，但当我检查这些页面的页面源时，我不太能够对它们进行反向工程来找出答案。我发现的JS不完整，这让我想知道它们背后的一些大脑是否发生在一个单独的文件PHP文件？中从哪里开始？

我想在我的网站上创建一个在线工具，其中：

用户输入URL或用户输入复制/粘贴的文本块，然后单击提交按钮；表单从输入URL的网页中提取文本；扫描我将创建的列表中的特定单词的文本；输出这些特定单词的点击次数以及这些单词出现在网页上的次数；最后在页面底部给出报告和建议。类似它与那些关键字密度检查或字数统计网站非常相似，但当我检查这些页面的页面源时，我不太能够对它们进行反向工程来找出答案。我发现的JS不完整，这让我想知道它们背后的一些大脑是否发生在一个单独的文件PHP文件？中

从哪里开始？经过13年的网站修补工作，我对HTML和CSS很有经验，但对JS和PHP的理解一般是业余爱好者/不太深入

我认为我需要首先创建一个HTML表单、div和按钮，然后创建JS来验证URL，从URL中提取信息，分析它，然后提供建议。我需要使用AJAX、PHP等吗

在这个阶段，我只要求提供从哪里开始的信息。我已经搜索了StackOverflow论坛和不同的Google搜索，但还没有找到我要搜索的内容，所以我欢迎一些专家提供指导。如果有人知道关于这个主题的任何其他示例或教程，我欢迎任何有用的链接

再一次，我想做举重，这样我可以从这个过程中学习

提前感谢。

为了方便起见，我将创建一个PHP api。拥有一个脚本，该脚本将根据用户操作调用其他脚本。要处理URL刮取，使用CURL就足够了。匹配部分可以是常规的旧字符串比较，也可以是奇特的KMP算法，所有这些都是用PHP实现的。

是的，你的直觉是正确的。大多数网页扫描器都是从后台工作的，并且是用PHP、java、C++和任何其他你能想到的语言编写的。但是，可以使用纯javascript编写这样的扫描仪，并在没有后端的情况下从浏览器运行它

我建议你检查一下角度框架——如果你想扩展你的技能，这是一个很好的方向

如果您使用的是NG aNGular，这就是它的外观，请注意，这只是一个代码片段，完整的工作示例将需要更多的代码

重要提示：纯JS解决方案可能会遇到一些CORS挑战！你需要进行实验

getText(url: string) {
  // The Observable returned by get() is of type Observable<string>
  // because a text response was specified.
  // There's no need to pass a <string> type parameter to get().
  return this.http.get(url, {responseType: 'text'})
    .pipe(
      tap( // Log the result or error
        data => {
           this.log(filename, data);
           // here you can split your data into words and do your statistics
        },
        error => this.logError(filename, error)
      )
    );
}

创建JS以。。。从URL获取信息谢谢@Phil，非常感谢。我只是想从更大的角度来开始，然后反向工程到更小的细节。我需要使用什么来将网页中的文本拉入我的工具进行分析？您将遇到的另一个问题是，许多网站内容是通过JavaScript动态呈现的，因此它不会出现在初始页面源中。StackOverflow上还有很多其他帖子供你阅读。您想要搜索的术语是web scrapingYou将需要php或任何其他服务器端语言，因为客户端代码在cors等方面会失败很多，而且许多站点是SPA，您无法使用php的域文档进行解析。但是，如果您只想计算一个单词在文档正文中出现的次数，请获取它，将其解析为文本，拆分为单词，循环遍历每个单词，然后计算您的WOD匹配的次数。还有其他的考虑，比如检查robots.txt etcThanks@Phil，是的，我确实认为这就是发生的事情。我会查那些搜索词的。谢谢。谢谢@Deian，我一定会检查一下角度框架。理想情况下，我希望保持这个相对简单但有效的方法。我要一个修补匠。感谢@Voxum，很高兴知道我可以通过PHP实现这一点。我知道它有一些活动部件，所以最好有所有的选择。为回应干杯。