Php 如何从运行时生成的网页中提取HTML标记
我正在使用SimpleHTMLDOM解析器从网页中提取HTML数据。但我遇到过一些网站,比如网页是在运行时生成的 我需要知道有人试过解析这些页面吗Php 如何从运行时生成的网页中提取HTML标记,php,html-parsing,simple-html-dom,Php,Html Parsing,Simple Html Dom,我正在使用SimpleHTMLDOM解析器从网页中提取HTML数据。但我遇到过一些网站,比如网页是在运行时生成的 我需要知道有人试过解析这些页面吗 我是这个领域的新手,因此关于这个主题的一些理论将有助于我理解解析网页。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应 这通常是JSON格式的,与HTML相比,JSON非常容易解析。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是aja
我是这个领域的新手,因此关于这个主题的一些理论将有助于我理解解析网页。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应
这通常是JSON格式的,与HTML相比,JSON非常容易解析。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应
这通常是JSON格式的,与HTML相比,JSON非常容易解析。John Resig编写了一个HTML解析器 :
这可以帮你锻炼。约翰·雷西格编写了一个HTML解析器 :
这可以锻炼你。你如何确保一些HTML不是直接在Javascript上生成的,而不是使用AJAX???当然可以。但数据必须来自某个地方。寻找源代码,而不是试图解析最终结果。你们可以继续检查www.coursera.com的源代码。你们可能正在寻找的数据集是正确的,数据来自json ajax调用。不过,不要看源代码——看看网站在浏览器的网络面板或调试代理中发出的请求。如何确保某些HTML不是直接在Javascript上生成的,而不是使用AJAX???当然可以。但数据必须来自某个地方。寻找源代码,而不是试图解析最终结果。你们可以继续检查www.coursera.com的源代码。你们可能正在寻找的数据集是正确的,数据来自json ajax调用。但不要查看源代码-查看站点在浏览器的网络面板或调试代理中发出的请求。