Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/262.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 如何从运行时生成的网页中提取HTML标记_Php_Html Parsing_Simple Html Dom - Fatal编程技术网

Php 如何从运行时生成的网页中提取HTML标记

Php 如何从运行时生成的网页中提取HTML标记,php,html-parsing,simple-html-dom,Php,Html Parsing,Simple Html Dom,我正在使用SimpleHTMLDOM解析器从网页中提取HTML数据。但我遇到过一些网站,比如网页是在运行时生成的 我需要知道有人试过解析这些页面吗 我是这个领域的新手,因此关于这个主题的一些理论将有助于我理解解析网页。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应 这通常是JSON格式的,与HTML相比,JSON非常容易解析。在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是aja

我正在使用SimpleHTMLDOM解析器从网页中提取HTML数据。但我遇到过一些网站,比如网页是在运行时生成的

我需要知道有人试过解析这些页面吗


我是这个领域的新手,因此关于这个主题的一些理论将有助于我理解解析网页。

在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应


这通常是JSON格式的,与HTML相比,JSON非常容易解析。

在这种情况下,可能更容易,但并不总是如此。用于生成内容的数据可能是ajax请求的一部分,您可以直接向这些ajax端点发送请求,并解析来自端点的响应


这通常是JSON格式的,与HTML相比,JSON非常容易解析。

John Resig编写了一个HTML解析器

:


这可以帮你锻炼。

约翰·雷西格编写了一个HTML解析器

:


这可以锻炼你。

你如何确保一些HTML不是直接在Javascript上生成的,而不是使用AJAX???当然可以。但数据必须来自某个地方。寻找源代码,而不是试图解析最终结果。你们可以继续检查www.coursera.com的源代码。你们可能正在寻找的数据集是正确的,数据来自json ajax调用。不过,不要看源代码——看看网站在浏览器的网络面板或调试代理中发出的请求。如何确保某些HTML不是直接在Javascript上生成的,而不是使用AJAX???当然可以。但数据必须来自某个地方。寻找源代码,而不是试图解析最终结果。你们可以继续检查www.coursera.com的源代码。你们可能正在寻找的数据集是正确的,数据来自json ajax调用。但不要查看源代码-查看站点在浏览器的网络面板或调试代理中发出的请求。