使用PHP xPath找到多个html、头和体
我在PHP中使用CURL、DOMDocument、loadHTML、DOMXPath来获取URL的内容。为了验证数据的有效性,我还对检索到的html、head和body标记的数量进行了检查 对于我输入的大多数URL,我的设置工作正常。但是,对于某些URL,报告中的这些标记数量出乎意料。XPath:使用PHP xPath找到多个html、头和体,php,html,curl,xpath,Php,Html,Curl,Xpath,我在PHP中使用CURL、DOMDocument、loadHTML、DOMXPath来获取URL的内容。为了验证数据的有效性,我还对检索到的html、head和body标记的数量进行了检查 对于我输入的大多数URL,我的设置工作正常。但是,对于某些URL,报告中的这些标记数量出乎意料。XPath: $html = $this->runXpath('/html'); $head = $this->runXpath('/html/head'); $body = $this->run
$html = $this->runXpath('/html');
$head = $this->runXpath('/html/head');
$body = $this->runXpath('/html/body');
支票:
if($html->length > 1) {
echo 'Too many html tags';
}
- :2x HTML(是的,我看到了iframe,但它是通过Javascript生成的,哪个CURL不应该呈现?而且,xpath声明html应该是#document的子元素-根据$tag->parentNode->nodeName,这两个html元素都是?第二个html标记也不会出现在CURL请求的“查看源代码”和响应库中)
- :2x HTML?(再次是视频,但在DOM源代码中似乎甚至不是相关的iframe标记)
- :2x BODY?(再次显示iframe,但没有双重html错误,而是双重BODY错误?)