Php 检索没有图像的网页
我正在使用PHP为特定站点编写一个web刮板。 我使用file_get_contents函数来检索网页。 某些页面具有图像,并且图像也会随页面一起检索。 就我而言,我不希望图像出现在那里。我只想要文本 我的问题是,是否可以检索没有图像的页面?如果是,怎么做 附加信息:我已经检查了页面的来源。在head标记中定义了base标记,并指向同一urlPhp 检索没有图像的网页,php,Php,我正在使用PHP为特定站点编写一个web刮板。 我使用file_get_contents函数来检索网页。 某些页面具有图像,并且图像也会随页面一起检索。 就我而言,我不希望图像出现在那里。我只想要文本 我的问题是,是否可以检索没有图像的页面?如果是,怎么做 附加信息:我已经检查了页面的来源。在head标记中定义了base标记,并指向同一url 编辑:我只是注意到图像是base64编码的。无法检索未包含图像的页面。检索内容后,您需要对其进行解析/清理 与前面的注释内联,如果您只需要删除图像标记,则
编辑:我只是注意到图像是base64编码的。无法检索未包含图像的页面。检索内容后,您需要对其进行解析/清理 与前面的注释内联,如果您只需要删除图像标记,则几种方法中的一种是这种方式:
$data=file_get_contents();
preg_replace("/<img[^>]+>/i", "(image) ", $content);
echo $content;
file\u get\u内容将仅获取请求URL处的资源。如果该资源是链接到它们的HTML文档,它将不会获取任何图像。它仅从请求的URL获取代码,您可以从浏览器自动加载图像的URL中删除img标记。但从编程的角度来看,HTML页面只是数据。实际上,使用file_get_内容加载页面和所有图像/JS/CSS等$data=file_get_内容会更加困难;然后清理$data,只需不请求图像!不使用语法分析标记regex@gordonm如果他的操作范围太大,移除图像标签,那么使用regex做这个有什么害处呢?谢谢。这正是我所做的。