Php 简单HTMLDOM解析器&；Web浏览器返回不同的HTML_Php_Mysql_Screen Scraping_Web Scraping_Simple Html Dom - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/mysql/57.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 简单HTMLDOM解析器&；Web浏览器返回不同的HTML_Php_Mysql_Screen Scraping_Web Scraping_Simple Html Dom - Fatal编程技术网

Php 简单HTMLDOM解析器&；Web浏览器返回不同的HTML

php mysql web-scraping

Php 简单HTMLDOM解析器&；Web浏览器返回不同的HTML,php,mysql,screen-scraping,web-scraping,simple-html-dom,Php,Mysql,Screen Scraping,Web Scraping,Simple Html Dom,我正在使用解析网页问题：然而，废弃的HTML内容似乎与我使用web浏览器时得到的内容不同。是什么导致了这种差异？如何使用简单的HTML Dom获得与web浏览器显示的内容相同的内容 PHP public function action_asos() { include_once('/home/mysite/public_html/application/libraries/simple_html_dom.php'); $category_url = 'http://www.

我正在使用解析网页

问题：然而，废弃的HTML内容似乎与我使用web浏览器时得到的内容不同。是什么导致了这种差异？如何使用简单的HTML Dom获得与web浏览器显示的内容相同的内容

PHP

public function action_asos() {

    include_once('/home/mysite/public_html/application/libraries/simple_html_dom.php');

    $category_url = 'http://www.asos.com/Men/T-Shirts-Vests/Cat/pgecategory.aspx?cid=7616#parentID=-1&pge=0&pgeSize=100&sort=1';

    $html = file_get_html($category_url);

    foreach($html->find('html') as $content) {
        echo $content;
    }

}

实际页面：

http://www.asos.com/Men/T-Shirts-Vests/Cat/pgecategory.aspx?cid=7616#parentID=-1&pge=0&pgeSize=100&sort=1

使用简单HTML DOM检索

您需要提供一个用户代理。无论出于何种原因，缺少用户代理都会导致服务器阻塞。
您检索的内容有什么不同？由于用户代理的不同，您可能会得到不同的HTML。此外，URL中的“#”不应该替换为“&”吗？这看起来不应该是一个片段。添加了使用PHP检索的HTML的屏幕截图。我不知道为什么URL中有一个
#
，可能是Javascript路由器在使用它。转储它，在服务器端进行呼叫时它是无用的。我尝试了没有
#
的URL，仍然在浏览器上加载我想要的内容，但PHP检索的HTML与以前一样：（嗅探服务器上实际发送的HTTP请求）。

[mysql]相关文章推荐

随机文章推荐

Automation 办公自动化 automation c#-4.0 ms-office

Automation 7zip和#x27之间有什么区别；s7z.sfx和7zsd.sfx？ automation

Automation 使用ImageMagick将PSD转换为各种Android密度图像 automation imagemagick

Automation JavaEdit.Set中的未指定错误 automation

Automation 如何使用phpMyAdmin自动导出mySQL数据库 automation phpmyadmin

Automation 如何在编码UI测试中刷新回放？ automation

Automation Vim函数计算ruby类定义，其中模块来自文件名？ automation vim

Automation 自动热键：检查由其文本标识的控件的可见性 automation autohotkey

Automation API自动化测试：有没有办法通过内容验证自动化下载场景？ automation karate

Automation image.expected命令在哪里搜索图像？ automation

Automation 针对偶数任务的Deepsecurity API调用 automation

Automation 如何实现BIng地图数据上传的自动化？ automation maps

[php]相关推荐

Php 使用数据库统计和显示条目
Php Mysql Sql For Loop

Php 时间（仅限日期）比较
Php Datetime

Php 如何优化该算法
Php Algorithm

一口气刷新Wordpress PHP文件
Php Wordpress Gulp

PHP/WordPress——在绑定时添加_操作调用的绑定参数
Php Wordpress

Php 如何在列表中查找单词并删除（删除）字符？
Php Arrays String

Php Zend Framework 1-在模块外部动态加载模型
Php Zend Framework

在codeigniter框架中使用php编写YAML文件
Php Codeigniter Yaml

获取有关PHPUnit测试失败的更多上下文
Php Phpunit Automated Tests

Php Yii中的renderPartial（）函数是什么？
Php Yii

Php 如何在控制器中获取所有公共函数方法？
Php

致命错误：在第60行的/library/Cube/Config/Xml.php中调用未定义的函数Cube\Config\simplexml\u load\u file（）
Php Xml Apache

Php 类别'；Mews\Purizer\PurizerService Provider'；找不到
Php Laravel 4 Composer Php

Php 从对象数组中获取特定数据
Php Arrays Object

如何使用php避免数据库上的重复？
Php Sql

Php 运行脚本以修改nginx服务器配置的最佳方法
Php Linux Security Nginx

&引用；注意：未定义变量"&引用；注意：未定义索引"；，及；注意：未定义的偏移量；使用PHP
Php Arrays Variables

Php 使用DynamoDB和MySQL进行地理空间查询
Php Mysql Amazon Web Services Amazon Dynamodb

Php 字段为空时返回所有结果
Php Mysql Search

Php “如何扩展mysqli”；或；sqlite取决于构造函数
Php Mysql Sqlite Class

Php 我已经在学生名单和个人资料之间建立了链接
Php

如何为docx-php将数组转换为xml
Php Xml Parsing

Php Magento 2.1与商店一起丢失
Php Magento Content Management System Magento2

Php 基于两个标准（MySQL+；模式+；数学）展示产品的最佳方式是什么
Php Mysql E Commerce

Php 尝试为健身房网站创建时间表
Php Html

Php 更新wordpress子主题而不删除以前的版本
Php Wordpress

Php 预取准备猎犬问题
Php Jquery Ajax

Php Laravel 5.4中的符号链接是使用artisan命令创建的。它在本地主机上工作，但在实时服务器上不工作
Php Laravel

Php “如何排除故障”；拒绝用户访问''@'；本地主机'；（使用密码：否）"；
Php Mysql

Php API语音库和上传音频
Php Jquery Ajax Curl Speech Recognition

Tags

Generics Frameworks Netsuite Sed Concurrency Aem Twilio Bootstrap 4 Azure Active Directory Eclipse Plugin Scripting Apache Kafka Doxygen Amazon Ec2 Angular Material Charts Codenameone Gwt Websocket Programming Languages Mapreduce Cakephp Spring Integration Domain Driven Design Chef Infra Memory Management Elm Serialization Ecmascript 6 Indexing Youtube Api Clojure Azure Functions Visual Studio 2010 Configuration Codeigniter Aframe Deployment Html Qt4 Symfony1 Playframework Ios6 Yii2 Ide Javafx Wpf Networking Chart.js C++11 Eclipse Rcp Vb.net Nestjs Push Notification Odoo Phpunit Powershell Uml Sqlalchemy Ethereum Binding Vagrant Adobe Wolfram Mathematica Syntax Requirejs Sugarcrm Google Chrome Windows Phone 8.1 Synchronization Docker Compose Kernel Glsl Sql Open Source Python 2.7 Web Crawler Nsis Assembly Android Studio Flutter Time Ruby On Rails 3.1 Ssh Twitter Bootstrap 3 Coq Dotnetnuke Database Pyspark Ibm Midrange Coding Style Google Cloud Platform Visual Studio 2015 Shopify Image Processing Zurb Foundation Compilation Spring Security Orm Migration Java Me Input Gtk Camera Url Rewriting Zsh Postgresql Ssl Azure Sql Database Image Android Emulator Download Linkedin Ruby Firebase Sonarqube Cmake Mapping Kotlin Security Xml Uitableview Sharepoint 2007 Sequelize.js Tridion Android Layout Excel Formula Pycharm Hyperledger Fabric Flash Bazel Dart Jasmine Jpa Xslt Salesforce Windows Runtime Maven .net Core Spring Boot Dns Algorithm Typo3 Asp.net Mvc 5 Vba Sockets Listview Http Graph Laravel 5 Variables Certificate Amazon Redshift Drupal 7 Compiler Construction Python 3.x Openlayers 3 Process Leaflet Mips Phantomjs Apache Flink Doctrine Orm Gulp Audio Path Java Sphinx Sbt Calendar Tfs Vb6 Timer Grid Ip Nginx Post Ruby On Rails 3 Awk Combobox Sails.js Reflection Gruntjs Sparql Angular Vbscript Razor Udp Drupal Javascript Join Jar Snowflake Cloud Data Platform Stm32 Crystal Reports E Commerce Maps Gps Solr Parsing Azure

Copyright © 2024. All Rights Reserved by - Fatal编程技术网