Php 用格式化文本解析HTML_Php_Html_Parsing_Domdocument - Fatal编程技术网

Php 用格式化文本解析HTML

php html parsing

Php 用格式化文本解析HTML,php,html,parsing,domdocument,Php,Html,Parsing,Domdocument,我正在用DOMDocument解析一个HTML网页这是我的密码： $doc = new DOMDocument(); $doc->strictErrorChecking = false; $input = file_get_contents($url); //Url passato come parametro $doc->loadHTML( $input ); $xpath = new DOMXpath($doc); $article = $xpath->query('//

我正在用DOMDocument解析一个HTML网页

这是我的密码：

$doc = new DOMDocument();
$doc->strictErrorChecking = false;
$input = file_get_contents($url); //Url passato come parametro
$doc->loadHTML( $input );
$xpath = new DOMXpath($doc);
$article = $xpath->query('//div[@class="entry-container fix"]');

在$article中，所有文本都在“entry container fix”Div中

但网页中的此文本具有格式化文本。简单地扩展示例：

<div> 
   <p> Text <strong> Strong text </strong> </p>
</div>


文本strong文本

在我的代码中，我丢失了所有粗体、意大利语字符和所有段落ecc。。。
有一种方法可以获取所有格式化文本？
为什么不使用saveHTML函数来提取该HTML（以下是链接：）。它看起来像这样：

$sFormated = $doc->saveHTML($article->item(0));

我正在尝试使用它。但它不起作用。你能更好地解释一下如何在我的代码中使用它吗？例如，我尝试过：$doc->saveHTML（$article['output']->nodeValue（0））；但仍然不起作用。

[html]相关文章推荐

将RSS嵌入HTML html rss

HTML iframe，页面不加载在iframe中，而是替换整个网页。 html iframe

Html 如何在href之间留出空间？ html

Html 类及其所有子类的选择器 html css

Html 不显示输入类型的占位符="；日期“；领域 html cordova

音频和视频控制中暂停符号的HTML html unicode

Html ie9 vs chrome ie导致更改标题时出现问题 html css internet-explorer testing

Html 使文本框透明并获得半边框颜色 html css

Html 仅使用CSS的菜单子菜单 html css

Html 边框半径50%渐变色 html css

动态倒计时时钟HTML（开放后5天） html email dynamic time automation

Html 格式错误的多部分POST:数据被截断 html

Html 六边形链接悬停 html css

Html 项目符号大小R列表标记 html r shiny

Html Selenium--尝试访问某些字段 html css python-3.x selenium

Html 它'；是否可以只导出datatable列的一部分值？ html datatables

Html Ajax调用中的Ajax函数（意外标记） html jquery ajax sharepoint

Html 如何使背景图像成为悬停/选择区域css html css

Html 导航项目不显示 html css

Html I'；我无法并排显示div html css

随机文章推荐

在一个没有用户的网站上，cookies是防止人们重复操作的唯一方法吗？ cookies web

Cookies 从Java设置持久cookie不会'；我不在IE工作 cookies

Cookies 跟踪使用cookie花费的页面时间 cookies

Cookies Fancybox仅自动加载一次 cookies

Cookies 使用JavaScript删除PayPal购物车的所有Cookie？ cookies paypal

Cookies 分析Firebug中的HTTP头 cookies

Cookies 在Windows Phone WebBrowser控件中设置cookie cookies windows-phone

abcpdf HttpAdditionalHeaders cookies cookies

Cookies 登录到umbraco 6.1后端系统'；无法继续工作，请不断获取错误并重定向回login.aspx页面 cookies umbraco

Cookies 如何使用Cookie名称查找Cookie路径或基于路径获取Cookie cookies javascript

当你有很多人登录你的网站时，使用Cookies更好吗？ cookies

Cookies nginx服务器未接受客户端请求并给出状态代码324 cookies nginx laravel-4

如何发送相同的cookies？ cookies web-applications

Cookies Puppeter中缺少请求头 cookies

Cookies 还记得我在凤凰卫士中使用的功能吗 cookies elixir

Cookies WKWebView观察Cookie更改 cookies

Cookies 谷歌'；同意'；饼干-是什么？ cookies

Cookies 如何使用lighthouse和登录详细信息的特定cookie？ cookies

Cookies 查找网站中使用的所有Cookie，而不是单个页面 cookies google-chrome-extension

Cookies 高效、安全的cookie身份验证和使用 cookies coldfusion

[php]相关推荐

Php 不推荐使用的函数'；用法
Php

Php 除了点符号还有别的方法吗？
Php Mongodb

Php 如何从对象数组中取消设置元素
Php

PHP将会话变量从数组转换为int
Php Mysql

Php 根据单元格内容（不仅仅是id）有条件地启用或禁用“删除记录”按钮
Php

如果高级方法不可用，生成大量呈现的HTML文件是否是PHP/MYSQL缓存的最佳实践？
Php Database Caching

Php 如何使用jquery设置动态下拉列表的选定值？
Php Jquery Html Drop Down Menu

无法打开WampServer'；s配置文件，请更改index.php文件中的路径
Php

Php 当我请求页面时，如何设置Facebook元标记？
Php Mysql Facebook

Php 通过反馈在2台服务器之间传输文件
Php Ftp

数据库驱动的导航PHP&；MySQL
Php Mysql Navigation

Php CodeIgniter将多维数组作为单独的行插入到数据库表中
Php Mysql Codeigniter

Php 如何使用您的用户名创建动态url？
Php .htaccess

PHP表单没有'；不要将数据发送到数据库
Php Mysql Wordpress Forms Twitter Bootstrap

通过php检索Web邮件以在网站上使用
Php User Interface

Php 工作流-数据库设计
Php Mysql Cakephp Database Design

Php mysql_fetch_array（）希望参数1是给定的资源布尔值。有什么想法吗？
Php Mysql

Php 如何在Virtuemart中获取所有类别和子类别名称
Php Html Mysql

Php 来自论坛输入元素的数组值
Php Arrays Forms

Php CodeIgniter项目在SonarQube有8000多个问题
Php Codeigniter Sonarqube

Php 从git克隆Yii项目
Php Git Yii

如何通过php从数据库中获取最后一条记录
Php Mysql

PHP-更改'；1'；生成日期（'；N'；）；至'；星期一；？
Php Date

如何从Phalcon php数据库检索数据
Php Mysql

Php 如何使按钮刷新文本区域而不是页面你好
Php Button

Php 如何将不同表中3个字段的值显示到一列中？
Php Sql

Php 将字符串数组添加到逗号分隔的单词
Php Arrays

php simplexml_加载_字符串无法处理XML字符串
Php Xml

PHP：返回日期范围的日期时间开始和日期时间结束
Php Datetime

Php 显示在WordPress中单击的类别层次结构，带有图像和描述
Php Wordpress

Tags

Windows Installer Flask Python Sql Server 2005 Jquery Plugins Url Log4net Sharepoint Grails Activemq Gridview Bootstrap 4 Elixir Apache EmptyTag Bison Javascript Tree Go Web Applications Atom Editor Ldap Redis Deep Learning Reference Ios7 Synchronization Kubernetes Gstreamer Glsl Programming Languages Winforms Stata Asp.net Mvc 4 Vim Automation Html5 Canvas Computer Science Stripe Payments Internationalization Object Jira Streaming Ftp Variables Shopify Docusignapi Responsive Design Google Apps Script Jmeter Kentico Listview Gps Android Powershell Prestashop Spring Mvc Hazelcast File Upload Stm32 Fortran Twitter Bootstrap 3 Parameters Colors Workflow Charts Here Api Hibernate Weblogic Sas Jvm Markdown Hive Asterisk Apache2 Import Puppet Report Sencha Touch 2 Bluetooth Iframe Version Control Blockchain Google Maps Api 3 Zurb Foundation Javafx Git Powerbi Keras Dojo Types Google Colaboratory Octave Jetty Web Crawler Google Chrome Xslt Boost Android Emulator Kernel Orm Mediawiki Notepad++ Three.js Machine Learning Sqlite Statistics Interface Unicode Tabs Ravendb Rxjs Mdx Blazor Plot Air Xquery Active Directory Firefox Gitlab Oop Highcharts Winapi Command Line Email Orchardcms Tkinter Oracle10g Windows Services Reflection Yii2 Com Maven 2 Ios6 Joomla Openerp Map Yii Ajax Functional Programming Google App Maker Json Wolfram Mathematica Ms Word Ruby On Rails Opencl Parallel Processing Sails.js Notifications Io Forms Identityserver4 Perforce Doctrine Orm Playframework Lambda Crystal Reports Binding Docker Exception Nativescript For Loop C++ Certificate Content Management System Resharper Layout Drop Down Menu Generics Cucumber Websphere Stanford Nlp Jestjs Sed Scrapy Serialization Salesforce Raspberry Pi Google Bigquery Karate Spring Integration Dialogflow Es Wicket Sms Apache Flink Apache Spark Https Swiftui Jboss Llvm Typescript Xaml Reactjs Sql Google Visualization Marklogic Dynamic Server Netsuite Tcp Ssl

Copyright © 2024. All Rights Reserved by - Fatal编程技术网