Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/excel/28.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
php的html文本提取_Php_Text Extraction_Boilerplate_Boilerpipe - Fatal编程技术网

php的html文本提取

php的html文本提取,php,text-extraction,boilerplate,boilerpipe,Php,Text Extraction,Boilerplate,Boilerpipe,有很多HTML文本提取工具。主要用于Java或Python。我最常遇到的是锅炉管。到处都有一些API,有些似乎工作得很好。有人知道PHP中有什么东西可以做到这一点吗 您可以尝试phpQuery: 是一个在PHP中可用的类,如果您有libxml支持,它可以解析HTML文档,并允许您对它们进行迭代或发出查询以查找DOM树中的特定节点。这是理想的方法 或者,如果文本足够简单且统一,则可以使用从数据中提取文本。定义“html文本提取”。你在找吗?不,就像你知道的,在IOS上他们有“阅读器”,它去掉了网站

有很多HTML文本提取工具。主要用于Java或Python。我最常遇到的是锅炉管。到处都有一些API,有些似乎工作得很好。有人知道PHP中有什么东西可以做到这一点吗

您可以尝试phpQuery:

是一个在PHP中可用的类,如果您有libxml支持,它可以解析HTML文档,并允许您对它们进行迭代或发出查询以查找DOM树中的特定节点。这是理想的方法


或者,如果文本足够简单且统一,则可以使用从数据中提取文本。

定义“html文本提取”。你在找吗?不,就像你知道的,在IOS上他们有“阅读器”,它去掉了网站上的所有垃圾,比如添加、导航等,只显示内容,这样更容易阅读?这就是我的意思哦,住在那里很危险。你可能会因为暗示你知道(你知道我在说什么)而被钉死。距离标准链接出现还有多久…?@DaveRandom:)是的,我知道你的意思。我试着用实际的态度对待这类事情,因为有时候它可能也同样有效。