Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/240.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
PHP文本抓取器_Php_File_Text_Get - Fatal编程技术网

PHP文本抓取器

PHP文本抓取器,php,file,text,get,Php,File,Text,Get,我想知道是否有可能从一个网站抓取文本,例如 让我们假设有段落 你好234 所以我想在我的网站上抓取Hello文本 所以即使hello改变了,我还是想抓住它 谢谢。获取文件内容”功能将返回给定url的HTML $text = file_get_contents('http://www.example.com/'); 然后,您可以使用正则表达式或其他字符串操作工具来查找所需的段落 preg_match( '/<p id="blah">(.+)</p>/', $text, $

我想知道是否有可能从一个网站抓取文本,例如

让我们假设有段落

你好234

所以我想在我的网站上抓取Hello文本

所以即使hello改变了,我还是想抓住它


谢谢。

获取文件内容”功能将返回给定url的HTML

$text = file_get_contents('http://www.example.com/');
然后,您可以使用正则表达式或其他字符串操作工具来查找所需的段落

preg_match( '/<p id="blah">(.+)</p>/', $text, $matches );

这取决于您想从源代码中提取什么内容。

您需要一个锚定。例如,一个CSS选择器、一个XPath查询或一些可以让你找到你想要抓取的文本的东西。还有你从Nooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo。。。。。。。。。。。。。他从来没有说过他想解析HTML页面,我也没有建议他这样做……那么p和id之间的额外空格或换行符呢?废话之后还有什么内容?没有报价?单引号?有那么多的案例你没有用正则表达式来解释。即使要从单个字段中提取数据,通常最好使用能够解析HTML的工具,然后您可以轻松地查询它。