Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/255.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用PHP从网页中提取特定数据_Php_Html_Screen Scraping - Fatal编程技术网

使用PHP从网页中提取特定数据

使用PHP从网页中提取特定数据,php,html,screen-scraping,Php,Html,Screen Scraping,可能重复: 我想知道是否有任何方法可以从网页中获取特定的文本字符串,该字符串使用PHP时不时地更新。我搜索了“整个互联网”,什么也没找到。只是看到preg_match可以做到,但我不知道如何使用它 假设一个网页包含以下内容: <div name="changeable_text">**GET THIS TEXT**</div> **获取此文本** 在使用PHP将页面放入变量之后,我如何使用它呢 提前感谢:)您可能想看看 简单HTML DOM库 这里有一个小教程:

可能重复:

我想知道是否有任何方法可以从网页中获取特定的文本字符串,该字符串使用PHP时不时地更新。我搜索了“整个互联网”,什么也没找到。只是看到preg_match可以做到,但我不知道如何使用它

假设一个网页包含以下内容:

<div name="changeable_text">**GET THIS TEXT**</div>
**获取此文本**
在使用PHP将页面放入变量之后,我如何使用它呢


提前感谢:)

您可能想看看

简单HTML DOM库

这里有一个小教程:

这是一个屏幕抓取API,它允许您向其提供html,然后以类似jQuery的语言获取部分内容。

您可以使用,如下所示:

$html = file_get_contents( $url);

libxml_use_internal_errors( true);
$doc = new DOMDocument;
$doc->loadHTML( $html);
$xpath = new DOMXpath( $doc);

// A name attribute on a <div>???
$node = $xpath->query( '//div[@name="changeable_text"]')->item( 0);

echo $node->textContent; // This will print **GET THIS TEXT**
$html=file\u get\u contents($url);
libxml\u使用\u内部错误(true);
$doc=新文档;
$doc->loadHTML($html);
$xpath=新的DOMXpath($doc);
//在???上的名称属性???
$node=$xpath->query('//div[@name=“changered_text”]')->项(0);
echo$node->textContent;//这将打印**获取此文本**

您所说的:从人类可读的输出中提取数据的行为。在您的情况下,这是
标记之间的任何内容。使用的扩展名访问所需的标记并提取数据。谷歌搜索PHP DOM教程。

忘记div名称。你要找的主题是“屏幕抓取”。更多信息请点击这里
$delements= file_get_html('url will go here'); 

foreach($elements->find('element') as $ele) {

    //traverse according to your preferences

} 

//return or output