使用PHP从网页中提取特定数据
可能重复:使用PHP从网页中提取特定数据,php,html,screen-scraping,Php,Html,Screen Scraping,可能重复: 我想知道是否有任何方法可以从网页中获取特定的文本字符串,该字符串使用PHP时不时地更新。我搜索了“整个互联网”,什么也没找到。只是看到preg_match可以做到,但我不知道如何使用它 假设一个网页包含以下内容: <div name="changeable_text">**GET THIS TEXT**</div> **获取此文本** 在使用PHP将页面放入变量之后,我如何使用它呢 提前感谢:)您可能想看看 简单HTML DOM库 这里有一个小教程:
我想知道是否有任何方法可以从网页中获取特定的文本字符串,该字符串使用PHP时不时地更新。我搜索了“整个互联网”,什么也没找到。只是看到preg_match可以做到,但我不知道如何使用它 假设一个网页包含以下内容:
<div name="changeable_text">**GET THIS TEXT**</div>
**获取此文本**
在使用PHP将页面放入变量之后,我如何使用它呢
提前感谢:)您可能想看看 简单HTML DOM库 这里有一个小教程: 这是一个屏幕抓取API,它允许您向其提供html,然后以类似jQuery的语言获取部分内容。您可以使用,如下所示:
$html = file_get_contents( $url);
libxml_use_internal_errors( true);
$doc = new DOMDocument;
$doc->loadHTML( $html);
$xpath = new DOMXpath( $doc);
// A name attribute on a <div>???
$node = $xpath->query( '//div[@name="changeable_text"]')->item( 0);
echo $node->textContent; // This will print **GET THIS TEXT**
$html=file\u get\u contents($url);
libxml\u使用\u内部错误(true);
$doc=新文档;
$doc->loadHTML($html);
$xpath=新的DOMXpath($doc);
//在???上的名称属性???
$node=$xpath->query('//div[@name=“changered_text”]')->项(0);
echo$node->textContent;//这将打印**获取此文本**
您所说的:从人类可读的输出中提取数据的行为。在您的情况下,这是
标记之间的任何内容。使用的扩展名访问所需的标记并提取数据。谷歌搜索PHP DOM教程。忘记div名称。你要找的主题是“屏幕抓取”。更多信息请点击这里
$delements= file_get_html('url will go here');
foreach($elements->find('element') as $ele) {
//traverse according to your preferences
}
//return or output