使用DOMDocument在PHP中删除特定的标记属性

使用DOMDocument在PHP中删除特定的标记属性,php,web-scraping,domdocument,Php,Web Scraping,Domdocument,我正试图根据“属性”从“meta”标记中提取内容。像 ` 。。。 ` 所以我只想得到那些有“og”的内容。 通过一个cURL请求,我已经能够获得属性 $ch = curl("http://9gag.com/gag/aGVqbvz?ref=fsidebar"); $dom = new DOMDocument(); @$dom->loadHTML($ch); //echo $ch; $links = $dom->getElementsByTagName('meta'); //get

我正试图根据“属性”从“meta”标记中提取内容。像 `


。。。 ` 所以我只想得到那些有“og”的内容。 通过一个cURL请求,我已经能够获得属性

$ch = curl("http://9gag.com/gag/aGVqbvz?ref=fsidebar");
$dom = new DOMDocument();
@$dom->loadHTML($ch);

//echo $ch;
$links = $dom->getElementsByTagName('meta');
//get no of tags or elements
echo $links->length;
echo '<pre>';
foreach ($links as $link) {
    echo $link->getAttribute("property");
    echo '<br>';
}
$ch=curl(“http://9gag.com/gag/aGVqbvz?ref=fsidebar");
$dom=新的DOMDocument();
@$dom->loadHTML($ch);
//echo$ch;
$links=$dom->getElementsByTagName('meta');
//不获取任何标记或元素
echo$links->length;
回声';
foreach($links作为$link){
echo$link->getAttribute(“属性”);
回声“
”; }
如何获取特定于特定属性或名称的内容

我是你的朋友。类似于
//meta[以(@property,“og”)开头]/@content
的表达式将获取所有元元素的内容属性,这些元元素的属性值以“og”开头

例子: 输出:
你能解释一下foreach行吗……)
$ch = curl("http://9gag.com/gag/aGVqbvz?ref=fsidebar");
$dom = new DOMDocument();
@$dom->loadHTML($ch);

//echo $ch;
$links = $dom->getElementsByTagName('meta');
//get no of tags or elements
echo $links->length;
echo '<pre>';
foreach ($links as $link) {
    echo $link->getAttribute("property");
    echo '<br>';
}
$xpath = new DOMXPath($dom);
$query = '//meta[starts-with(@property, "og")]/@content';
foreach ($xpath->query($query) as $node) {
    echo $node->value, "\n";
}
I finished the manga last week, so I wanted to make my on "What Naruto taught me"
9GAG
http://9gag.com/gag/aGVqbvz