Php 通过LinkedIn url获取LinkedIn帖子正文内容

Php 通过LinkedIn url获取LinkedIn帖子正文内容,php,dom,Php,Dom,我想通过linkedin url获取linkedin帖子正文内容,我已经创建了一个脚本,该脚本通过提供linkedin url获取正文内容,但是脚本不知道一些核心linkedin标记,并且内容没有正确加载,只有文本部分显示得很完美。我想得到确切的身体内容,这是在任何linkedin张贴内容显示 下面是我的代码: <?php $html = file_get_contents('LINKEDIN_SINGLE_POST_URL'); $doc = new DOMDocument(); lib

我想通过linkedin url获取linkedin帖子正文内容,我已经创建了一个脚本,该脚本通过提供linkedin url获取正文内容,但是脚本不知道一些核心linkedin标记,并且内容没有正确加载,只有文本部分显示得很完美。我想得到确切的身体内容,这是在任何linkedin张贴内容显示

下面是我的代码:

<?php
$html = file_get_contents('LINKEDIN_SINGLE_POST_URL');
$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($html);
$finder = new DomXPath($doc);
$node = $finder->query("//*[contains(@class, 'article-body')]");
$test = $doc->saveHTML($node->item(0));
if($test[1]=='!') {
    $node = $finder->query("//*[contains(@class, 'article-content__body')]");
    $test = $doc->saveHTML($node->item(0));
    print_r($test);
}
else {
    print_r($test);
}
?>
loadHTML($html);
$finder=newdomxpath($doc);
$node=$finder->query(“/*[contains(@class,'article body')]”);
$test=$doc->saveHTML($node->item(0));
如果($test[1]='!')){
$node=$finder->query(“/*[contains(@class,'article-content\uu body')]”);
$test=$doc->saveHTML($node->item(0));
打印(测试);
}
否则{
打印(测试);
}
?>

您只能从服务器获取HTML,请检查页面的源代码,查看您要查找的内容是否存在。如果没有,可能是由JS添加的。我正在获取文本内容,但是一些html标记无法识别并且无法正确显示,例如,
,提取内容后,此图像不会显示。