Php 通过LinkedIn url获取LinkedIn帖子正文内容_Php_Dom

Php 通过LinkedIn url获取LinkedIn帖子正文内容

php dom

Php 通过LinkedIn url获取LinkedIn帖子正文内容,php,dom,Php,Dom,我想通过linkedin url获取linkedin帖子正文内容，我已经创建了一个脚本，该脚本通过提供linkedin url获取正文内容，但是脚本不知道一些核心linkedin标记，并且内容没有正确加载，只有文本部分显示得很完美。我想得到确切的身体内容，这是在任何linkedin张贴内容显示下面是我的代码： <?php $html = file_get_contents('LINKEDIN_SINGLE_POST_URL'); $doc = new DOMDocument(); lib

我想通过linkedin url获取linkedin帖子正文内容，我已经创建了一个脚本，该脚本通过提供linkedin url获取正文内容，但是脚本不知道一些核心linkedin标记，并且内容没有正确加载，只有文本部分显示得很完美。我想得到确切的身体内容，这是在任何linkedin张贴内容显示

下面是我的代码：

<?php
$html = file_get_contents('LINKEDIN_SINGLE_POST_URL');
$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($html);
$finder = new DomXPath($doc);
$node = $finder->query("//*[contains(@class, 'article-body')]");
$test = $doc->saveHTML($node->item(0));
if($test[1]=='!') {
    $node = $finder->query("//*[contains(@class, 'article-content__body')]");
    $test = $doc->saveHTML($node->item(0));
    print_r($test);
}
else {
    print_r($test);
}
?>

loadHTML（$html）；
$finder=newdomxpath（$doc）；
$node=$finder->query（“/*[contains（@class，'article body'）]”）；
$test=$doc->saveHTML（$node->item（0））；
如果（$test[1]='！'））{
$node=$finder->query（“/*[contains（@class，'article-content\uu body'）]”）；
$test=$doc->saveHTML（$node->item（0））；
打印（测试）；
}
否则{
打印（测试）；
}
?>

您只能从服务器获取HTML，请检查页面的源代码，查看您要查找的内容是否存在。如果没有，可能是由JS添加的。我正在获取文本内容，但是一些html标记无法识别并且无法正确显示，例如，

，提取内容后，此图像不会显示。