Php 从web摘要中提取段落
我正在使用下面的代码提取特定网页的内容Php 从web摘要中提取段落,php,arrays,dom,Php,Arrays,Dom,我正在使用下面的代码提取特定网页的内容 $html = new DOMDocument(); @$html->loadHtmlFile($url); $xpath = new DOMXPath( $html ); $raws = $xpath->query( '/html/body/div[2]/table/tbody/tr/td/div[1]|//*[@id="content"]'); foreach ($raws as $raw) { echo $
$html = new DOMDocument();
@$html->loadHtmlFile($url);
$xpath = new DOMXPath( $html );
$raws = $xpath->query( '/html/body/div[2]/table/tbody/tr/td/div[1]|//*[@id="content"]');
foreach ($raws as $raw) {
echo $html->saveHtml($raw)."\n"; }
我得到的结果是以下格式:
paragraph of text
<br>
<br>
paragraph of text
<br>
<br>
...
文本段落
段落
...
此外,所有内容都作为单个数据进行了汇总。我现在面临的问题是,我无法将这些粗略的数据分割成若干部分。这个问题有什么解决办法吗?例如,我想显示文本段落,但添加图片,而不是
。有人能告诉我这个问题吗?你想用哪一页?您确定这是一个部分,还是您的
foreach()
循环实际上打印出了一大堆项目,但您没有任何东西显示它们是分开的?foreach循环打印出所有内容(包括段落和)。我想删除foreach循环中的
并从另一个循环中添加图片,而不知道您使用的是什么网页,这很难提供帮助。