Php 如何从维基百科页面上抓取第一段？_Php_Dom_Xpath_Web Crawler

Php 如何从维基百科页面上抓取第一段？

php dom xpath web-crawler

Php 如何从维基百科页面上抓取第一段？,php,dom,xpath,web-crawler,Php,Dom,Xpath,Web Crawler,假设我想抓住第一段。如何使用XPath或DOM&PHP或类似的方法在标题和内容框之间获取主要文本有php库吗？我不想使用api，因为它有点复杂注意：我只需要在我的页面下添加一个小部件，显示来自Wikipedia的相关信息。使用以下XPath表达式：这里前缀h:绑定到XHTML名称空间http://www.w3.org/1999/xhtml. 此转换表明真正产生了想要的结果：在维基百科文章的XHTML文档上运行时，还需要定义两个实体和®；对于此文档，将生成所需的结果。您可能需要查看w

假设我想抓住第一段。如何使用XPath或DOM&PHP或类似的方法在标题和内容框之间获取主要文本

有php库吗？我不想使用api，因为它有点复杂

注意：我只需要在我的页面下添加一个小部件，显示来自Wikipedia的相关信息。

使用以下XPath表达式：

这里前缀h:绑定到XHTML名称空间http://www.w3.org/1999/xhtml.

此转换表明真正产生了想要的结果：

在维基百科文章的XHTML文档上运行时，还需要定义两个实体和®；对于此文档，将生成所需的结果。

您可能需要查看wikimedia API

/*/h:body//h:h1
  |
   /*/h:body//h:h1/following::node()
      [count(. | //h:table[@id='toc']
                  /preceding::node()
             )
      =
       count(//h:table[@id='toc']
                  /preceding::node()
             )
       ]

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:h="http://www.w3.org/1999/xhtml"
 >
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
  <xsl:copy-of select=
  "/*/h:body//h:h1
  |
   /*/h:body//h:h1/following::node()
      [count(. | //h:table[@id='toc']
                  /preceding::node()
             )
      =
       count(//h:table[@id='toc']
                  /preceding::node()
             )
       ]
  "/>
 </xsl:template>
</xsl:stylesheet>