“针对特定对象”;“n”;带有PHP简单HTML DOM解析器的HTML标记

“针对特定对象”;“n”;带有PHP简单HTML DOM解析器的HTML标记,php,dom,html-parsing,web-scraping,Php,Dom,Html Parsing,Web Scraping,我正在使用PHP Simple HTMLDOM解析器()阅读网站并输出特定信息 我试图输出每个表中的specific,tr,tags的内容,以及specific,p,tags的内容,而不是所有的表和所有的段落 因此,理想情况下,我希望设置一些PHP代码,其中包含引用特定于目标的“nth”、td或p标记的数值参数 作为一名PHP新手,我非常感谢StackOverflow的专业知识。 谢谢你花时间和帮助我解决问题 第一个问题集在这里,代码上方。第二个问题集可以在本文的底部找到,带有PHP代码 第

我正在使用PHP Simple HTMLDOM解析器()阅读网站并输出特定信息

我试图输出每个表中的specific,tr,tags的内容,以及specific,p,tags的内容,而不是所有的表和所有的段落

因此,理想情况下,我希望设置一些PHP代码,其中包含引用特定于目标的“nth”、td或p标记的数值参数


作为一名PHP新手,我非常感谢StackOverflow的专业知识。 谢谢你花时间和帮助我解决问题

第一个问题集在这里,代码上方。第二个问题集可以在本文的底部找到,带有PHP代码


第一个问题集:

A.如何输出每个表的第二和第三个

B.如何在每个表后输出第4段,并排除其中包含的,a,标记

下面是HTML代码

使用

PHP简单HTML DOM解析器,如以下PHP代码所示

除非

你有一个你认为更好的不同建议


下面是示例HTML代码,后面是PHP代码和另一个相关问题集

这是我感兴趣的主要HTML

<a name=“arbitrary_a_tag_Begin_Item_01”></a>
<h2>Item No. 1 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Big blue ball</td>
</tr>

<tr>
<td>Property Location:</td>
<td>Storage Closet</td>
</tr>

<tr>
<td>Owner:</td>
<td>Gym</td>
</tr>

<tr>
<td>Cost</td>
<td>20.00</td>
</tr>

<tr>
<td>Vendor:</td>
<td>Jim’s Gym Toys</td>
</tr>

</tbody>
</table>

<p>
Approximate minimum acceptable grage sale price: $10
<br>
6 month redemption period
</p>

<p>
<img src="../dec/Item01.jpg">
</p>

<p>
<a target="new" href="http://pictures/Item01.jpg”>Picture of Item 01</a>
</p>

<p>
Current status: In Stock
<a name=“arbitrary_a_tag_Begin_Item_02></a>
</p>


<h2>Item No. 2 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Green tennis racket</td>
</tr>

<tr>
<td>Property Location:</td>
<td>Gear Lockers</td>
</tr>

<tr>
<td>Owner:</td>
<td>Tennis Team</td>
</tr>

<tr>
<td>Cost</td>
<td>50.00</td>
</tr>

<tr>
<td>Vendor:</td>
<td>Jim’s Gym Toys</td>
</tr>

</tbody>
</table>

<p>
Approximate minimum acceptable grage sale price: $25
<br>
6 month redemption period
</p>

<p>
<img src="../dec/Item02.jpg">
</p>

<p>
<a target="new" href="http://pictures/Item02.jpg”>Picture of Item 02</a>
</p>

<p>
Current status: In Stock
<a name=“arbitrary_a_tag_Begin_Item_03></a>
</p>


<h2>Item No. 3 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Red Soccer Ball</td>
</tr>
第二个概念:

$file = file_get_contents($url);
preg_match_all('#<p>([^<]*)</p>#Usi', $file, $matches);
foreach ($matches as $match)
{
echo $match;
}
$file=文件获取内容($url);

preg_match_all(“#”([^tl;dr XPath可能更适合您所做的各种事情。感谢Barmar!XPath看起来有点复杂,尽管我会尝试一下。您认为它在哪些方面比PHP简单HTML DOM解析器更实用?(只是好奇,我在PHP方面有点傻,因此我使用的是这个简单易用的webscraper)。此外,我对我文章中列出的具体问题的答案很好奇。while循环一看起来很简单(第二组中的第一个问题),但我无法让它工作。
$e = $html->find('table', 0)->find('tr', 1)->find('td');
foreach($e as $d){
echo $d;
}
$file = file_get_contents($url);
preg_match_all('#<p>([^<]*)</p>#Usi', $file, $matches);
foreach ($matches as $match)
{
echo $match;
}
$i = 1;
while($i<=12){
What goes here??
}
$i++