“针对特定对象”；“n”；带有PHP简单HTML DOM解析器的HTML标记_Php_Dom_Html Parsing_Web Scraping

“针对特定对象”；“n”；带有PHP简单HTML DOM解析器的HTML标记

php dom web-scraping

“针对特定对象”；“n”；带有PHP简单HTML DOM解析器的HTML标记,php,dom,html-parsing,web-scraping,Php,Dom,Html Parsing,Web Scraping,我正在使用PHP Simple HTMLDOM解析器（）阅读网站并输出特定信息我试图输出每个表中的specific，tr，tags的内容，以及specific，p，tags的内容，而不是所有的表和所有的段落因此，理想情况下，我希望设置一些PHP代码，其中包含引用特定于目标的“nth”、td或p标记的数值参数作为一名PHP新手，我非常感谢StackOverflow的专业知识。谢谢你花时间和帮助我解决问题第一个问题集在这里，代码上方。第二个问题集可以在本文的底部找到，带有PHP代码第

我正在使用PHP Simple HTMLDOM解析器（）阅读网站并输出特定信息

我试图输出每个表中的specific，tr，tags的内容，以及specific，p，tags的内容，而不是所有的表和所有的段落

因此，理想情况下，我希望设置一些PHP代码，其中包含引用特定于目标的“nth”、td或p标记的数值参数

作为一名PHP新手，我非常感谢StackOverflow的专业知识。谢谢你花时间和帮助我解决问题

第一个问题集在这里，代码上方。第二个问题集可以在本文的底部找到，带有PHP代码

第一个问题集：

A.如何输出每个表的第二和第三个

及

B.如何在每个表后输出第4段，并排除其中包含的，a，标记

在

下面是HTML代码

使用

PHP简单HTML DOM解析器，如以下PHP代码所示

除非

你有一个你认为更好的不同建议

下面是示例HTML代码，后面是PHP代码和另一个相关问题集

这是我感兴趣的主要HTML

<a name=“arbitrary_a_tag_Begin_Item_01”></a>
<h2>Item No. 1 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Big blue ball</td>
</tr>

<tr>
<td>Property Location:</td>
<td>Storage Closet</td>
</tr>

<tr>
<td>Owner:</td>
<td>Gym</td>
</tr>

<tr>
<td>Cost</td>
<td>20.00</td>
</tr>

<tr>
<td>Vendor:</td>
<td>Jim’s Gym Toys</td>
</tr>

</tbody>
</table>

<p>
Approximate minimum acceptable grage sale price: $10
<br>
6 month redemption period
</p>

<p>
<img src="../dec/Item01.jpg">
</p>

<p>
<a target="new" href="http://pictures/Item01.jpg”>Picture of Item 01</a>
</p>

<p>
Current status: In Stock
<a name=“arbitrary_a_tag_Begin_Item_02></a>
</p>


<h2>Item No. 2 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Green tennis racket</td>
</tr>

<tr>
<td>Property Location:</td>
<td>Gear Lockers</td>
</tr>

<tr>
<td>Owner:</td>
<td>Tennis Team</td>
</tr>

<tr>
<td>Cost</td>
<td>50.00</td>
</tr>

<tr>
<td>Vendor:</td>
<td>Jim’s Gym Toys</td>
</tr>

</tbody>
</table>

<p>
Approximate minimum acceptable grage sale price: $25
<br>
6 month redemption period
</p>

<p>
<img src="../dec/Item02.jpg">
</p>

<p>
<a target="new" href="http://pictures/Item02.jpg”>Picture of Item 02</a>
</p>

<p>
Current status: In Stock
<a name=“arbitrary_a_tag_Begin_Item_03></a>
</p>


<h2>Item No. 3 </h2>

<table>

<tbody>

<tr>
<td>Item Description:</td>
<td>Red Soccer Ball</td>
</tr>

第二个概念：

$file = file_get_contents($url);
preg_match_all('#<p>([^<]*)</p>#Usi', $file, $matches);
foreach ($matches as $match)
{
echo $match;
}

$file=文件获取内容（$url）；
preg_match_all（“#”（[^tl；dr XPath可能更适合您所做的各种事情。感谢Barmar！XPath看起来有点复杂，尽管我会尝试一下。您认为它在哪些方面比PHP简单HTML DOM解析器更实用？（只是好奇，我在PHP方面有点傻，因此我使用的是这个简单易用的webscraper）。此外，我对我文章中列出的具体问题的答案很好奇。while循环一看起来很简单（第二组中的第一个问题），但我无法让它工作。
$e = $html->find('table', 0)->find('tr', 1)->find('td');
foreach($e as $d){
echo $d;
}

$file = file_get_contents($url);
preg_match_all('#<p>([^<]*)</p>#Usi', $file, $matches);
foreach ($matches as $match)
{
echo $match;
}

$i = 1;
while($i<=12){
What goes here??
}
$i++