PHP preg_match_all-正则表达式和特征线
下面是使用regexp的me函数:PHP preg_match_all-正则表达式和特征线,php,regex,curl,Php,Regex,Curl,下面是使用regexp的me函数: preg_match_all('|<span class=\"Menu1\">(.*?)</td>|U',$contents,$wynik2); preg|U match_all(“|(.*?|U)”,$contents,$wynik2); 它与: <tr> <td width="30%" ><span class="Menu"> Nazwa zawdsdu: </td&
preg_match_all('|<span class=\"Menu1\">(.*?)</td>|U',$contents,$wynik2);
preg|U match_all(“|(.*?|U)”,$contents,$wynik2);
它与:
<tr>
<td width="30%" ><span class="Menu"> Nazwa zawdsdu: </td>
<td width="70%"> <span class="Menu1">PRACOWNIK BARU </td>
</tr>
Nazwa zawdsdu:
普拉科尼克·巴鲁
但它不适用于:
<td width="70%"> <span class="Menu1">PRACA W MC DONALDS PRACE PORZĄDKOWE, PRZYJĘCIE DOSTAWY
WYMAGANA KSIĄŻECZKA SANEPIDOWSKA, CHĘCI DO PRACY
KONTAKT TEL. 794295401 </td>
PRACA W MC DONALDS PRACE PORZĄDKOWE,PRZYJĘCIE DOSTAWY
维马加纳·克西埃茨卡·萨内皮托斯卡,切奇·杜普拉西
康塔克电话:794295401
我有空数组。
我认为这是由“新线”引起的。如何修复它?将
s
修饰符添加到正则表达式的末尾。将s
修饰符添加到正则表达式的末尾。对不起,但我觉得有义务给出一个DOMDocument示例:
$d = new DOMDocument;
$d->loadHTML($html);
$xpath = new DOMXPath($d);
foreach ($xpath->query('//span[@class="Menu1"]') as $node) {
echo $node->nodeValue, PHP_EOL;
}
应用于您的刮板(编辑url和帖子字段)
抱歉,但我觉得有必要给出一个DOMDocument示例:
$d = new DOMDocument;
$d->loadHTML($html);
$xpath = new DOMXPath($d);
foreach ($xpath->query('//span[@class="Menu1"]') as $node) {
echo $node->nodeValue, PHP_EOL;
}
应用于您的刮板(编辑url和帖子字段)
只有坏的东西需要修理。然而,这是预期的行为。从阅读正则表达式开始,特别是
(点)字符的含义:。只有坏的东西需要修复。然而,这是预期的行为。从阅读正则表达式开始,特别是
(点)字符的含义:。它可以工作,但我看不到波兰语字母ie.Ę和Ą。HTML来自CURL,我已经这样做了:preg_match_all('@(.*?@si',$contents,$wynik2)@ArturStary如果您使用iso-8859-2,您当然应该更改元标题;你可能有URL吗?我正在取消那个网站,点击“szczegoly”(否则你需要通过POST发送数据才能到达那里)@ArturStary我已经更新了我的答案,现在应该可以了;不需要utf-8标题:)它可以工作,但我看不到波兰语字母ie.Ę和Ą。HTML来自CURL,我已经这样做了:preg_match_all('@(.*?@si',$contents,$wynik2)@ArturStary如果您使用iso-8859-2,您当然应该更改元标题;你可能有URL吗?我正在取消那个网站,点击“szczegoly”(否则你需要通过POST发送数据才能到达那里)@ArturStary我已经更新了我的答案,现在应该可以了;不需要utf-8标头:)