Php 从URL列表中提取链接
我试图从文本文件中的一组URL或URL中提取所有链接,并将提取的链接保存到另一个文本文件中。我正在尝试使用下面的脚本,该脚本最初用于提取电子邮件: 我更改了电子邮件摘录部分的内容Php 从URL列表中提取链接,php,curl,web-scraping,hyperlink,scrape,Php,Curl,Web Scraping,Hyperlink,Scrape,我试图从文本文件中的一组URL或URL中提取所有链接,并将提取的链接保存到另一个文本文件中。我正在尝试使用下面的脚本,该脚本最初用于提取电子邮件: 我更改了电子邮件摘录部分的内容 // preg_match_all('/([\w+\.]*\w+@[\w+\.]*\w+[\w+\-\w+]*\.\w+)/is', $sPageContent, $aResults); 要提取如下链接: preg_match_all("/a[\s]+[
// preg_match_all('/([\w+\.]*\w+@[\w+\.]*\w+[\w+\-\w+]*\.\w+)/is', $sPageContent, $aResults);
要提取如下链接:
preg_match_all("/a[\s]+[^>]*?href[\s]?=[\s\"\']+(.*?)[\"\']+.*?>([^<]+|.*?)?<\/a>/is", $sPageContent, $aResults);
preg\u match\u all(“/a[\s]+[^>]*?href[\s]?=[\s\'']+(.*)[\'']+.>([^]*?href[\s]?=[\s\']+(.[^您必须在url处使用trim()。
尝试在代码上添加trim()
foreach($aUrls as $sUrl) {
$sUrl=trim($sUrl); //this
$rPage = $this->getContents($sUrl);
$this->getAndSaveEmails($rPage);
}
你有字符串示例吗?
foreach($aUrls as $sUrl) {
$sUrl=trim($sUrl); //this
$rPage = $this->getContents($sUrl);
$this->getAndSaveEmails($rPage);
}