Php 从URL列表中提取链接

Php 从URL列表中提取链接,php,curl,web-scraping,hyperlink,scrape,Php,Curl,Web Scraping,Hyperlink,Scrape,我试图从文本文件中的一组URL或URL中提取所有链接,并将提取的链接保存到另一个文本文件中。我正在尝试使用下面的脚本,该脚本最初用于提取电子邮件: 我更改了电子邮件摘录部分的内容 // preg_match_all('/([\w+\.]*\w+@[\w+\.]*\w+[\w+\-\w+]*\.\w+)/is', $sPageContent, $aResults); 要提取如下链接: preg_match_all("/a[\s]+[

我试图从文本文件中的一组URL或URL中提取所有链接,并将提取的链接保存到另一个文本文件中。我正在尝试使用下面的脚本,该脚本最初用于提取电子邮件:

我更改了电子邮件摘录部分的内容

          // preg_match_all('/([\w+\.]*\w+@[\w+\.]*\w+[\w+\-\w+]*\.\w+)/is', $sPageContent, $aResults);
      
要提取如下链接:

          preg_match_all("/a[\s]+[^>]*?href[\s]?=[\s\"\']+(.*?)[\"\']+.*?>([^<]+|.*?)?<\/a>/is", $sPageContent, $aResults);

preg\u match\u all(“/a[\s]+[^>]*?href[\s]?=[\s\'']+(.*)[\'']+.>([^]*?href[\s]?=[\s\']+(.[^您必须在url处使用trim()
尝试在代码上添加trim()

     foreach($aUrls as $sUrl) {

         $sUrl=trim($sUrl); //this

         $rPage = $this->getContents($sUrl);
         $this->getAndSaveEmails($rPage);
     }

你有字符串示例吗?
     foreach($aUrls as $sUrl) {

         $sUrl=trim($sUrl); //this

         $rPage = $this->getContents($sUrl);
         $this->getAndSaveEmails($rPage);
     }