Php 从远程页面HTML获取数据<;a>;标签

Php 从远程页面HTML获取数据<;a>;标签,php,html,regex,dom,Php,Html,Regex,Dom,你好,我有一个小问题,我需要尽快解决 我是xbmc/kodi平台插件的所有者,我编写了一个php后端来帮助我查找和添加内容,但是我在从我使用的一个站点获取数据时遇到了问题 在这个网站上有一个来自这个链接的链接,我需要从title属性获取href和一些文本 我可以抓取页面上的所有链接,然后扔掉它们,得到我想要的链接,然后我可以得到herf属性,但我的问题是得到title属性,并从中得到我需要的文本 链接的html代码如下所示 <a title="Stream AMC- waliing

你好,我有一个小问题,我需要尽快解决

我是xbmc/kodi平台插件的所有者,我编写了一个php后端来帮助我查找和添加内容,但是我在从我使用的一个站点获取数据时遇到了问题

在这个网站上有一个来自这个链接的链接,我需要从title属性获取href和一些文本

我可以抓取页面上的所有链接,然后扔掉它们,得到我想要的链接,然后我可以得到herf属性,但我的问题是得到title属性,并从中得到我需要的文本

链接的html代码如下所示

    <a title="Stream AMC- waliing dead Episode 12 No Ads and easy on - EasyPlayer" target="_blank" rel="nofollow" href="example.com/watch.php?id=64">EasyPlayer!</a>
我需要output of$anime\u url作为herf属性

我需要$title的输出作为title属性的文本


多亏有人能帮忙,我自己解决了这个问题

通过查看视频流的标题,我甚至抓住了tho dynamic,我注意到有两个词中的一个会一直出现

无和|集

然后,我简单地使用一个分解函数在eather单词处拆分字符串,然后使用replace函数删除剩余的单词(stream)

运行完整的东西抛出了一个安全函数来删除所有html标记和特殊字符


现在它工作得很好:)

我建议所有的锚都使用http://或https://来避免任何问题。并非所有设备都理解没有指定协议的url。您如何知道您需要标题的哪一部分?如果您可以定义一个模式,那么为此编译一些正则表达式可能会更容易。哪些部分总是出现,哪些部分是动态的?您好,谢谢您的评论,我在完成一些工作后自己完成了:)
    if ($_SERVER['REQUEST_METHOD'] === 'POST') {

    $url = $_POST['url'];
   $fanart = "http://feelgrafix.com/data_images/out/1/736215-anime-wallpaper.jpg";
   $anime_thumbnail = "http://www.apkdad.com/wp-content/uploads/2013/01/Anime-Wallpapers-HD-Icon.png";
   $plot = "Anime System by MetaBox HD IPTV";

   $input = @file_get_contents($url) or die("Could not access file: $url");

  $dom = new DOMDocument;
  @$dom->loadHTML($input);

  foreach($dom->getElementsByTagName('a') as $node) {

  if(strpos($node->getAttribute('title'),'- EasyMode') !== false) {

  $expires = preg_split('/Episode|episode/',$node->getAttribute('title'));
   array_shift($expires);

  $stream_url = $node->getAttribute('href');
  $title_edit = str_replace(" Anime Series", "", $node->getAttribute('title'));
   $title = str_replace("Watch ", "", $title_edit);

   }
   print_r($expires);
  }
 }