Php 目标事件

Php 目标事件,php,arrays,string,count,Php,Arrays,String,Count,我有一个简单的非关联数组,有几千个值。 值是由1-10个单词组成的字符串 我需要找到数组中“命中率”最多的3-4个连续单词字符串 这是字母数字,不区分大小写 打击可能是: 字符串的任何一个单词都出现在数组的一个项中。 数组中的一个项中出现任意一组多个连续单词 举个例子: $database = array( 0 => 'the dogs whisperer', 1 => 'I am a whisperer', 2 => 'dogs are often hairy',

我有一个简单的非关联数组,有几千个值。
值是由1-10个单词组成的字符串

我需要找到数组中“命中率”最多的3-4个连续单词字符串

这是字母数字,不区分大小写

打击可能是:

字符串的任何一个单词都出现在数组的一个项中。 数组中的一个项中出现任意一组多个连续单词

举个例子:

$database = array(
  0 => 'the dogs whisperer',
  1 => 'I am a whisperer',
  2 => 'dogs are often hairy',
  3 => 'dogs',
  4 => 'are you a dogs whisperer'
  5 => 'dogs can be manipulated by a whisperer');
三个单词的字符串“狗语者”将获得以下点击率:

“狗语者”中的“狗语者”

“狗语者”中的“狗语者”

《狗语者》中的“狗”

《狗语者》中的

《狗语者》中的“狗”

“狗语者”中的“语者”

“我是一个耳语者”中的“耳语者”

“狗常有毛”中的“狗”

“狗”中的“狗”

“你是狗语者吗”中的“狗语者”

“你是狗语者吗”中的“狗”

“你是狗语者”中的“耳语者”

“狗可以被耳语者操纵”中的“狗”

“狗可以被耳语者操纵”中的“耳语者”

为了让多单词字符串获得成功,单词必须是连续的。例如,“狗语者”不是成功的“狗语者可以操纵狗语者”

语言也必须井然有序。i、 e“狗语者”在“狗语者”的价值观上并不流行


我很好地掌握了不同的数组函数,只是不能把它们全部放在一起。我尝试过通过按单词分解和重新组合,然后使用strpos来提取所有可能的字符串集==FALSE以查找命中率。我最终得到的是一个巨大的矩阵,我无法从中获得所需的输出。

我希望这就是您想要的。我相信你可以优化很多,但我认为这将为你指明正确的方向

嗯,安迪

<?php
  $database = array(
  0 => 'the dogs whisperer',
  1 => 'I am a whisperer',
  2 => 'dogs are often hairy',
  3 => 'dogs',
  4 => 'are you a dogs whisperer',
  5 => 'dogs can be manipulated by a whisperer');

  function CreateSubsets($sstr)
  {
    $subsets = array();

    $tokens = explode(" ", $sstr);
    $count = count($tokens);

    for ($i = $count; $i > 0; $i--) 
    {
      for ($j = 0; $j + $i <= $count; $j++)
      {
        $subsets[] = implode(" ", array_slice($tokens, $j, $i));
      }      
    } 

    return $subsets;   
  }

  function SearchOccurrences($database, $subsets)
  {
    $resultAry = array();

    for ($subIdx = 0; $subIdx < count($subsets); $subIdx++) 
    {
      $occurrences = array();
      for ($idx = 0; $idx < count($database); $idx++) 
      {
        $dbval = $database[$idx];

        $pos = strpos($dbval, $subsets[$subIdx]);
        if ($pos !== false)
          $occurrences[] = $idx;

      }
      $resultAry[$subIdx] = $occurrences;   
    }

    return $resultAry;
  }

  header("Content-type: text/plain");

  print "Database:\n";
  print_r($database); 
  print "\n"; 

  $sstr = "the dogs whisperer";
  $subsets = CreateSubsets($sstr);  

  print "Subsets:\n";
  print_r($subsets);
  print "\n"; 

  $results = SearchOccurrences($database, $subsets);

  print "Results:\n";
  print_r($results);    
  print "\n"; 

  for ($i = 0; $i < count($subsets); $i++) 
  {
    print "'$subsets[$i]' was found in:\n";
    foreach ($results[$i] as &$resVal) 
    {
      print "  --> $database[$resVal]\n";      
    } 
    print "\n"; 
  }
?>

非常感谢您的帮助:)