Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/arrays/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 我应该使用什么数组函数来创建索引?_Php_Arrays_Indexing - Fatal编程技术网

Php 我应该使用什么数组函数来创建索引?

Php 我应该使用什么数组函数来创建索引?,php,arrays,indexing,Php,Arrays,Indexing,大家好,我正在尝试为我的爬虫解析的html页面上的所有单词创建索引。 此时,我已成功地将html页面分解为一个单词数组,并过滤掉了所有的停止词 在这个阶段,我有几个问题 解析的html页面中的单词数组中有重复的单词,我喜欢这样,因为我仍然需要记录一个单词在页面中出现的次数 数组如下所示 $wordsFromHTML = array (size=119) 0 => string 'web' (length=3) 1 => string 'giants'

大家好,我正在尝试为我的爬虫解析的html页面上的所有单词创建索引。 此时,我已成功地将html页面分解为一个单词数组,并过滤掉了所有的停止词

在这个阶段,我有几个问题

解析的html页面中的单词数组中有重复的单词,我喜欢这样,因为我仍然需要记录一个单词在页面中出现的次数

数组如下所示

$wordsFromHTML =    
array (size=119)
      0 => string 'web' (length=3)
      1 => string 'giants' (length=6)
      2 => string 'vryheid' (length=7)
      3 => string 'news' (length=4)
      4 => string 'access' (length=6)
      5 => string 'mails' (length=5)
      6 => string 'mobile' (length=6)
      7 => string 'february' (length=8)
      8 => string 'access' (length=6)
      9 => string 'mails' (length=5)
     10 => string 'web' (length=3)
     11 => string 'february' (length=8)
     12 => string 'access' (length=6)
     13 => string 'mails' (length=5)
     14 => string 'desktop' (length=7)
     15 => string 'february' (length=8)
     16 => string 'hosting' (length=7)
     17 => string 'web' (length=3)
     18 => string 'giants' (length=6)
     19 => string 'vryheid' (length=7)
     20 => string 'february' (length=8)
     22 => string 'us' (length=2)
$indexArray = array('web'=>array('url'=>array(0,10,17)))
现在我想将所有单词从$wordsFromHTML保存到$indesArray,这是我的最终索引

应该是这样的

$wordsFromHTML =    
array (size=119)
      0 => string 'web' (length=3)
      1 => string 'giants' (length=6)
      2 => string 'vryheid' (length=7)
      3 => string 'news' (length=4)
      4 => string 'access' (length=6)
      5 => string 'mails' (length=5)
      6 => string 'mobile' (length=6)
      7 => string 'february' (length=8)
      8 => string 'access' (length=6)
      9 => string 'mails' (length=5)
     10 => string 'web' (length=3)
     11 => string 'february' (length=8)
     12 => string 'access' (length=6)
     13 => string 'mails' (length=5)
     14 => string 'desktop' (length=7)
     15 => string 'february' (length=8)
     16 => string 'hosting' (length=7)
     17 => string 'web' (length=3)
     18 => string 'giants' (length=6)
     19 => string 'vryheid' (length=7)
     20 => string 'february' (length=8)
     22 => string 'us' (length=2)
$indexArray = array('web'=>array('url'=>array(0,10,17)))
问题在于,对于从最终索引数组中的$wordsFromHTML数组中重复出现的每个单词,如何不断增加$wordsFromHTML键的位置

索引数组应该只有唯一的单词,如果另一个已经存在的单词试图进入,我们将使用已经存在的具有相同URL的单词并增加其位置


希望您理解我的问题。

您没有指定您使用的语言。通过我使用phpHave的方式,您看到的我认为这是计算字符的方式,我对字符不感兴趣,我关心的是如何将多次出现的字符串位置推送到可用的位置数组。如果它们都来自同一个URL,那么使用array_keys函数可以帮助我获得重复单词的所有键,就像我想要的那样。谢谢你的控制