Javascript 是否有一个公式可以找到实现集合唯一性所需的最短长度
我希望能够计算出实现完全唯一性所需的最短子字符串的长度 假设我有一个32个字符的UUID的可变长度列表,但我想要实现的是在引用期间缩短它们的长度,使其仅与实现其集合唯一性所需的长度相同。例如,如果我有以下一组UUID(插入管道以说明答案) 我只需要前三个字符就可以达到与使用完整的32个字符串相同的唯一性级别 我很好奇是否有一个公式可以达到这个值。我知道我可以把它放在几个嵌套循环中,但我想知道是否有一种更优雅或编程的方法来实现这一点Javascript 是否有一个公式可以找到实现集合唯一性所需的最短长度,javascript,php,mysql,formula,array-formulas,Javascript,Php,Mysql,Formula,Array Formulas,我希望能够计算出实现完全唯一性所需的最短子字符串的长度 假设我有一个32个字符的UUID的可变长度列表,但我想要实现的是在引用期间缩短它们的长度,使其仅与实现其集合唯一性所需的长度相同。例如,如果我有以下一组UUID(插入管道以说明答案) 我只需要前三个字符就可以达到与使用完整的32个字符串相同的唯一性级别 我很好奇是否有一个公式可以达到这个值。我知道我可以把它放在几个嵌套循环中,但我想知道是否有一种更优雅或编程的方法来实现这一点 编辑:只是为了澄清,管道只是为了说明,我可以实现唯一性后,只有
编辑:只是为了澄清,管道只是为了说明,我可以实现唯一性后,只有3个字符。公式/方法的结果应该是一个长度相等的数组,其中只有从给定集合派生的最短字符串,在这种情况下,只有前三个字符。想象一下,我想在URL中使用这些,并且我不能有任何歧义,但仍然希望能够引用相同的记录,就像我在每种情况下使用完整的字符串一样
EDIT2:实际上。。。在我看来,不需要结果数组,只需要整数,即字符所需的最小长度。我设法创建了一些代码来实现这一点。看一看:
- 代码1:
- 代码2:(较小,但较慢)
结果(对于这两种情况): 在这里看到他们的行动:
- )李>
您可以更改返回值以仅获取
$len
变量。您可以利用Array.prototype.reduce()
,Object.hasOwnProperty()
递归;创建一个对象以存储唯一字符集的值,如果名称不是对象的属性,则将对象名称设置为前两个字符,否则先设置n
字符,直到对象中的每个属性都是唯一的
var arr=[“42807082e1f445e79501bebfa87396af”
,“7230785bffaf4747865c202dd0924c7f”
“b65634be909d4e5590aa0cdc97251eef”
,“3c4d94c683624d75a273e3186ec65b78”
,“09EBD42AF040BCF90413E11C5B40FBB”
,“011004743d65466dae8a9a6bc814ef4b”
“1F1889E04E3A453FBF5752DE0A70B60”
“1ac44707af8d4681875171ad47c61037”
,“42f7a6236deb4a9ead32ab2e816d73a3”
,“83afe22086064eec87704127622b8165”];
var obj={};
arr.reduce((o,uuid)=>{
var n=1;
(功能re(键){
var curr=uuid.slice(0,键);
如果(!o.hasOwnProperty(curr)){
o[curr]=uuid;
}否则{
re(键+1)
}
}(n) )
返回obj
},obj);
控制台日志(obj,“arr-length:”,arr.length
,“obj键长度:”,Object.keys(obj.length)代码>不确定是否正确解释问题。管道字符左侧的字符是如何派生的?管道字符左侧的字符是从管道字符右侧的字符派生出来的吗?@guest271314检查428
例如,如果查看最后一个字符,您将看到它以42
开头,因此只有使用3个字符时,所有值才是唯一的。。。管道仅在值开始唯一时显示(请注意,我不是op)@FirstOne仍然没有跟随428
的来源?@guest271314我认为唯一性应该在集合中的每个项目之间,而不是项目中的每个字符之间(您可以看到,011
)。。。op应该确认这一点。@FirstOne Order并不重要。很好的尝试,但是在您生成的结果集中,如果我使用“4”作为例子,它是不明确的,因为它也将匹配“42”的开头。为了确保我选择了正确的“4”,我必须在每次引用ID时重新运行它,以确保我的目标匹配正确。避免歧义的唯一方法是确保所有缩减的ID的长度相同。@oucil“结果集应该是一个尽可能短的子字符串数组”,“实际上可以是长度为1的数组”4
没有歧义。对象的属性值是唯一的。一旦将4
设置为属性名称,则不能再次单独使用4
在对象上设置属性名称。也就是说,除非要求最小长度字符串作为参考,而不是任何长度唯一的字符串作为参考。该方法从1
开始,只有当上一个字符串的索引0
处的字符被用作属性名时,才移动到2
。它可能不完全清楚,但我不会存储较短的ID,因为随着更多记录添加到集合中,它们需要能够增长,因此没有到引用的映射。因此,我仍然需要执行一个通配符查询,其中我只知道ID的开头。因为在我的示例中,我知道ID在三个字符处是唯一的,所以我只需要提供这三个字符来标识正确的记录。如果我只使用第一个字符,即使它在结果集中是唯一的,但在实际使用中是不明确的。@oucil在这种情况下,调用.slice(0,3)
应该返回预期的结果,但我们不知道我们只需要三个字符,如果我们需要四个字符才能唯一呢?我要的是一个公式,告诉我我需要3。。。或4。。。。或8个字符。基准测试:每个方法在每次迭代生成的10k UUID上运行10次,然后取平均值。时间以秒为单位。代码1(低|平均|高):0.01338 | 0.02279 | 0.03211代码2(低|平均|高):0.66395 | 0.73791 | 0.84190 C
428|07082e1f445e79501bebfa87396af
723|0785bffaf4747865c202dd0924c7f
b65|634be909d4e5590aa0cdc97251eef
3c4|d94c683624d75a273e3186ec65b78
09e|bd42af0404bcf90413e11c5b40fbb
011|004743d65466dae8a9a6bc814ef4b
1f1|889e04e3a453fbf57521de0a70b60
1ac|44707af8d4681875171ad47c61037
42f|7a6236deb4a9ead32ab2e816d73a3
83a|fe22086064eec87704127622b8165
function check_un($array){
$arr = $array;
$len = 1;
$tmp = array();
while (list($key, $value) = each($arr)) {
$v = substr($value, 0, $len);
if (isset($tmp[$v])) {
$tmp = array();
$len++;
reset($arr); // start again
}
$tmp[$v] = true;
}
$tmp = array_keys($tmp);
array_shift($tmp);
return $tmp;
}
function check_un($array){
$array = array_values($array);
$len = 1;
$tmp = array();
for($i = 0; $i < strlen($array[0]); $i++){
if( count(array_unique( $tmp = array_map(function($v) use($len){ return substr($v, 0, $len); }, $array ) )) != count($array) ){
$len++;
}else{
break;
}
}
return $tmp; // this was set in the array_map part
}
$values = array(
'42807082e1f445e79501bebfa87396af',
'7230785bffaf4747865c202dd0924c7f',
'b65634be909d4e5590aa0cdc97251eef',
'3c4d94c683624d75a273e3186ec65b78',
'09ebd42af0404bcf90413e11c5b40fbb',
'011004743d65466dae8a9a6bc814ef4b',
'1f1889e04e3a453fbf57521de0a70b60',
'1ac44707af8d4681875171ad47c61037',
'42f7a6236deb4a9ead32ab2e816d73a3',
'83afe22086064eec87704127622b8165'
//,'42807082e1f445e795aaaaaaaaaaaaa' // add this to test with more letters
);
$val = check_un($values);
Array
(
[0] => 428
[1] => 723
[2] => b65
[3] => 3c4
[4] => 09e
[5] => 011
[6] => 1f1
[7] => 1ac
[8] => 42f
[9] => 83a
)