Time complexity 确定是否有大小为n的子集具有标准偏差<;=s

Time complexity 确定是否有大小为n的子集具有标准偏差<;=s,time-complexity,subset,standard-deviation,Time Complexity,Subset,Standard Deviation,给定一组数字,我试图确定在数字密集的地方是否存在一个“丛” 为了让事情更精确,我想我应该问一个更具体的问题:给定一组数字,我想确定是否有一个子集sizen具有标准偏差最近正在处理一个类似的问题,集群的定义和建议的实现似乎都是合理的 另一个合理的定义是找到n数字的所有范围的最小值。因此,如果对数字列表x进行排序,则只需找到x[n]-x[1]、x[n+1]-x[2]等中的最小值。这将比找到标准偏差稍快,因为它将避免乘法和平方根。事实上,即使在寻找最低标准偏差时,也可以通过寻找最小方差(标准偏差的平方

给定一组数字,我试图确定在数字密集的地方是否存在一个“丛”


为了让事情更精确,我想我应该问一个更具体的问题:给定一组数字,我想确定是否有一个子集size
n
具有标准偏差最近正在处理一个类似的问题,集群的定义和建议的实现似乎都是合理的

另一个合理的定义是找到
n
数字的所有范围的最小值。因此,如果对数字列表
x
进行排序,则只需找到
x[n]-x[1]
x[n+1]-x[2]
等中的最小值。这将比找到标准偏差稍快,因为它将避免乘法和平方根。事实上,即使在寻找最低标准偏差时,也可以通过寻找最小方差(标准偏差的平方)而不是sd本身来避免平方根


需要注意的是,最大束的位置可能对
n
的选择非常敏感。如果选择某个特定的
n
有一个先验的原因,那就不会有问题。但是,如果不是,则可能需要进行一些实验来选择
n
的值,该值可以相当可靠地找到要查找的束,无论是按范围还是按标准偏差进行选择。这方面的一些想法可以在在线书籍的第6章中找到。

最近一直在研究一个类似的问题,集群的定义和建议的实现似乎都是合理的

另一个合理的定义是找到
n
数字的所有范围的最小值。因此,如果对数字列表
x
进行排序,则只需找到
x[n]-x[1]
x[n+1]-x[2]
等中的最小值。这将比找到标准偏差稍快,因为它将避免乘法和平方根。事实上,即使在寻找最低标准偏差时,也可以通过寻找最小方差(标准偏差的平方)而不是sd本身来避免平方根


需要注意的是,最大束的位置可能对
n
的选择非常敏感。如果选择某个特定的
n
有一个先验的原因,那就不会有问题。但是,如果不是,则可能需要进行一些实验来选择
n
的值,该值可以相当可靠地找到要查找的束,无论是按范围还是按标准偏差进行选择。有关这方面的一些想法可以在在线书籍的第6章中找到。

感谢您的帮助!我想我会使用你建议的最小范围,而不是最小标准偏差。这不仅更容易计算,而且我发现它更容易推理。我可以选择一个合理的范围,因为我可以想象被压缩到某个范围内的n个点是什么样子。对于标准差来说要困难得多。谢谢你的帮助!我想我会使用你建议的最小范围,而不是最小标准偏差。这不仅更容易计算,而且我发现它更容易推理。我可以选择一个合理的范围,因为我可以想象被压缩到某个范围内的n个点是什么样子。标准差要困难得多。