获取R中分布最均匀的条目

获取R中分布最均匀的条目,r,bioinformatics,R,Bioinformatics,我的问题如下: 我在R中得到了一个data.frame,其中包含坐标,例如 SNP1 chr1 123456 SNP2 chr1 156895 SNP3 chr1 550000 ... 现在我想指定一个区域(例如chr1:100000-500000)和一些SNPs(n),并找到该区域中分布最均匀的nSNPs 我有一个脚本,可以将该区域划分为n-1个片段,并选择最接近片段边界的SNP。它还可以排除两次命名的SNPs,并获得下一个最接近的SNP,但仍然可能有更好的解决方案来

我的问题如下:
我在R中得到了一个
data.frame
,其中包含坐标,例如

SNP1  chr1  123456  
SNP2  chr1  156895  
SNP3  chr1  550000  
...
现在我想指定一个区域(例如chr1:100000-500000)和一些
SNP
s(
n
),并找到该区域中分布最均匀的
n
SNP
s


我有一个脚本,可以将该区域划分为
n-1
个片段,并选择最接近片段边界的SNP。它还可以排除两次命名的
SNP
s,并获得下一个最接近的
SNP
,但仍然可能有更好的解决方案来均匀地选择它们(可能通过某种方式最大化它们之间的总距离,但
SNP
s的总数相当高?)

你能提供一些数据和代码吗?也许给我们看看你的剧本是怎么做的?你展示的
“data.frame”
并不能让这个问题变得容易理解或回答。为了确定“均匀分布”的最佳定义是什么,我们首先需要知道你为什么要寻找均匀分布的SNP(我想这与链接有关)@Seth:如果数据不是均匀分布的,那就不起作用,如果密度非常不一致的话,那就很难起作用。