Julia 生物序列多路复用器只查看DNA序列的前5个字母_Julia_Bioinformatics

Julia 生物序列多路复用器只查看DNA序列的前5个字母

julia

Julia 生物序列多路复用器只查看DNA序列的前5个字母,julia,bioinformatics,Julia,Bioinformatics,我目前正在使用Julia的Biosequences.jl库，并希望将其解复用。我试图创建一个像这样的长序列数组 barcodes = LongDNASeq.(barcodeArray[1:3]) 3-element Array{LongSequence{DNAAlphabet{4}},1}: GAGAGTGT GAGATCAG GAGATCTC 但当我试图通过解复用器运行它时，我得到了一个“错误：重复序列” 当阵列中只有前2个元素时，解复用器工作。所以我怀疑解复用器最多只

我目前正在使用Julia的Biosequences.jl库，并希望将其解复用。我试图创建一个像这样的长序列数组

barcodes = LongDNASeq.(barcodeArray[1:3])
  3-element Array{LongSequence{DNAAlphabet{4}},1}:
   GAGAGTGT
   GAGATCAG
   GAGATCTC

但当我试图通过解复用器运行它时，我得到了一个“错误：重复序列”

当阵列中只有前2个元素时，解复用器工作。所以我怀疑解复用器最多只能读取前6个字符

有什么解决办法吗

编辑：

当我设置

n\u max\u errors=0

时，错误消失。但我不明白为什么会这样。如果

GAGATCAG

和

GAGATCTC

之间有一个字母的距离，这是有意义的。但事实并非如此

dplxr = Demultiplexer(unique(barcodes),n_max_errors=1,distance=:hamming)
  ERROR: duplicated sequences
  Stacktrace:
   [1] BioSequences.BarcodeTrie(::Array{LongSequence{DNAAlphabet{4}},1}, ::Array{Int64,1}) at 
   /home/kos/.julia/packages/BioSequences/k4j4J/src/demultiplexer.jl:22
   [2] Demultiplexer(::Array{LongSequence{DNAAlphabet{4}},1}; n_max_errors::Int64, 
   distance::Symbol) at /home/kos/.julia/packages/BioSequences/k4j4J/src/demultiplexer.jl:168
   [3] top-level scope at REPL[38]:1