Julia 生物序列多路复用器只查看DNA序列的前5个字母
我目前正在使用Julia的Biosequences.jl库,并希望将其解复用。我试图创建一个像这样的长序列数组Julia 生物序列多路复用器只查看DNA序列的前5个字母,julia,bioinformatics,Julia,Bioinformatics,我目前正在使用Julia的Biosequences.jl库,并希望将其解复用。我试图创建一个像这样的长序列数组 barcodes = LongDNASeq.(barcodeArray[1:3]) 3-element Array{LongSequence{DNAAlphabet{4}},1}: GAGAGTGT GAGATCAG GAGATCTC 但当我试图通过解复用器运行它时,我得到了一个“错误:重复序列” 当阵列中只有前2个元素时,解复用器工作。所以我怀疑解复用器最多只
barcodes = LongDNASeq.(barcodeArray[1:3])
3-element Array{LongSequence{DNAAlphabet{4}},1}:
GAGAGTGT
GAGATCAG
GAGATCTC
但当我试图通过解复用器运行它时,我得到了一个“错误:重复序列”
当阵列中只有前2个元素时,解复用器工作。所以我怀疑解复用器最多只能读取前6个字符
有什么解决办法吗
编辑:
当我设置n\u max\u errors=0
时,错误消失。但我不明白为什么会这样。如果GAGATCAG
和GAGATCTC
之间有一个字母的距离,这是有意义的。但事实并非如此
dplxr = Demultiplexer(unique(barcodes),n_max_errors=1,distance=:hamming)
ERROR: duplicated sequences
Stacktrace:
[1] BioSequences.BarcodeTrie(::Array{LongSequence{DNAAlphabet{4}},1}, ::Array{Int64,1}) at
/home/kos/.julia/packages/BioSequences/k4j4J/src/demultiplexer.jl:22
[2] Demultiplexer(::Array{LongSequence{DNAAlphabet{4}},1}; n_max_errors::Int64,
distance::Symbol) at /home/kos/.julia/packages/BioSequences/k4j4J/src/demultiplexer.jl:168
[3] top-level scope at REPL[38]:1