Parsing 这是一个有效的Genbank功能描述还是一个Biopython bug?

Parsing 这是一个有效的Genbank功能描述还是一个Biopython bug?,parsing,biopython,Parsing,Biopython,我偶然发现了一个Genbank格式的文件(这里显示为一个最小的虚拟示例),其中包含如下嵌套功能: FEATURES Location/Qualifiers xxxx_domain complement(complement(1..145)) 这种特性使当前的Biopython Genbank解析器(1.59版本)崩溃,但在以前的版本(例如1.55版本)中显然没有。显然,该行为已经出现在1.57中(见下面的评论) 从Biopython bugtracke

我偶然发现了一个Genbank格式的文件(这里显示为一个最小的虚拟示例),其中包含如下嵌套功能:

FEATURES             Location/Qualifiers
     xxxx_domain     complement(complement(1..145))
这种特性使当前的Biopython Genbank解析器(1.59版本)崩溃,但在以前的版本(例如1.55版本)中显然没有。显然,该行为已经出现在1.57中(见下面的评论)

从Biopython bugtracker上看,旧的locationparser代码似乎在1.56中被删除:

从上的格式描述可以推断,这很可能是无效的。(但请参见下面的评论)

有人能对此发表评论吗。也就是说,这是Biopython中的小故障还是Genbank文件的格式

完整演示文件:

LOCUS       XXXXXXXXXXXXXX         240 bp    DNA     circular     17-JAN-2012
DEFINITION  xxxxxx.
KEYWORDS    xx.
SOURCE      
  ORGANISM  
FEATURES             Location/Qualifiers
     xxxx_domain     complement(complement(1..145))
                     /vntifkey="1"
                     /label=A label
                     /note="A note"
BASE COUNT       75 a        57 c        42 g        66 t 
ORIGIN
        1 tttacaaaac gcattttcaa accttgggta ctaccccctt ttaaatatcc gaatacacta 
       61 ataaacgctc tttcctttta ggtaaacccg ccaatatata ctgatacaca ctgatagttt 
      121 aaactagatg cagtggccga ccatcagatc tagtaggaaa cagctatgac catgattacg 
      181 cattacttat ttaagatcaa ccgtaccagt ataccctgcc agcatgatgg aaacctccct 
//
显示错误的最小演示程序(假设安装了Biopython 1.59和Python 2.7,且上述文件为“test.gb”:

这与

    raise LocationParserError(location_line)
Bio.GenBank.LocationParserError: complement(1..145)

我认为这是一个无效的位置。这是来自NCBI文件还是其他地方


请注意,对于Biopython 1.60(下一版本)我们计划将坏位置视为警告,而不是停止解析的错误。

如果对您有帮助,我在v1.57上也会遇到同样的错误。略读一下,这似乎完全有效…谢谢。我编辑了主要帖子以包含注释。真正好的问题是,为什么任何人都会想要一个补语的补语…来自in内部数据源(与VNTI接触)。
    raise LocationParserError(location_line)
Bio.GenBank.LocationParserError: complement(1..145)