Javascript 如何在d3.js中将FASTA读入dataframe并提取FASTA文件的子序列

Javascript 如何在d3.js中将FASTA读入dataframe并提取FASTA文件的子序列,javascript,parsing,d3.js,fasta,Javascript,Parsing,D3.js,Fasta,我有一个小的fasta DNA序列文件,看起来像这样: 序列1> ACATATTGGAGGCGAAACATGAGGGTGACTCACTCAGTATCAC 序列2> CTAACCTCTCGCAGTGGACCTCTATCCTCATGAGAAGCTGGATGAG 问题: 如何在d3.js中解析它? 比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕捉它 2.如何在(开始、结束)位置提取子序列 1.如何在d3.js中解析 D3.js是一个JavaScript(查

我有一个小的fasta DNA序列文件,看起来像这样:

序列1>
ACATATTGGAGGCGAAACATGAGGGTGACTCACTCAGTATCAC

序列2>
CTAACCTCTCGCAGTGGACCTCTATCCTCATGAGAAGCTGGATGAG


问题:

  • 如何在d3.js中解析它?

    • 比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕捉它
  • 2.如何在(开始、结束)位置提取子序列

    1.如何在d3.js中解析

    D3.js是一个JavaScript(查看“js”)库,用于根据数据操作文档。因此,归根结底,D3是javascript,没有核酸序列的“解析”功能

    关于D3(实际上是关于JavaScript),您可以将DNA序列作为字符串处理:

    "ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC..."
    
    或作为数组:

    ["A", "C", "A", "T", "A"...]
    
    或者,以一种笨拙的方式,作为一组对象:

    [{position:1, base:"A"}, {position:2, base:"B"}...]
    
    这取决于你。FASTA是基于文本的,这意味着我们将把数据作为字符串处理(第一个选项)

    2.如何在(开始、结束)位置提取子序列

    由于D3是一个javascript库,因此必须使用javascript方法处理字符串

    例如,要查找序列中起始(TAC,对应于UAG密码子)三联体的位置,可以使用
    indexOf

    var sequence=“acatactggaggcgaacaatgaggtgatcaacctcagtatatcac”;
    var start=“TAC”;
    
    console.log(sequence.indexOf(start))
    请描述您想要实现的目标,您迄今为止尝试了什么,以及您的问题到底是什么。这是什么意思“解析到d3.js”你想用它显示什么样的图表等等…比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕获它。我不明白该怎么做,我只想在javascript@Gerardo中这样做