Javascript 如何在d3.js中将FASTA读入dataframe并提取FASTA文件的子序列
我有一个小的fasta DNA序列文件,看起来像这样: 序列1>Javascript 如何在d3.js中将FASTA读入dataframe并提取FASTA文件的子序列,javascript,parsing,d3.js,fasta,Javascript,Parsing,D3.js,Fasta,我有一个小的fasta DNA序列文件,看起来像这样: 序列1> ACATATTGGAGGCGAAACATGAGGGTGACTCACTCAGTATCAC 序列2> CTAACCTCTCGCAGTGGACCTCTATCCTCATGAGAAGCTGGATGAG 问题: 如何在d3.js中解析它? 比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕捉它 2.如何在(开始、结束)位置提取子序列 1.如何在d3.js中解析 D3.js是一个JavaScript(查
ACATATTGGAGGCGAAACATGAGGGTGACTCACTCAGTATCAC 序列2>
CTAACCTCTCGCAGTGGACCTCTATCCTCATGAGAAGCTGGATGAG
问题:
- 比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕捉它
"ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC..."
或作为数组:
["A", "C", "A", "T", "A"...]
或者,以一种笨拙的方式,作为一组对象:
[{position:1, base:"A"}, {position:2, base:"B"}...]
这取决于你。FASTA是基于文本的,这意味着我们将把数据作为字符串处理(第一个选项)
2.如何在(开始、结束)位置提取子序列
由于D3是一个javascript库,因此必须使用javascript方法处理字符串
例如,要查找序列中起始(TAC,对应于UAG密码子)三联体的位置,可以使用indexOf
:
var sequence=“acatactggaggcgaacaatgaggtgatcaacctcagtatatcac”;
var start=“TAC”;
console.log(sequence.indexOf(start))
请描述您想要实现的目标,您迄今为止尝试了什么,以及您的问题到底是什么。这是什么意思“解析到d3.js”你想用它显示什么样的图表等等…比如从fasta格式存储的100个序列中计算平均序列,以及如何像d3中的2D对象一样捕获它。我不明白该怎么做,我只想在javascript@Gerardo中这样做