Deep learning 蛋白质结构域边界预测

Deep learning 蛋白质结构域边界预测,deep-learning,bioinformatics,Deep Learning,Bioinformatics,为了使用深度学习对蛋白质序列进行分析,序列必须以数字表示进行编码 考虑到深度学习模型自动提取特征的能力,还使用了不同的非生物编码方案,例如氨基酸组成信息、序列中氨基酸的频率和一种热编码 我想知道二进制表示可以用来编码蛋白质序列。例如,[0,0,0,0,1]和[0,0,0,1,0]是两种氨基酸的表示 要编码21种独特的氨基酸,至少需要5个二进制数字。我不太确定你在问什么,但如果你问一个热编码是否有效,答案是肯定的。如果您想了解更多关于使用python category encoders包的其他编码

为了使用深度学习对蛋白质序列进行分析,序列必须以数字表示进行编码

考虑到深度学习模型自动提取特征的能力,还使用了不同的非生物编码方案,例如氨基酸组成信息、序列中氨基酸的频率和一种热编码

我想知道二进制表示可以用来编码蛋白质序列。例如,[0,0,0,0,1]和[0,0,0,1,0]是两种氨基酸的表示


要编码21种独特的氨基酸,至少需要5个二进制数字。

我不太确定你在问什么,但如果你问一个热编码是否有效,答案是肯定的。如果您想了解更多关于使用python category encoders包的其他编码方案的信息,我在这里写了一个指南:我不确定您在问什么,但是如果您问一个热编码是否有效,答案是肯定的。如果您想了解更多关于使用python category encoders包的其他编码方案的信息,我在这里编写了一个指南: