Perl HOMER de novo motif discovery无法打开hg19 fasta文件
我有一些BAM格式的芯片序列数据 在某个时候,我想做一个全新的主题发现 使用HOMERs findMotifsGenome.pl脚本 问题似乎是这个应用程序无法打开reference genome fasta文件,即使它们是由应用程序本身安装的 有人遇到过这个问题吗 使用的linux命令: $perl/home/chipseq_project/homer/bin/findmotifsgeneome.pl/home/chipseq_project/homer/findpeak_output/peaks.txt hg19/home/chipseq_project/homer/motif_output/-给定大小 标准文本: 在/home/chipseq_project/homer/bin/assignGeneWeights.pl第63行被零非法除法。 正在汇编序列文件。。。 使用homer2规范化低阶寡头Perl HOMER de novo motif discovery无法打开hg19 fasta文件,perl,Perl,我有一些BAM格式的芯片序列数据 在某个时候,我想做一个全新的主题发现 使用HOMERs findMotifsGenome.pl脚本 问题似乎是这个应用程序无法打开reference genome fasta文件,即使它们是由应用程序本身安装的 有人遇到过这个问题吗 使用的linux命令: $perl/home/chipseq_project/homer/bin/findmotifsgeneome.pl/home/chipseq_project/homer/findpeak_output/pea
Reading input files...
0 total sequences read
Autonormalization: 1-mers (4 total)
A inf% inf% -nan
C inf% inf% -nan
G inf% inf% -nan
T inf% inf% -nan
Autonormalization: 2-mers (16 total)
AA inf% inf% -nan
CA inf% inf% -nan
GA inf% inf% -nan
TA inf% inf% -nan
AC inf% inf% -nan
CC inf% inf% -nan
GC inf% inf% -nan
TC inf% inf% -nan
AG inf% inf% -nan
CG inf% inf% -nan
GG inf% inf% -nan
TG inf% inf% -nan
AT inf% inf% -nan
CT inf% inf% -nan
GT inf% inf% -nan
TT inf% inf% -nan
Autonormalization: 3-mers (64 total)
Normalization weights can be found in file: /home/chipseq_project/homer/motif_output//seq.autonorm.tsv
Converging on autonormalization solution:
...............................................................................
Final normalization: Autonormalization: 1-mers (4 total)
A inf% inf% -nan
C inf% inf% -nan
G inf% inf% -nan
T inf% inf% -nan
Autonormalization: 2-mers (16 total)
AA inf% inf% -nan
CA inf% inf% -nan
GA inf% inf% -nan
TA inf% inf% -nan
AC inf% inf% -nan
CC inf% inf% -nan
GC inf% inf% -nan
TC inf% inf% -nan
AG inf% inf% -nan
CG inf% inf% -nan
GG inf% inf% -nan
TG inf% inf% -nan
AT inf% inf% -nan
CT inf% inf% -nan
GT inf% inf% -nan
TT inf% inf% -nan
Autonormalization: 3-mers (64 total)
Finished preparing sequence/group files
----------------------------------------------------------
Known motif enrichment
Reading input files...
0 total sequences read
264 motifs loaded
Cache length = 11180
Using binomial scoring
Checking enrichment of 264 motif(s)
|0% 50% 100%|
在/home/chipseq_project/homer/bin/findKnownMotifs.pl第142行按零非法划分。
----------------------------------------------------------
新主题发现(荷马)
!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗?
!!! i、 同时检查你的序列文件
-blen automatically set to 2
Scanning input files...
!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗?
!!! i、 同时检查你的序列文件
-blen automatically set to 2
Scanning input files...
!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗?
!!! i、 同时检查你的序列文件!!!
在/home/chipseq_project/homer/bin/compareMotifs.pl第1289行的数值gt(>)中使用未初始化值。
!!! 过滤掉所有的图案!!!
工作完成-如果结果良好,请将啤酒发送至
Cleaning up tmp files...
需要检查的一件事是:如果您的bed文件中的染色体命名与您正在使用的基因组中的色度命名一致:例如,您的bed文件中的染色体12不应该有'12',而您感兴趣的基因组中的'chr12'是'chr'问题,简单的awk命令您的朋友。简单的awk'{print“chr”$0}'your.bed>你的新床就可以了。
hkoohy我也遇到了这个问题,而且我的床单看起来也不错。然而,解决这个问题的诀窍是通过以下代码将我的.bed文件更改为.pos文件:
bed2pos.pl file.bed > file.pos
我希望这能帮助你们:)
最好的,Fleur那么,您要求stack overflow调试其他人的脚本,但实际上没有提供脚本?对不起,这有点超出了SO的范围。如果你能提供重现问题所需的代码片段,我们可能会遇到一个正是问题所在的机会,一个在染色体编号前添加“chr”的简单脚本修复了所有问题。谢谢
Cleaning up tmp files...
bed2pos.pl file.bed > file.pos