Perl HOMER de novo motif discovery无法打开hg19 fasta文件

Perl HOMER de novo motif discovery无法打开hg19 fasta文件,perl,Perl,我有一些BAM格式的芯片序列数据 在某个时候,我想做一个全新的主题发现 使用HOMERs findMotifsGenome.pl脚本 问题似乎是这个应用程序无法打开reference genome fasta文件,即使它们是由应用程序本身安装的 有人遇到过这个问题吗 使用的linux命令: $perl/home/chipseq_project/homer/bin/findmotifsgeneome.pl/home/chipseq_project/homer/findpeak_output/pea

我有一些BAM格式的芯片序列数据 在某个时候,我想做一个全新的主题发现 使用HOMERs findMotifsGenome.pl脚本

问题似乎是这个应用程序无法打开reference genome fasta文件,即使它们是由应用程序本身安装的

有人遇到过这个问题吗

使用的linux命令: $perl/home/chipseq_project/homer/bin/findmotifsgeneome.pl/home/chipseq_project/homer/findpeak_output/peaks.txt hg19/home/chipseq_project/homer/motif_output/-给定大小

标准文本: 在/home/chipseq_project/homer/bin/assignGeneWeights.pl第63行被零非法除法。 正在汇编序列文件。。。 使用homer2规范化低阶寡头

    Reading input files...
    0 total sequences read
    Autonormalization: 1-mers (4 total)
            A       inf%    inf%    -nan
            C       inf%    inf%    -nan
            G       inf%    inf%    -nan
            T       inf%    inf%    -nan
    Autonormalization: 2-mers (16 total)
            AA      inf%    inf%    -nan
            CA      inf%    inf%    -nan
            GA      inf%    inf%    -nan
            TA      inf%    inf%    -nan
            AC      inf%    inf%    -nan
            CC      inf%    inf%    -nan
            GC      inf%    inf%    -nan
            TC      inf%    inf%    -nan
            AG      inf%    inf%    -nan
            CG      inf%    inf%    -nan
            GG      inf%    inf%    -nan
            TG      inf%    inf%    -nan
            AT      inf%    inf%    -nan
            CT      inf%    inf%    -nan
            GT      inf%    inf%    -nan
            TT      inf%    inf%    -nan
    Autonormalization: 3-mers (64 total)
    Normalization weights can be found in file: /home/chipseq_project/homer/motif_output//seq.autonorm.tsv
    Converging on autonormalization solution:
    ...............................................................................
    Final normalization:    Autonormalization: 1-mers (4 total)
            A       inf%    inf%    -nan
            C       inf%    inf%    -nan
            G       inf%    inf%    -nan
            T       inf%    inf%    -nan
    Autonormalization: 2-mers (16 total)
            AA      inf%    inf%    -nan
            CA      inf%    inf%    -nan
            GA      inf%    inf%    -nan
            TA      inf%    inf%    -nan
            AC      inf%    inf%    -nan
            CC      inf%    inf%    -nan
            GC      inf%    inf%    -nan
            TC      inf%    inf%    -nan
            AG      inf%    inf%    -nan
            CG      inf%    inf%    -nan
            GG      inf%    inf%    -nan
            TG      inf%    inf%    -nan
            AT      inf%    inf%    -nan
            CT      inf%    inf%    -nan
            GT      inf%    inf%    -nan
            TT      inf%    inf%    -nan
    Autonormalization: 3-mers (64 total)
    Finished preparing sequence/group files

    ----------------------------------------------------------
    Known motif enrichment

    Reading input files...
    0 total sequences read
    264 motifs loaded
    Cache length = 11180
    Using binomial scoring
    Checking enrichment of 264 motif(s)
    |0%                                    50%                                  100%|
在/home/chipseq_project/homer/bin/findKnownMotifs.pl第142行按零非法划分。 ---------------------------------------------------------- 新主题发现(荷马)

!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗? !!! i、 同时检查你的序列文件

    -blen automatically set to 2
    Scanning input files...
!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗? !!! i、 同时检查你的序列文件

    -blen automatically set to 2
    Scanning input files...
!!!有点不对劲。。。您确定为motif查找选择了正确的长度吗? !!! i、 同时检查你的序列文件!!! 在/home/chipseq_project/homer/bin/compareMotifs.pl第1289行的数值gt(>)中使用未初始化值。 !!! 过滤掉所有的图案!!! 工作完成-如果结果良好,请将啤酒发送至

    Cleaning up tmp files...

需要检查的一件事是:如果您的bed文件中的染色体命名与您正在使用的基因组中的色度命名一致:例如,您的bed文件中的染色体12不应该有'12',而您感兴趣的基因组中的'chr12'是'chr'问题,简单的awk命令您的朋友。简单的awk'{print“chr”$0}'your.bed>你的新床就可以了。
hkoohy

我也遇到了这个问题,而且我的床单看起来也不错。然而,解决这个问题的诀窍是通过以下代码将我的.bed文件更改为.pos文件:

bed2pos.pl file.bed > file.pos
我希望这能帮助你们:)


最好的,Fleur

那么,您要求stack overflow调试其他人的脚本,但实际上没有提供脚本?对不起,这有点超出了SO的范围。如果你能提供重现问题所需的代码片段,我们可能会遇到一个正是问题所在的机会,一个在染色体编号前添加“chr”的简单脚本修复了所有问题。谢谢
    Cleaning up tmp files...
bed2pos.pl file.bed > file.pos