Class 在GIZA+;的mkcls文件中,单词如何聚集到单词类中+;它们是根据什么进行分组的?

Class 在GIZA+;的mkcls文件中,单词如何聚集到单词类中+;它们是根据什么进行分组的?,class,numbers,nlp,word,giza++,Class,Numbers,Nlp,Word,Giza++,在giza++中mkcls有什么用途 运行mkcls时,giza++为源语言和目标语言生成四个文件*.vcb.classes和*.vcb.classes.cats *.vcb.classes的输出为: . 9 book 10 gave 4 he 3 him 5 i 7 loved 8 read 8 the 2 这些数字指的是什么?是单词类的数字吗?如果它是一个单词类别号,那么它是如何生成的,或者它是如何分类到不同的类别中的,依据是什么?mkc

在giza++中mkcls有什么用途

  • 运行mkcls时,giza++为源语言和目标语言生成四个文件*.vcb.classes和*.vcb.classes.cats

  • *.vcb.classes的输出为:

    .      9
    book  10
    gave   4
    he     3
    him    5
    i      7
    loved  8
    read   8
    the    2
    

    这些数字指的是什么?是单词类的数字吗?如果它是一个单词类别号,那么它是如何生成的,或者它是如何分类到不同的类别中的,依据是什么?

    mkcls程序将单词分组到等价的类别中。GIZA++使用输出进行单词对齐。不过,请看你所指的那篇论文是关于双语聚类的。mkcls进行简单的单语聚类。