Perl 语言建模中的交叉熵
我目前正在使用语言建模进行分类任务。该项目的第一部分涉及使用n-gram语言模型使用c5.0对文档进行分类。项目的最后一部分要求我使用交叉熵对每个类进行建模,并根据这些模型对测试用例进行分类Perl 语言建模中的交叉熵,perl,text,classification,entropy,Perl,Text,Classification,Entropy,我目前正在使用语言建模进行分类任务。该项目的第一部分涉及使用n-gram语言模型使用c5.0对文档进行分类。项目的最后一部分要求我使用交叉熵对每个类进行建模,并根据这些模型对测试用例进行分类 是否有人有使用交叉熵的经验,或者有关于如何使用交叉熵模型进行数据采样的信息链接?任何信息都很好!感谢您可以在各种教科书上获得将交叉熵与语言模型结合使用的理论背景,例如Jurafsky&Martin的《语音和语言处理》,第二版第116-118页。 至于具体用法,在大多数语言建模工具中,交叉熵不是直接测量的,而
是否有人有使用交叉熵的经验,或者有关于如何使用交叉熵模型进行数据采样的信息链接?任何信息都很好!感谢您可以在各种教科书上获得将交叉熵与语言模型结合使用的理论背景,例如Jurafsky&Martin的《语音和语言处理》,第二版第116-118页。 至于具体用法,在大多数语言建模工具中,交叉熵不是直接测量的,而是“困惑”,即交叉熵的表达式。反过来,这种困惑可以用来对文档进行分类。例如,请参阅卡内基大学语言建模工具SLM中命令“evallm”的文档(http://www.speech.cs.cmu.edu/SLM/toolkit_documentation.html) 祝你好运:)