NLP实践者如何为maxent分类器中的特征分配lamba?

NLP实践者如何为maxent分类器中的特征分配lamba?,nlp,Nlp,我正在看maxent分级赛。在视频中,克里斯托弗·曼宁(Christopher Manning)根据特征选择某个类别的强度为其指定lambdas。例如,曼宁说(~2:00)feature=“proceduring word is in and word is capitalized”(例如在魁北克省)很可能会选择一个班级所在地,因此被赋予1.8的正权重——但是feature=“word has a accent”的权重为-.4,因为在美式英语中,它更可能选择名字而不是地点。曼宁接着说(~4:21

我正在看maxent分级赛。在视频中,克里斯托弗·曼宁(Christopher Manning)根据特征选择某个类别的强度为其指定lambdas。例如,曼宁说(~2:00)feature=“proceduring word is in and word is capitalized”(例如在魁北克省)很可能会选择一个班级所在地,因此被赋予1.8的正权重——但是feature=“word has a accent”的权重为-.4,因为在美式英语中,它更可能选择名字而不是地点。曼宁接着说(~4:21),“感知器算法”和“支持向量机”有时被用来挑选特征的权重——在他继续展示规范化特征权重的maxent模型之前。然而,在他的maxent示例中,Manning仍然使用他刚刚在视频第2分钟左右挑选的Lambda。这些羔羊来自哪里?nlp实践者是否只是从领域知识中挑选它们(就像曼宁那样),然后与它们一起思考,直到算法得出正确的值?有没有更系统的方法?我是否误解了这段视频中发生的事情?

这段视频主要是关于如何建立maxent模型的。要找到lambda的实际值,您需要根据训练数据向学习系统提出一个优化问题。接下来的视频将演示如何解决该优化问题以找到正确的权重