Stanford nlp 斯坦福NLP训练情绪模型

Stanford nlp 斯坦福NLP训练情绪模型,stanford-nlp,Stanford Nlp,我正在为烂西红柿NLP预测的kaggle竞赛工作 对培训集格式的分析如下: 短语句子情感 1一系列的越轨行为证明了一句格言:对鹅有益的事对雄鹅也有好处,其中一些偶尔会让人觉得好笑,但没有一个能成为一个故事。一, 2 1一系列的越轨行为证明了一句格言:什么对鹅有好处2 但是,训练集公式必须如下所示: (2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2(2)``

我正在为烂西红柿NLP预测的kaggle竞赛工作

对培训集格式的分析如下:

短语句子情感

1一系列的越轨行为证明了一句格言:对鹅有益的事对雄鹅也有好处,其中一些偶尔会让人觉得好笑,但没有一个能成为一个故事。一,

2 1一系列的越轨行为证明了一句格言:什么对鹅有好处2

但是,训练集公式必须如下所示:

(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2(2)``)(2(2)(2)(2)(2)(3)(2)(2)(3)(2)(3)(2)(3)(2)(2)(3)(2)(2)(3)(2)(2)(2)(3)(2)(2)(2)(3)(2)(2)(3)(2)(2)(3)(2)(2)(2)(2)(3)(2)(2)(3)(2)(2)(2)(2)(2)(2)(2)(3)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(3)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2(2)施瓦辛格)(2,)(2(2让-克劳德)(2(2范)(2达姆)))(2或)(2(2史蒂文)(2西格尔()(()()()())()()()

下面是我正在使用的python代码片段:

结果是:

(1)(2)(2)(2)(2)一系列的(2次越轨)(2(2)(2)证明格言)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)(2)也)(3)(2)(2)(2)好)(2)(2)(2)(2)(2)(2)(一些)(2偶尔)(3娱乐)(2)(2)(2)(但)(2无)(其中2)(2)(2)(2)(2个数量)(2到)(2多)(2个)(2个故事)

然而,斯坦福大学的感悟软件包不会识别这种格式(适用于他们的train.txt)
它抛出了一个错误:

线程“main”java.lang.NumberFormatException中的异常:null


建议?

我目前正在学习如何亲自培训模特

查看您的train.txt,问题在于您没有对某些单词打分。我刚刚对您的结果进行了以下更改,命令行正在成功地将其添加到我的模型中:

(1 (2 (2 (2 A) series) (2 of) (2 escapades) (2 (2 demonstrating) (2 the) (2     adage)) (2 that) (2 what) (2 is) (3 good) (2 for) (2 the) (2 goose) (2 is) (2 also) (3 good) (2 for) (2 the) (2 gander) (2 ,) (2 (2 some) (2 of) (2 which)) (2 occasionally) (3 amuses) (2 but) (2 none) (2 of which) (2 amounts) (2 to) (2 much) (2 of) (2 a story) (2 .))
(1 (2 (2 (2 A) series) (2 of) (2 escapades) (2 (2 demonstrating) (2 the) (2     adage)) (2 that) (2 what) (2 is) (3 good) (2 for) (2 the) (2 goose) (2 is) (2 also) (3 good) (2 for) (2 the) (2 gander) (2 ,) (2 (2 some) (2 of) (2 which)) (2 occasionally) (3 amuses) (2 but) (2 none) (2 of which) (2 amounts) (2 to) (2 much) (2 of) (2 a story) (2 .))