Nlp 通用报告格式++;:有人知道CRF模型文件中的浮点数是什么意思吗
当您使用crf的-t选项构建模型文件时,请学习: crf学习模板训练数据-t模型 然后它将生成两个模型文件,其中一个是model.txt 有人能说出浮点数的意思吗 请参见以下示例: 版本:100 成本因素:1 maxid:40 xsize:1 B 我 U00:%x[0,0] B 36 B 20 U00: 26 U00:か 18 U00:が 22 U00:こ 8 U00:た 10 U00:ち 2 U00:っ 4 U00:て 34 U00:に 12 U00:の 0 U00:よ 28 U00:ら 24 U00:れ 32 U00:上 14 U00:世 16 U00:代 30 U00:地 6 U00:私 -0.3022268562246992 0.3022268562246989 -0.3629407244093161 0.3629407244093156 -0.3327259487028221 0.3327259487028215 0.3462799099537973 -0.3462799099537980 0.3452020097664334 -0.3452020097664336 -0.3218750203631590 0.3218750203631575 0.0376944272290242 -0.0376944272290280 0.3329631783491211 -0.3329631783491230 -0.3092967308014029 0.3092967308014015 0.3413769126433928 -0.3413769126433950 0.3786782765859961 -0.3786782765859980 0.5208645073272351 -0.5208645073272384 -0.3261580548802839 0.3261580548802814 -0.3615756495615902 0.3615756495615884 -0.3248593224319323 0.3248593224319312 0.3281895709166696 -0.3281895709166719 -0.3040331359589971 0.3040331359589951 0.2836939567332580 -0.2836939567332600 -0.1530917919770705 -0.1613508585854637 0.4245699543724943 -0.1101273038099901 我的理解是: 每个浮点数应对应于每个模板,例如: 第一个浮点数“-0.3022268562246992”应与“36 B”相对应。 但是为什么浮点数是模板数的两倍呢? 这些浮点数是什么意思 非常感谢,Nlp 通用报告格式++;:有人知道CRF模型文件中的浮点数是什么意思吗,nlp,crf,crf++,Nlp,Crf,Crf++,当您使用crf的-t选项构建模型文件时,请学习: crf学习模板训练数据-t模型 然后它将生成两个模型文件,其中一个是model.txt 有人能说出浮点数的意思吗 请参见以下示例: 版本:100 成本因素:1 maxid:40 xsize:1 B 我 U00:%x[0,0] B 36 B 20 U00: 26 U00:か 18 U00:が 22 U00:こ 8 U00:た 10 U00:ち 2 U00:っ 4 U00:て 34 U00:に 12 U00:の 0 U00:よ 28 U00:ら 24
帅华在阅读了部分CRF++058源代码后,我知道如何理解CRF_学习输出。我将使用一些示例来解释输出 ==基本的==== 假设我们有以下培训数据: 我们的模板非常简单,只有一行:U00:%x[0,0]
毎 k B
日 k I
新 k I
聞 k I
社 k I
特 k B
別 k I
顧 k B
問 k I
毎, 日, 新, 聞, 社, 特, 別, 顧, 問
../毎/日
毎/日/新
日/新/聞
新/聞/社
聞/社/特
社/特/別
特/別/顧
別/顧/問
顧/問/..
毎 k B
毎 k B
日 k I
新 k I
聞 k I
社 k I
特 k B
別 k I
顧 k B
問 k I
version: 100
cost-factor: 1
maxid: 670
xsize: 1
0 毎 ==> B
1 毎 ==> I
2 日 ==> B
3 日 ==> I
...
14 問 ==> B
15 問 ==> I
B
I
0 U00:毎
2 U00:日
...