Java 这个术语是什么;特写“;在OpenNLP中是什么意思?或者在NLP中。外行术语会很好

Java 这个术语是什么;特写“;在OpenNLP中是什么意思?或者在NLP中。外行术语会很好,java,machine-learning,nlp,stanford-nlp,opennlp,Java,Machine Learning,Nlp,Stanford Nlp,Opennlp,我当时正在从事OpenNLP项目,遇到了一些东西,比如特性生成。“特征”一词的确切含义是什么?如果你能用外行术语来解释,那就太好了。我不使用OpenNLP,但机器学习术语中的一个特性是分类器/回归器/其他模型的输入 如果你想将人类分为男性还是女性,你的特征可以是: 大小 列表项 重量 头发长度 根据这四个特征,你可以将其分类为男性还是女性 在更复杂的数据上,特征生成可能意味着您在某些特征中总结了大量数据。 例如,100个值的标准偏差。或最大值或……其他答案给出了功能的大致概念。对于OpenNLP

我当时正在从事OpenNLP项目,遇到了一些东西,比如特性生成。“特征”一词的确切含义是什么?如果你能用外行术语来解释,那就太好了。我不使用OpenNLP,但机器学习术语中的一个特性是分类器/回归器/其他模型的输入

如果你想将人类分为男性还是女性,你的特征可以是:

  • 大小
  • 列表项
  • 重量
  • 头发长度
  • 根据这四个特征,你可以将其分类为男性还是女性

    在更复杂的数据上,特征生成可能意味着您在某些特征中总结了大量数据。
    例如,100个值的标准偏差。或最大值或……

    其他答案给出了功能的大致概念。对于OpenNLP和大多数其他最大熵分类器,一个特征实际上是一个指示函数,指示一个术语是否与类一起出现,I(C,x),其中C是结果类,x是术语,如果术语与类一起出现,I=0(请参阅以获得更好的描述)。]

    在openNLP(和其他maxent软件包)中,很容易将术语(实际上,我们应该称之为谓词而不是术语,这通常是一个词)与功能(函数)混淆。然而,如果你看看(在美国,我们称之为足球),你会发现它不需要是一个单格;它可能是家=阿森纳。你可以让[w-1:last,w:night]代表昨晚的二元人格

    您可能还想知道一些其他术语。事件是一个数据点,其中包含该数据点的所有谓词(以及训练的结果)。上下文是用于训练/评估结果的谓词集。因此,谓词是您正在寻找的“术语”

    下面是一个例子

    每个术语(例如home=man_united)都是一个谓词(大多数人使用术语feature,但是feature是home=man_united,结果是阿森纳)。 每一行都是一个事件


    我希望这会有所帮助。

    Florian是对的,但对于NLP来说,功能处理通常要复杂一些。你可以开始了,尽管我只是略读了一遍。
    home=man_united Beckham=false Scholes=true Neville=true Henry=true Kanu=true Parlour=false Ferguson=confident Wengler=tense arsenal_lost_previous man_united_won_previous arsenal
    home=arsenal Beckham=false Scholes=true Neville=true Henry=true Kanu=true Parlour=false Ferguson=confident Wengler=tense arsenal_lost_previous man_united_won_previous arsenal