Nlp 评估;“价值”;属性

Nlp 评估;“价值”;属性,nlp,Nlp,我正在尝试使用来评估URI的内容。重点是引出与本文真正相关的主题。不幸的是,我得到的专题分析是: 巨大的 多样的 这两种质量对于我要做的事情都不是很有用,因为信噪比严重地偏向于噪声。我在分析网络内容,因此涉及到一定数量(可能是大量)的无关内容(广告等)。我明白了 尽管如此,返回的许多主题要么毫无用处(完全没有感觉,甚至没有文字),要么无关紧要(比如,这是从哪里来的?),要么过于琐碎,无法提供任何意义或见解。我可能可以使用为每个域、子域、主题等返回的值来过滤掉大部分噪声,但是我不知道它到底是什么意

我正在尝试使用来评估URI的内容。重点是引出与本文真正相关的主题。不幸的是,我得到的专题分析是:

  • 巨大的
  • 多样的
  • 这两种质量对于我要做的事情都不是很有用,因为信噪比严重地偏向于噪声。我在分析网络内容,因此涉及到一定数量(可能是大量)的无关内容(广告等)。我明白了

    尽管如此,返回的许多主题要么毫无用处(完全没有感觉,甚至没有文字),要么无关紧要(比如,这是从哪里来的?),要么过于琐碎,无法提供任何意义或见解。我可能可以使用为每个域、子域、主题等返回的值来过滤掉大部分噪声,但是我不知道它到底是什么意思

    当然,我理解是衡量“文本中单词的突出程度”的一个指标,但数字本身似乎完全是任意的,我不想说“忽略任何值小于50的术语”之类的话,让它具有任何真正的意义

    是否有任何范围标准可以帮助我了解如何使用主题的价值分数作为筛选阈值?或者,我是否应该使用另一个字段进行这种过滤


    感谢您的帮助。

    从其他渠道,我了解到,
    属性无法按我希望的方式计算。对于不同的信号,它意味着不同的事情,没有一个是以这样的方式定义的,对这种需求是有意义的