Python 是否有一种算法可以计算NLP中单词抽象程度的数值评分?

Python 是否有一种算法可以计算NLP中单词抽象程度的数值评分?,python,nlp,wordnet,Python,Nlp,Wordnet,有没有一种算法可以自动计算一个词的抽象程度的数值等级。例如,算法将purvey评为1,将donut评为0,将immodestly评为0.5..(这些是示例值) 抽象词是指与直接感知相去甚远的思想和概念的词,如经济学、计算学和有争议的词。另一方面,具体的词语指的是我们可以用感官直接感知的事物、事件和属性,如树木、行走和红色。据我所知,抽象性没有定义,也没有任何算法来计算它 然而,有几个方向我会用作代理 频率-抽象概念在普通语音中可能非常罕见,因此一个简单的idf应该有助于识别稀有词 词源学——英语

有没有一种算法可以自动计算一个词的抽象程度的数值等级。例如,算法将purvey评为1,将donut评为0,将immodestly评为0.5..(这些是示例值)


抽象词是指与直接感知相去甚远的思想和概念的词,如经济学、计算学和有争议的词。另一方面,具体的词语指的是我们可以用感官直接感知的事物、事件和属性,如树木、行走和红色。

据我所知,抽象性没有定义,也没有任何算法来计算它

然而,有几个方向我会用作代理

  • 频率-抽象概念在普通语音中可能非常罕见,因此一个简单的
    idf
    应该有助于识别稀有词

  • 词源学——英语中的常用词通常来源于日耳曼语,而更多的技术词汇通常是从法语/拉丁语中借用来的

  • 监督学习-如果你在维基百科上找到了
    摘要
    ,那么常见的短语或单词可能也会描述类似的抽象概念。训练分类器可以作为评分的一种方法

  • 关于什么是抽象的,什么是具体的,没有基本的事实,特别是如果你试图量化它。
    我建议将这些代理聚合到一个您认为对您的需求有用的度量。

    如何量化“抽象性”?定义你想要的