Nlp 检测第一/第二/第三人称代词

Nlp 检测第一/第二/第三人称代词,nlp,pos-tagger,Nlp,Pos Tagger,我正在寻找一种方法来检测人称代词是第一人称(I)、第二人称(you)还是第三人称(they)。代码希望查看是否有人在谈论自己,但也有一些其他应用程序 python库非常棒,但不是必需的。nltk.pos_标签将告诉我什么是人称代词,但我似乎无法获得更多信息 像这样的东西存在吗?你自己写也没什么大不了的。正如您所说,NLTK可以为您提供所有代词,您可以轻松编写一个函数,通过简单的字符串匹配返回详细的形态分析。只需将标记为代词的东西传递给所述函数即可 代词是所谓的“封闭类”词,也就是说,代词的数量是

我正在寻找一种方法来检测人称代词是第一人称(I)、第二人称(you)还是第三人称(they)。代码希望查看是否有人在谈论自己,但也有一些其他应用程序

python库非常棒,但不是必需的。nltk.pos_标签将告诉我什么是人称代词,但我似乎无法获得更多信息


像这样的东西存在吗?

你自己写也没什么大不了的。正如您所说,NLTK可以为您提供所有代词,您可以轻松编写一个函数,通过简单的字符串匹配返回详细的形态分析。只需将标记为代词的东西传递给所述函数即可

代词是所谓的“封闭类”词,也就是说,代词的数量是有限的。(在英语中)没有办法产生新的代词。另一方面,名词是“开放类”的,也就是说,你可以生成新名词(复合名词,如“海狸牙”等)

因此,您只需使用类似于
f(x)=如果x==“I”| | x==“me”| x==“my”,然后返回“1st.person singular”
。。。或者类似的。显然,您不希望返回字符串,而是希望返回一些更具信息性的内容,例如带有字段
number
person
的对象,可能还有
所有格
甚至
大小写

还有一件事:由于NLTK是一个统计标记器,它有时会标记为代词,而这些词根本不是。在这种情况下,您应该准备返回错误条件