Nlp Pytextrank-避免在关键短语提取中使用小写标记

Nlp Pytextrank-避免在关键短语提取中使用小写标记,nlp,spacy,pytextrank,Nlp,Spacy,Pytextrank,我想避免在pytextrank中使用小写标记。对于如何实现这一点,您有什么建议吗?从PyTextRank2.1.0版(发布于2021-01-31)开始,当应用程序遍历排名短语时,例如: for phrase in doc._.phrases[:10]: print(phrase.text) 。。。每个短语的默认文本是其在文档中最常用的实例。这就是在短语数据类的文本字段中设置的内容 但是,检查文档中出现的短语的所有实例的chunks字段。由于这些是从文档的原始文本中提取的,因此不会强制使

我想避免在pytextrank中使用小写标记。对于如何实现这一点,您有什么建议吗?

PyTextRank2.1.0版(发布于2021-01-31)开始,当应用程序遍历排名短语时,例如:

for phrase in doc._.phrases[:10]:
    print(phrase.text)
。。。每个短语的默认文本是其在文档中最常用的实例。这就是在
短语
数据类的
文本
字段中设置的内容

但是,检查文档中出现的短语的所有实例的
chunks
字段。由于这些是从文档的原始文本中提取的,因此不会强制使用小写


OTOH,当算法构造其内部引理图数据结构时,引理化标记被强制为小写。但是,您不需要使用引理图作为最终结果。也许这会引起一些混淆?

您能举一个例子说明“小写标记”的含义吗?我是的首席提交人,我们希望为已确定的用例添加特性或支持。您是否需要短语的原始文本实例?