Nlp Pytextrank-避免在关键短语提取中使用小写标记_Nlp_Spacy_Pytextrank

Nlp Pytextrank-避免在关键短语提取中使用小写标记

nlp

Nlp Pytextrank-避免在关键短语提取中使用小写标记,nlp,spacy,pytextrank,Nlp,Spacy,Pytextrank,我想避免在pytextrank中使用小写标记。对于如何实现这一点，您有什么建议吗？从PyTextRank2.1.0版（发布于2021-01-31）开始，当应用程序遍历排名短语时，例如： for phrase in doc._.phrases[:10]: print(phrase.text) 。。。每个短语的默认文本是其在文档中最常用的实例。这就是在短语数据类的文本字段中设置的内容但是，检查文档中出现的短语的所有实例的chunks字段。由于这些是从文档的原始文本中提取的，因此不会强制使

我想避免在pytextrank中使用小写标记。对于如何实现这一点，您有什么建议吗？

从PyTextRank2.1.0版（发布于2021-01-31）开始，当应用程序遍历排名短语时，例如：

for phrase in doc._.phrases[:10]:
    print(phrase.text)

。。。每个短语的默认文本是其在文档中最常用的实例。这就是在

短语

数据类的

文本

字段中设置的内容

但是，检查文档中出现的短语的所有实例的

chunks

字段。由于这些是从文档的原始文本中提取的，因此不会强制使用小写

OTOH，当算法构造其内部引理图数据结构时，引理化标记被强制为小写。但是，您不需要使用引理图作为最终结果。也许这会引起一些混淆？

您能举一个例子说明“小写标记”的含义吗？我是的首席提交人，我们希望为已确定的用例添加特性或支持。您是否需要短语的原始文本实例？