Nlp 带空格的中文文本的词性标注与NER 我正在尝试打印中文文本中的实体和pos 我已经安装了！pip3安装jieba并使用GoogleColab实现以下脚本_Nlp_Spacy_Named Entity Recognition

Nlp 带空格的中文文本的词性标注与NER 我正在尝试打印中文文本中的实体和pos 我已经安装了！pip3安装jieba并使用GoogleColab实现以下脚本

nlp

Nlp 带空格的中文文本的词性标注与NER 我正在尝试打印中文文本中的实体和pos 我已经安装了！pip3安装jieba并使用GoogleColab实现以下脚本,nlp,spacy,named-entity-recognition,Nlp,Spacy,Named Entity Recognition,但我得到的是实体的空元组，而pos\ux没有结果从spacy.lang.zh导入中文 nlp=中文（） doc=nlp（u）蘋果公司正考量用一億元買下英國的新創公司") 博士 #返回（），即空元组对于文档中的word：打印（word.text、word.pos_） ''返回蘋果公司正考量用一億元買下英國的新創公司 ''' 我是NLP新手。我想知道正确的方法是什么？不幸的是，spaCy还没有一个经过预训练的中文模型（请参阅），这意味着您必

但我得到的是实体的空元组，而pos\ux没有结果

从spacy.lang.zh导入中文
nlp=中文（）
doc=nlp（u）蘋果公司正考量用一億元買下英國的新創公司")
博士
#返回（），即空元组
对于文档中的word：
打印（word.text、word.pos_）
''返回
蘋果 
公司 
正 
考量 
用 
一 
億元 
買 
下 
英國 
的 
新創 
公司 
'''

我是NLP新手。我想知道正确的方法是什么？

不幸的是，spaCy还没有一个经过预训练的中文模型（请参阅），这意味着您必须使用默认的

Chinese（）

模型，该模型只执行标记化，没有词性标记或实体识别

当然，spaCy的中文版仍有一些工作正在进行中，请检查问题。

编辑3/21:spaCy现在支持CN的NER和词性标记。

在此处找到SpaCy模型：

旧答案：

SpaCy是一个很棒的软件包，但是到目前为止还不支持中文，所以我想这就是你没有得到POS结果的原因——即使你的句子是

“苹果正在考虑以10亿美元收购英国的初创企业”

在繁体中文中，因此应将“Apple”和“U.K.”作为

ent

等返回

对于繁体中文的更广泛的NLP方法，您可以尝试使用该软件包-您正在使用python，并且有可用于python的版本（请参阅a或a），但如果您对此更满意的话，原始版本是Java。

感谢您建议斯坦福中文NLP。SpaCy现在支持中文模型：感谢您指出这一点，我将对我的答案进行编辑！