Nlp 带空格的中文文本的词性标注与NER 我正在尝试打印中文文本中的实体和pos 我已经安装了!pip3安装jieba并使用GoogleColab实现以下脚本

Nlp 带空格的中文文本的词性标注与NER 我正在尝试打印中文文本中的实体和pos 我已经安装了!pip3安装jieba并使用GoogleColab实现以下脚本,nlp,spacy,named-entity-recognition,Nlp,Spacy,Named Entity Recognition,但我得到的是实体的空元组,而pos\ux没有结果 从spacy.lang.zh导入中文 nlp=中文() doc=nlp(u)蘋果公司正考量用一億元買下英國的新創公司") 博士 #返回(),即空元组 对于文档中的word: 打印(word.text、word.pos_) ''返回 蘋果 公司 正 考量 用 一 億元 買 下 英國 的 新創 公司 ''' 我是NLP新手。我想知道正确的方法是什么?不幸的是,spaCy还没有一个经过预训练的中文模型(请参阅),这意味着您必

但我得到的是实体的空元组,而pos\ux没有结果

从spacy.lang.zh导入中文
nlp=中文()
doc=nlp(u)蘋果公司正考量用一億元買下英國的新創公司")
博士
#返回(),即空元组
对于文档中的word:
打印(word.text、word.pos_)
''返回
蘋果 
公司 
正 
考量 
用 
一 
億元 
買 
下 
英國 
的 
新創 
公司 
'''

我是NLP新手。我想知道正确的方法是什么?

不幸的是,spaCy还没有一个经过预训练的中文模型(请参阅),这意味着您必须使用默认的
Chinese()
模型,该模型只执行标记化,没有词性标记或实体识别


当然,spaCy的中文版仍有一些工作正在进行中,请检查问题。

编辑3/21:spaCy现在支持CN的NER和词性标记。

在此处找到SpaCy模型:

旧答案:

SpaCy是一个很棒的软件包,但是到目前为止还不支持中文,所以我想这就是你没有得到POS结果的原因——即使你的句子是

“苹果正在考虑以10亿美元收购英国的初创企业”

在繁体中文中,因此应将“Apple”和“U.K.”作为
ent
等返回


对于繁体中文的更广泛的NLP方法,您可以尝试使用该软件包-您正在使用python,并且有可用于python的版本(请参阅a或a),但如果您对此更满意的话,原始版本是Java。

感谢您建议斯坦福中文NLP。SpaCy现在支持中文模型:感谢您指出这一点,我将对我的答案进行编辑!