Python SpaCy can';找不到表中语言的词素规范';en';空间内查找数据
我正在SpaCy中尝试训练文本分类管道:Python SpaCy can';找不到表中语言的词素规范';en';空间内查找数据,python,nlp,spacy,Python,Nlp,Spacy,我正在SpaCy中尝试训练文本分类管道: 导入空间 nlp=spacy.load(“en_core\u web\u sm”) nlp.add_管道(“textcat”,last=True) other_pipes=[nlp.pipe中管道的管道名称如果管道!='textcat'] 使用nlp。禁用_管道(*其他_管道): optimizer=nlp.begin\u training() #训练逻辑 但是,每次调用nlp.begin\u training(),我都会收到错误消息 ValueErr
导入空间
nlp=spacy.load(“en_core\u web\u sm”)
nlp.add_管道(“textcat”,last=True)
other_pipes=[nlp.pipe中管道的管道名称如果管道!='textcat']
使用nlp。禁用_管道(*其他_管道):
optimizer=nlp.begin\u training()
#训练逻辑
但是,每次调用nlp.begin\u training()
,我都会收到错误消息
ValueError: [E955] Can't find table(s) lexeme_norm for language 'en' in spacy-lookups-data. Make sure you have the package installed or provide your own lookup tables if no default lookups are available for your language.
运行python3-msapacy验证
返回
✔ Loaded compatibility table
================= Installed pipeline packages (spaCy v3.0.3) =================
ℹ spaCy installation:
/xxx/xxx/xxx/env/lib/python3.8/site-packages/spacy
NAME SPACY VERSION
en_core_web_lg >=3.0.0,<3.1.0 3.0.0 ✔
en_core_web_sm >=3.0.0,<3.1.0 3.0.0 ✔
✔ 加载的兼容性表
======================已安装的管道软件包(spaCy v3.0.3)=================
ℹ 空间安装:
/xxx/xxx/xxx/env/lib/python3.8/site-packages/spacy
名称空间版本
en_core_web_lg>=3.0.0,=3.0.0,不允许调用nlp。在预训练模型上开始训练()。如果您想培训新车型,只需使用:
nlp=spacy.blank('en')
而不是nlp=spacy.load(“en\u core\u web\u sm”)
但是,如果要继续对现有模型进行培训,请调用optimizer=nlp。创建\u optimizer()
而不是begin\u training()