Python 如何重新训练现有的spacy NER货币模型

Python 如何重新训练现有的spacy NER货币模型,python,nlp,spacy,ner,Python,Nlp,Spacy,Ner,我正在尝试用一些不同的国家货币,如“欧元”、“卢比”、“欧盟”、“卢比”、“卢比”、“印度卢比”等,来更新现有的spacy模型“en_core_web_sm”。我该如何实现这一点?spacy教程对我帮助不大,因为将“马”等固定字符串训练为“动物”似乎与我的要求不同。原因是我可以使用不同格式的货币值:“100万欧元”、“10000卢比”、“1000卢比”等。我的样本数据集包含约1000个样本,格式如下: TRAIN_DATA = [ (" You have activated Int

我正在尝试用一些不同的国家货币,如“欧元”、“卢比”、“欧盟”、“卢比”、“卢比”、“印度卢比”等,来更新现有的spacy模型“en_core_web_sm”。我该如何实现这一点?spacy教程对我帮助不大,因为将“马”等固定字符串训练为“动物”似乎与我的要求不同。原因是我可以使用不同格式的货币值:“100万欧元”、“10000卢比”、“1000卢比”等。我的样本数据集包含约1000个样本,格式如下:

TRAIN_DATA = [      
 (" You have activated International transaction limit for Debit Card ending XXXX1137 on 2017-07-05 12:48:20.0 via NetBanking. The new limit is Rs. 250,000.00", {'entities' : [(140, 154, 'MONEY')] }),...
]

有谁能在数据格式、培训规模或任何其他相关信息方面帮助我吗?

文档中的示例应该适合您。我稍微修改了一下以匹配变量名

optimizer = nlp.begin_training()

for itn in range(100):
    random.shuffle(train_data)
    for raw_text, entity_offsets in TRAIN_DATA:
        doc = nlp.make_doc(raw_text)
        gold = GoldParse(doc, entities=entity_offsets)
        nlp.update([doc], [gold], drop=0.5, sgd=optimizer)
nlp.to_disk('/model')

为什么添加动物模型对您没有帮助?动物模型即使只有少量数据集也可以正常工作,但金钱模型不起作用。我猜这个货币模型需要学习各种数字格式或类似的东西,我不太确定。