Nlp 正在使用PMML(用于文本分类)

Nlp 正在使用PMML(用于文本分类),nlp,pmml,Nlp,Pmml,我使用jpmml sklearn(python)生成了用于文本分类的PMML文件,代码如下: Textpipeline = PMMLPipeline([ ("tf-idf", TfidfVectorizer(analyzer = "word", preprocessor = None, strip_accents = None, token_pattern = None, tokenizer = Splitter(), stop_words = "english", ngram_rang

我使用jpmml sklearn(python)生成了用于文本分类的PMML文件,代码如下:

Textpipeline = PMMLPipeline([
    ("tf-idf", TfidfVectorizer(analyzer = "word", preprocessor = None, strip_accents = None, token_pattern = None, tokenizer = Splitter(), stop_words = "english", ngram_range = (1, 2), norm = None,max_features = 50)),
    ("classifier", SGDClassifier())
])

Textpipeline.fit(data.data, data.target)

from sklearn2pmml import sklearn2pmml

sklearn2pmml(Textpipeline, "TextMiningClassifier_SGD_Classifier.pmml", with_repr = True)
现在,我想将这个PMML(训练有素的模型)付诸实践,在这里我可以导入它(在某些平台上,比如JAVA或其他平台上),并对输入文本进行分类

如果能够了解如何导入上述PMML模型并在新数据集上生成预测(在本例中,只需对输入文本进行分类)的步骤,那就太好了

非常感谢您在这方面的帮助