Python 本地加载StanfordNLP模型

Python 本地加载StanfordNLP模型,python,pip,stanford-nlp,jupyterhub,Python,Pip,Stanford Nlp,Jupyterhub,我正试图从本地机器加载StanfordNLP(python)的英语模型,但找不到合适的import语句。可以使用什么命令?是否有pip安装可用于加载英文模型 我已经尝试使用下载命令来执行此操作,但是我的机器要求在本地添加所有文件。我从下载了英文jar文件,但不确定是否需要英文版和英文KBP版 我不清楚你想做什么 如果要运行all Python管道,可以下载文件并在Python代码中运行它们,方法是指定每个注释器的路径,如本例所示 import stanfordnlp config = {

我正试图从本地机器加载StanfordNLP(python)的英语模型,但找不到合适的import语句。可以使用什么命令?是否有pip安装可用于加载英文模型


我已经尝试使用下载命令来执行此操作,但是我的机器要求在本地添加所有文件。我从下载了英文jar文件,但不确定是否需要英文版和英文KBP版

我不清楚你想做什么

如果要运行all Python管道,可以下载文件并在Python代码中运行它们,方法是指定每个注释器的路径,如本例所示

import stanfordnlp

config = {
    'processors': 'tokenize,mwt,pos,lemma,depparse', # Comma-separated list of processors to use
    'lang': 'fr', # Language code for the language to build the Pipeline in
    'tokenize_model_path': './fr_gsd_models/fr_gsd_tokenizer.pt', # Processor-specific arguments are set with keys "{processor_name}_{argument_name}"
    'mwt_model_path': './fr_gsd_models/fr_gsd_mwt_expander.pt',
    'pos_model_path': './fr_gsd_models/fr_gsd_tagger.pt',
    'pos_pretrain_path': './fr_gsd_models/fr_gsd.pretrain.pt',
    'lemma_model_path': './fr_gsd_models/fr_gsd_lemmatizer.pt',
    'depparse_model_path': './fr_gsd_models/fr_gsd_parser.pt',
    'depparse_pretrain_path': './fr_gsd_models/fr_gsd.pretrain.pt'
}
nlp = stanfordnlp.Pipeline(**config) # Initialize the pipeline using a configuration dict
doc = nlp("Van Gogh grandit au sein d'une famille de l'ancienne bourgeoisie.") # Run the pipeline on input text
doc.sentences[0].print_tokens()
如果希望使用Python接口运行Java服务器,则需要下载Java jar文件并启动服务器。完整信息请点击此处:

然后可以使用Python接口访问服务器。完整信息请点击此处:


但需要明确的是,jar文件不应该与纯Python管道一起使用。这些用于运行Java服务器。

用于模型下载的目录集是/home/sf

pip安装stanfordnlp#安装stanfordnlp

导入斯坦福德NLP
stanfordnlp.download(“en”)#在“Y”之后的此处设置一组自定义目录路径

local\u dir\u store\u model=“/home/sf”
english_model_dir=“/home/sf/en_ewt_models”
tokienizer_en_pt_file=“/home/sf/en_ewt_models/en_ewt_tokenizer.pt”

nlp=stanfordnlp.Pipeline(models\u dir=local\u dir\u store\u model,processors='tokenize,mwt,lemma,pos')
doc=nlp(““生活中最美妙的事情之一就是醒来并与某人拥抱;除非你在监狱里。”)
doc.句子[0]。print_tokens()

command
download()
downloads.zip文件大小为1.9GB,只有3个文件。在file.jar中,我看到了不同的文件,但没有.pt。
download()
仍在我的计算机上下载,也许它会在更多的文件中解压缩,比如.jar