Python 本地加载StanfordNLP模型_Python_Pip_Stanford Nlp_Jupyterhub

Python 本地加载StanfordNLP模型

python pip stanford-nlp

Python 本地加载StanfordNLP模型,python,pip,stanford-nlp,jupyterhub,Python,Pip,Stanford Nlp,Jupyterhub,我正试图从本地机器加载StanfordNLP（python）的英语模型，但找不到合适的import语句。可以使用什么命令？是否有pip安装可用于加载英文模型我已经尝试使用下载命令来执行此操作，但是我的机器要求在本地添加所有文件。我从下载了英文jar文件，但不确定是否需要英文版和英文KBP版我不清楚你想做什么如果要运行all Python管道，可以下载文件并在Python代码中运行它们，方法是指定每个注释器的路径，如本例所示 import stanfordnlp config = {

我正试图从本地机器加载StanfordNLP（python）的英语模型，但找不到合适的import语句。可以使用什么命令？是否有pip安装可用于加载英文模型

我已经尝试使用下载命令来执行此操作，但是我的机器要求在本地添加所有文件。我从下载了英文jar文件，但不确定是否需要英文版和英文KBP版

我不清楚你想做什么

如果要运行all Python管道，可以下载文件并在Python代码中运行它们，方法是指定每个注释器的路径，如本例所示

import stanfordnlp

config = {
    'processors': 'tokenize,mwt,pos,lemma,depparse', # Comma-separated list of processors to use
    'lang': 'fr', # Language code for the language to build the Pipeline in
    'tokenize_model_path': './fr_gsd_models/fr_gsd_tokenizer.pt', # Processor-specific arguments are set with keys "{processor_name}_{argument_name}"
    'mwt_model_path': './fr_gsd_models/fr_gsd_mwt_expander.pt',
    'pos_model_path': './fr_gsd_models/fr_gsd_tagger.pt',
    'pos_pretrain_path': './fr_gsd_models/fr_gsd.pretrain.pt',
    'lemma_model_path': './fr_gsd_models/fr_gsd_lemmatizer.pt',
    'depparse_model_path': './fr_gsd_models/fr_gsd_parser.pt',
    'depparse_pretrain_path': './fr_gsd_models/fr_gsd.pretrain.pt'
}
nlp = stanfordnlp.Pipeline(**config) # Initialize the pipeline using a configuration dict
doc = nlp("Van Gogh grandit au sein d'une famille de l'ancienne bourgeoisie.") # Run the pipeline on input text
doc.sentences[0].print_tokens()

如果希望使用Python接口运行Java服务器，则需要下载Java jar文件并启动服务器。完整信息请点击此处：

然后可以使用Python接口访问服务器。完整信息请点击此处：

但需要明确的是，jar文件不应该与纯Python管道一起使用。这些用于运行Java服务器。

用于模型下载的目录集是/home/sf

pip安装stanfordnlp#安装stanfordnlp

导入斯坦福德NLP
stanfordnlp.download（“en”）#在“Y”之后的此处设置一组自定义目录路径

local\u dir\u store\u model=“/home/sf”
english_model_dir=“/home/sf/en_ewt_models”
tokienizer_en_pt_file=“/home/sf/en_ewt_models/en_ewt_tokenizer.pt”

nlp=stanfordnlp.Pipeline（models\u dir=local\u dir\u store\u model，processors='tokenize，mwt，lemma，pos'）
doc=nlp（““生活中最美妙的事情之一就是醒来并与某人拥抱；除非你在监狱里。”）
doc.句子[0]。print_tokens（）

command

download（）

downloads.zip文件大小为1.9GB，只有3个文件。在file.jar中，我看到了不同的文件，但没有.pt。

download（）

仍在我的计算机上下载，也许它会在更多的文件中解压缩，比如.jar