Python Spark nlp预训练模型未在windows中加载

Python Spark nlp预训练模型未在windows中加载,python,python-3.x,apache-spark,pyspark,johnsnowlabs-spark-nlp,Python,Python 3.x,Apache Spark,Pyspark,Johnsnowlabs Spark Nlp,我正在尝试用python在Windows10的spark nlp中安装预训练管道。 以下是迄今为止我在本地系统的Jupyter笔记本中尝试的代码: ! java -version # should be Java 8 (Oracle or OpenJDK) ! conda create -n sparknlp python=3.7 -y ! conda activate sparknlp ! pip install --user spark-nlp==2.6.4 pyspark==2.4.5

我正在尝试用python在Windows10的spark nlp中安装预训练管道。 以下是迄今为止我在本地系统的Jupyter笔记本中尝试的代码:

! java -version
# should be Java 8 (Oracle or OpenJDK)
! conda create -n sparknlp python=3.7 -y
! conda activate sparknlp
! pip install --user spark-nlp==2.6.4 pyspark==2.4.5


from sparknlp.base import *
from sparknlp.annotator import *
from sparknlp.pretrained import PretrainedPipeline
import sparknlp

# Start Spark Session with Spark NLP
# start() functions has two parameters: gpu and spark23
# sparknlp.start(gpu=True) will start the session with GPU support
# sparknlp.start(sparrk23=True) is when you have Apache Spark 2.3.x installed
spark = sparknlp.start()

# Download a pre-trained pipeline
pipeline = PretrainedPipeline('explain_document_ml', lang='en')
我得到以下错误:

explain\u document\u ml下载已开始这可能需要一些时间。
大约大小可下载9.4 MB
[好的!]
---------------------------------------------------------------------------
Py4JJavaError回溯(最近一次调用)
装饰中的~\AppData\Roaming\Python\Python37\site packages\pyspark\sql\utils.py(*a,**kw)
62尝试:
--->63返回f(*a,**kw)
64除py4j.protocol.Py4JJavaError外的其他错误为e:
获取返回值中的~\Anaconda3\envs\py37\lib\site packages\py4j\protocol.py(应答、网关客户端、目标id、名称)
327“调用{0}{1}{2}时出错。\n”。
-->328格式(目标id,“.”,名称),值)
329其他:
Py4JJavaError:调用z:com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.downloadPipeline时出错。
:java.lang.IllegalArgumentException:需求失败:找不到适合下载请求的资源:ResourceRequest(解释文档\u ml,一些(en),公共/模型,2.6.4,2.4.4),下载程序:com.johnsnowlabs.nlp.pretrained。S3ResourceDownloader@2570f26e
在scala.Predef$.require处(Predef.scala:224)
在com.johnsnowlabs.nlp.pretrained.ResourceDownloader$.DownloaderResource(ResourceDownloader.scala:345)
在com.johnsnowlabs.nlp.pretrained.ResourceDownloader$.downloadPipeline(ResourceDownloader.scala:376)
在com.johnsnowlabs.nlp.pretrained.ResourceDownloader$.downloadPipeline(ResourceDownloader.scala:371)
在com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader$.downloadPipeline上(ResourceDownloader.scala:474)
在com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.downloadPipeline(ResourceDownloader.scala)
在sun.reflect.NativeMethodAccessorImpl.invoke0(本机方法)处
位于sun.reflect.NativeMethodAccessorImpl.invoke(未知源)
在sun.reflect.DelegatingMethodAccessorImpl.invoke处(未知源)
位于java.lang.reflect.Method.invoke(未知源)
位于py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
位于py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
在py4j.Gateway.invoke处(Gateway.java:282)
位于py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
在py4j.commands.CallCommand.execute(CallCommand.java:79)
在py4j.GatewayConnection.run处(GatewayConnection.java:238)
位于java.lang.Thread.run(未知源)
在处理上述异常期间,发生了另一个异常:
IllegalArgumentException回溯(最后一次最近调用)
在里面
11
12#下载经过预培训的管道
--->13管道=预培训管道(解释文件)
~\Anaconda3\envs\py37\lib\site packages\sparknlp\pretrained.py in\uuuuuu init\uuuuu(self、name、lang、remote\u loc、parse\u embeddings、disk\u location)
89定义初始化(self,name,lang='en',remote_loc=None,parse_embeddings=False,disk_location=None):
90如果不是磁盘位置:
--->91 self.model=ResourceDownloader().downloadPipeline(名称、语言、远程位置)
92.其他:
93 self.model=PipelineModel.load(磁盘位置)
下载管道中的~\Anaconda3\envs\py37\lib\site packages\sparknlp\pretrained.py(名称、语言、远程位置)
58 t1.开始()
59尝试:
--->60 j_obj=_internal._downloadpippeline(名称、语言、远程位置).apply()
61 jmodel=管道模型。来自java(j_obj)
62.最后:
~\Anaconda3\envs\py37\lib\site packages\sparknlp\internal.py in\uuuuuuu init\uuuuu(self、name、language、remote\u loc)
179类下载管道(ExtendedJavaWrapper):
180 def___________(自我、姓名、语言、远程位置):
-->181 super(_downloadpipline,self)。uu init(com.johnsnowlabs.nlp.pretrained.PythonResourceDownloader.downloadpipline),名称、语言、远程位置)
182
183
~\Anaconda3\envs\py37\lib\site packages\sparknlp\internal.py in\uuuuu init\uuuu(self,java\u obj,*args)
127 super(ExtendedJavaWrapper,self)。\uuuu init\uuuj(java\u obj)
128 self.sc=SparkContext.\u活动\u火花\u上下文
-->129 self.\u java\u obj=self.new\u java\u obj(java\u obj,*args)
130 self.java_obj=self.\u java_obj
131
~\Anaconda3\envs\py37\lib\site packages\sparknlp\internal.py在新的java对象中(self,java类,*args)
137
138 def new_java_obj(self,java_类,*args):
-->139返回self.\u new\u java\u obj(java\u类,*args)
140
141 def新的java_数组(self、pylist、java_类):
~\AppData\Roaming\Python\Python37\site packages\pyspark\ml\wrapper.py in\u new\u java\u obj(java\u类,*args)
65 java_obj=getattr(java_obj,名称)
66 java_args=[[u py2java(sc,arg)表示args中的arg]
--->67返回java_obj(*java_args)
68
69@staticmethod
~\Anaconda3\envs\py37\lib\site packages\py4j\java\u gateway.py在调用中(self,*args)
1255 answer=self.gateway\u client.send\u命令(command)
1256返回值=获取返回值(
->1257应答,self.gateway_客户端,self.target_id,self.name)
1258
1259对于临时参数中的临时参数:
装饰中的~\AppData\Roaming\Python\Python37\site packages\pyspark\sql\utils.py(*a,**kw)
77 raise QueryExecutionException(s.split(“:”,1)[1],stackTrace)
78如果s.StartWith('java.lang.IllegalArgumentException:'):
--->79引发IllegalArgumentException(s.split(“:”,1)[1],stackTrace)
80加薪
81返回装饰
IllegalArgumentException:“需求失败:找不到合适的资源下载请求:ResourceRequest(解释文档\u ml,S