Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/325.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 使用Cloudera 5.14和Spark2配置Livy:Livy可以';找不到自己的JAR文件_Java_Apache Spark_Hadoop_Cloudera_Livy - Fatal编程技术网

Java 使用Cloudera 5.14和Spark2配置Livy:Livy可以';找不到自己的JAR文件

Java 使用Cloudera 5.14和Spark2配置Livy:Livy可以';找不到自己的JAR文件,java,apache-spark,hadoop,cloudera,livy,Java,Apache Spark,Hadoop,Cloudera,Livy,我是Cloudera的新手,正在尝试将工作负载从运行带有Livy和Spark 2.2.x的Ambari的HDP服务器移动到具有类似设置的CDH 5服务器。由于Livy不是Cloudera的一个组件,我使用的是他们网站上的0.5.0版本,它与Thread、Spark和HDFS masters在同一台服务器上运行 长话短说,当我试图向Livy提交时,我收到以下错误消息: Diagnostics: File file:/home/livy/livy-0.5.0-incubating-bin/rsc-j

我是Cloudera的新手,正在尝试将工作负载从运行带有Livy和Spark 2.2.x的Ambari的HDP服务器移动到具有类似设置的CDH 5服务器。由于Livy不是Cloudera的一个组件,我使用的是他们网站上的0.5.0版本,它与Thread、Spark和HDFS masters在同一台服务器上运行

长话短说,当我试图向Livy提交时,我收到以下错误消息:

Diagnostics: File file:/home/livy/livy-0.5.0-incubating-bin/rsc-jars/livy-rsc-0.5.0-incubating.jar does not exist
java.io.FileNotFoundException: File file:/home/livy/livy-0.5.0-incubating-bin/rsc-jars/livy-rsc-0.5.0-incubating.jar does not exist
    at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:598)
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:811)
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:588)
    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:432)
    at org.apache.hadoop.yarn.util.FSDownload.copy(FSDownload.java:251)
    at org.apache.hadoop.yarn.util.FSDownload.access$000(FSDownload.java:61)
    at org.apache.hadoop.yarn.util.FSDownload$2.run(FSDownload.java:364)
    at org.apache.hadoop.yarn.util.FSDownload$2.run(FSDownload.java:362)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1920)
    at org.apache.hadoop.yarn.util.FSDownload.call(FSDownload.java:361)
    at org.apache.hadoop.yarn.util.FSDownload.call(FSDownload.java:60)
    at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
    at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

Failing this attempt. Failing the application.
它引用的jar是Livy安装的一部分,显然是存在的。看起来在这个过程中的某个时刻,Hadoop正在寻找一个URL为
file:/home…
的文件,而不仅仅是
/home…
file:///home...
,但我不确定这是否相关,因为这可能是HDFS的有效路径。我已经从源代码构建了Livy的多个版本,修改了启动脚本并对其进行了远程调试,但是这个错误似乎发生在Spark的某个地方

这是我的
livy.conf
文件:

# What spark master Livy sessions should use.
livy.spark.master = yarn

# What spark deploy mode Livy sessions should use.
livy.spark.deploy-mode = cluster

livy.file.upload.max.size  300000000
livy env.sh

export HADOOP_CONF_DIR=/opt/cloudera/parcels/CDH-5.14.2-1.cdh5.14.2.p0.3/etc/hadoop
export SPARK_HOME=/opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/lib/spark2
export HADOOP_HOME=/opt/cloudera/parcels/CDH-5.14.2-1.cdh5.14.2.p0.3/lib/hadoop
旧集群使用Hadoop 2.7.3.2.6.5.0-141和Spark 2.2.1。新集群正在运行Hadoop 2.6.0-cdh5.14.2和Spark 2.2.0.cloudera2。使用旧集群的Livy发行版以及Cloudera自己的Livy发行版都会产生相同的基本错误。同样,所有这些东西在以前的HDP/Ambari集群上运行良好

所有这些jar文件都存在于每个节点的该路径上,我也尝试过使用HDFS中的jar——Livy提取它们,然后为提取的jar提供相同的错误消息。我也尝试了一些有权限的东西,但似乎都不管用。例如,我得到:

18/06/09 00:13:12 INFO util.LineBufferedStream: (stdout: ,18/06/09 00:13:11 INFO yarn.Client: Uploading resource hdfs://some-server:8020/user/livy/jars/livy-examples-0.4.0-SNAPSHOT.jar -> file:/home/livy/.spar
kStaging/application_1528398117244_0054/livy-examples-0.4.0-SNAPSHOT.jar)
从Livy的输出,然后是

Diagnostics: File file:/home/livy/.sparkStaging/application_1528398117244_0054/livy-examples-0.4.0-SNAPSHOT.jar does not exist
java.io.FileNotFoundException: File file:/home/livy/.sparkStaging/application_1528398117244_0054/livy-examples-0.4.0-SNAPSHOT.jar does not exist
at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:598)
...
从纱线不可避免的失败


有人有什么想法吗?我很乐意听到Livy的替代品,如果有…

我通过使用字符串
mvn clean package-DskipTests-Dspark-2.2.0.cloudera2-Dscala-2.10构建Livy解决了这个问题。这个版本已经过时,有一个坏的UI,一些Scala测试失败,因此必须跳过它们,我没有费心研究指定
2.2.0.cloudera2
的工作方式或原因。我还必须在集群上安装Hue及其相关服务。没有其他的Livy发行版,二进制或源代码,有效