无法运行hadoop流作业:缺少必需的选项:输入、输出
我正在尝试在DSE 3.1分析服务器集群上运行流媒体作业。我使用Cassandra CFs作为输入。但它抱怨输入和输出参数,但它们被设置了(我设置它只是因为抱怨): 获取“错误流。StreamJob:缺少必需的选项:输入,输出”。我尝试了不同的输入和输出,不同的输出格式,但得到了相同的错误无法运行hadoop流作业:缺少必需的选项:输入、输出,hadoop,cassandra,streaming,datastax,Hadoop,Cassandra,Streaming,Datastax,我正在尝试在DSE 3.1分析服务器集群上运行流媒体作业。我使用Cassandra CFs作为输入。但它抱怨输入和输出参数,但它们被设置了(我设置它只是因为抱怨): 获取“错误流。StreamJob:缺少必需的选项:输入,输出”。我尝试了不同的输入和输出,不同的输出格式,但得到了相同的错误 我做错了什么?输入应该是HDFS上的现有路径,而输出应该是HDFS上的不存在路径我注意到命令的这一部分没有尾随反斜杠: ... -D cassandra.input.thrift.address=10.0.0
我做错了什么?输入应该是HDFS上的现有路径,而输出应该是HDFS上的不存在路径我注意到命令的这一部分没有尾随反斜杠:
...
-D cassandra.input.thrift.address=10.0.0.1
...
也许这会把后面的行搞糟?我还注意到你的命令有一个错误:
...
-D cassandra.input.partitioner.class="MurMur3Partitioner" \
...
该类应为“Murrur3Partitioner”我不使用HDFS:-inputformat org.apache.cassandra.hadoop.ColumnFamilyInputFormat
...
-D cassandra.input.partitioner.class="MurMur3Partitioner" \
...