无法运行hadoop流作业:缺少必需的选项:输入、输出

无法运行hadoop流作业:缺少必需的选项:输入、输出,hadoop,cassandra,streaming,datastax,Hadoop,Cassandra,Streaming,Datastax,我正在尝试在DSE 3.1分析服务器集群上运行流媒体作业。我使用Cassandra CFs作为输入。但它抱怨输入和输出参数,但它们被设置了(我设置它只是因为抱怨): 获取“错误流。StreamJob:缺少必需的选项:输入,输出”。我尝试了不同的输入和输出,不同的输出格式,但得到了相同的错误 我做错了什么?输入应该是HDFS上的现有路径,而输出应该是HDFS上的不存在路径我注意到命令的这一部分没有尾随反斜杠: ... -D cassandra.input.thrift.address=10.0.0

我正在尝试在DSE 3.1分析服务器集群上运行流媒体作业。我使用Cassandra CFs作为输入。但它抱怨输入和输出参数,但它们被设置了(我设置它只是因为抱怨):

获取“错误流。StreamJob:缺少必需的选项:输入,输出”。我尝试了不同的输入和输出,不同的输出格式,但得到了相同的错误


我做错了什么?

输入应该是HDFS上的现有路径,而输出应该是HDFS上的不存在路径

我注意到命令的这一部分没有尾随反斜杠:

...
-D cassandra.input.thrift.address=10.0.0.1
...

也许这会把后面的行搞糟?

我还注意到你的命令有一个错误:

...    
-D cassandra.input.partitioner.class="MurMur3Partitioner" \
...

该类应为“Murrur3Partitioner”

我不使用HDFS:-inputformat org.apache.cassandra.hadoop.ColumnFamilyInputFormat
...    
-D cassandra.input.partitioner.class="MurMur3Partitioner" \
...