comparator不适用于python中Hadoop流媒体中的大数据

comparator不适用于python中Hadoop流媒体中的大数据,python,sorting,hadoop-streaming,Python,Sorting,Hadoop Streaming,运行此命令对数据进行排序: -D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator\ -D mapreduce.partition.keycomarator.options=-k1n,2n\ 我可以在我的减速器中看到相同的键,但它们不是按顺序排列的 格式为键(字段1)\t键(字段2)|由分隔的值| 它是为小数据集运行的,但当我获取大

运行此命令对数据进行排序: -D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator\ -D mapreduce.partition.keycomarator.options=-k1n,2n\

我可以在我的减速器中看到相同的键,但它们不是按顺序排列的

格式为键(字段1)\t键(字段2)|由分隔的值|
它是为小数据集运行的,但当我获取大数据集时,数据被分区但没有排序。有人能帮我吗?

我运行了hadoop流的命令。我的mappers和reducers文件是pythonca格式的。你能显示你的命令和输入输出示例吗?