comparator不适用于python中Hadoop流媒体中的大数据_Python_Sorting_Hadoop Streaming

comparator不适用于python中Hadoop流媒体中的大数据

python sorting

comparator不适用于python中Hadoop流媒体中的大数据,python,sorting,hadoop-streaming,Python,Sorting,Hadoop Streaming,运行此命令对数据进行排序： -D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator\ -D mapreduce.partition.keycomarator.options=-k1n，2n\ 我可以在我的减速器中看到相同的键，但它们不是按顺序排列的格式为键（字段1）\t键（字段2）|由分隔的值| 它是为小数据集运行的，但当我获取大

运行此命令对数据进行排序： -D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator\ -D mapreduce.partition.keycomarator.options=-k1n，2n\

我可以在我的减速器中看到相同的键，但它们不是按顺序排列的

格式为键（字段1）\t键（字段2）|由分隔的值|

它是为小数据集运行的，但当我获取大数据集时，数据被分区但没有排序。有人能帮我吗？

我运行了hadoop流的命令。我的mappers和reducers文件是pythonca格式的。你能显示你的命令和输入输出示例吗？