Performance 使用EmEditor优化列数据中的多元素排序/重复数据消除
在处理大型分隔文件时,当前对列中的元素(通常是用分号分隔的元素,但可以是任何字符)进行排序/消除重复的最简单方法似乎是通过 “拆分列方法”Performance 使用EmEditor优化列数据中的多元素排序/重复数据消除,performance,emeditor,Performance,Emeditor,在处理大型分隔文件时,当前对列中的元素(通常是用分号分隔的元素,但可以是任何字符)进行排序/消除重复的最简单方法似乎是通过 “拆分列方法”document.SplitColumn,然后使用合并行方法document.CombineLines(根据需要使用相关方法参数进行排序/重复数据消除) 当文件不是很大时,这可以正常工作,但我想知道是否有一种更快/更优化的方法可以在较大的分隔文件(百万行以上)上执行此常见任务,特别是通过宏/方法。请将EmEditor更新到v20.1.901或更高版本,并使用此
document.SplitColumn
,然后使用合并行方法document.CombineLines
(根据需要使用相关方法参数进行排序/重复数据消除)
当文件不是很大时,这可以正常工作,但我想知道是否有一种更快/更优化的方法可以在较大的分隔文件(百万行以上)上执行此常见任务,特别是通过宏/方法。请将EmEditor更新到v20.1.901或更高版本,并使用此表单:
document.SplitColumn("3",";",eeSplitIntoNone,"A+",eeRemoveDuplicates | eeSortIgnorePrefix | eeSortStable,0);
这个新的
eesplitintoone
类型实际上不会分割,只会对元素的重复项进行排序或删除。太好了,我会尝试一下。谢谢