Utf 8 如何强制uniq在em破折号和en破折号之间进行区分?

Utf 8 如何强制uniq在em破折号和en破折号之间进行区分?,utf-8,character-encoding,special-characters,uniq,Utf 8,Character Encoding,Special Characters,Uniq,uniq(GNU coreutils 8.5)似乎无法区分em破折号和en破折号: $echo-e“a-b\na-b”| uniq-c 2 a–b 有没有办法强迫这种区别?我尝试了LC_COLLATE的各种设置,但运气不佳。对我有效 echo -e "a–b\na—b" | LC_COLLATE=C uniq -c 1 a–b 1 a—b 我懂了。我在尝试各种排列的LC\u COLLATE=en\u GB.utf8假设它必须是utf8才能工作LC_COLLATE=

uniq
(GNU coreutils 8.5)似乎无法区分em破折号和en破折号:

$echo-e“a-b\na-b”| uniq-c

  2 a–b
有没有办法强迫这种区别?我尝试了LC_COLLATE的各种设置,但运气不佳。

对我有效

echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
      1 a–b
      1 a—b

我懂了。我在尝试各种排列的
LC\u COLLATE=en\u GB.utf8
假设它必须是
utf8
才能工作
LC_COLLATE=C
产生预期结果。干杯