Utf 8 如何强制uniq在em破折号和en破折号之间进行区分？_Utf 8_Character Encoding_Special Characters_Uniq

Utf 8 如何强制uniq在em破折号和en破折号之间进行区分？

utf-8 character-encoding

Utf 8 如何强制uniq在em破折号和en破折号之间进行区分？,utf-8,character-encoding,special-characters,uniq,Utf 8,Character Encoding,Special Characters,Uniq,uniq（GNU coreutils 8.5）似乎无法区分em破折号和en破折号： $echo-e“a-b\na-b”| uniq-c 2 a–b 有没有办法强迫这种区别？我尝试了LC_COLLATE的各种设置，但运气不佳。对我有效 echo -e "a–b\na—b" | LC_COLLATE=C uniq -c 1 a–b 1 a—b 我懂了。我在尝试各种排列的LC\u COLLATE=en\u GB.utf8假设它必须是utf8才能工作LC_COLLATE=

uniq

（GNU coreutils 8.5）似乎无法区分em破折号和en破折号：

$echo-e“a-b\na-b”| uniq-c

  2 a–b

有没有办法强迫这种区别？我尝试了LC_COLLATE的各种设置，但运气不佳。

对我有效

echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
      1 a–b
      1 a—b

我懂了。我在尝试各种排列的

LC\u COLLATE=en\u GB.utf8

假设它必须是

utf8

才能工作

LC_COLLATE=C

产生预期结果。干杯