Utf 8 如何强制uniq在em破折号和en破折号之间进行区分?
Utf 8 如何强制uniq在em破折号和en破折号之间进行区分?,utf-8,character-encoding,special-characters,uniq,Utf 8,Character Encoding,Special Characters,Uniq,uniq(GNU coreutils 8.5)似乎无法区分em破折号和en破折号: $echo-e“a-b\na-b”| uniq-c 2 a–b 有没有办法强迫这种区别?我尝试了LC_COLLATE的各种设置,但运气不佳。对我有效 echo -e "a–b\na—b" | LC_COLLATE=C uniq -c 1 a–b 1 a—b 我懂了。我在尝试各种排列的LC\u COLLATE=en\u GB.utf8假设它必须是utf8才能工作LC_COLLATE=
uniq
(GNU coreutils 8.5)似乎无法区分em破折号和en破折号:
$echo-e“a-b\na-b”| uniq-c
2 a–b
有没有办法强迫这种区别?我尝试了LC_COLLATE的各种设置,但运气不佳。对我有效
echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
1 a–b
1 a—b
我懂了。我在尝试各种排列的
LC\u COLLATE=en\u GB.utf8
假设它必须是utf8
才能工作LC_COLLATE=C
产生预期结果。干杯