Json LC_ALL=C是否应始终用于非特定于语言环境的sed操作？_Json_Bash_Sed_Centos7

Json LC_ALL=C是否应始终用于非特定于语言环境的sed操作？

json bash sed

Json LC_ALL=C是否应始终用于非特定于语言环境的sed操作？,json,bash,sed,centos7,Json,Bash,Sed,Centos7,在使用jq进行操作之前，我有带注释的JSON文件。我刚刚遇到了一个有趣的问题，我收到了一个带有注释的JSON文件，其中包含一些富文本引号字符（hex 93和hex 94）。我现有的sed点字符与这些字符不匹配。下面是一个演示：首先，输入： % echo -e '# \x93text\x94\n{"a":1}' | od -c 0000000 # 223 t e x t 224 \n { " a " : 1 } 0000020 \n 0

在使用

jq

进行操作之前，我有带注释的JSON文件。我刚刚遇到了一个有趣的问题，我收到了一个带有注释的JSON文件，其中包含一些富文本引号字符（hex 93和hex 94）。我现有的sed点

字符与这些字符不匹配。下面是一个演示：

首先，输入：

% echo -e '# \x93text\x94\n{"a":1}' | od -c
0000000   #     223   t   e   x   t 224  \n   {   "   a   "   :   1   }
0000020  \n
0000021
%

这里是转换：

% echo -e '# \x93text\x94\n{"a":1}' | sed 's/^\s*#.*//' | od -c
0000000 223   t   e   x   t 224  \n   {   "   a   "   :   1   }  \n
0000017
%

请注意，sed表达式中的点字符与十六进制93字符不匹配。但是，如果我包括

LC\u ALL=C

：

% echo -e '# \x93text\x94\n{"a":1}' | LC_ALL=C sed 's/^\s*#.*//' | od -c
0000000  \n   {   "   a   "   :   1   }  \n
0000011
%

然后sed表达式中的点字符与十六进制93和94字符匹配。sed文档部分提到了括号表达式，但是上面的行为似乎证明了这个问题发生在其他地方

有趣的是，删除而不是替换并没有显示此问题：

% echo -e '# \x93text\x94\n{"a":1}' | sed '/^\s*#.*/d' | od -c         
0000000   {   "   a   "   :   1   }  \n
0000010

考虑到我操作的是带注释的JSON文件，我认为向sed语句添加

LC_ALL=C

的解决方案是合理的

那么，我的问题是：是否使用了

LC_ALL=C

一些我在执行非特定于语言环境的

sed

转换时总是想使用的东西（适用于带注释的JSON文件）？如果没有，有什么替代方案可以避免我上面提到的问题

我的环境：

CentOS 7.3[kernel-3.10.0-514.6.1.el7.x86_64]
sed（gnused）4.2.2[sed-4.2.2-5.el7.x86_64]
Bash 4.2.46（1）[Bash-4.2.46-21.el7_3.x86_64]

在C语言环境中，字符为单字节

echo -e '# \x93text\x94\n{"a":1}' | LC_ALL=C sed 's/[^[:alnum:]]/[HERE:&] /g' | od -c
0000000   [   H   E   R   E   :   #   ]       [   H   E   R   E   :
0000020   ]       [   H   E   R   E   : 223   ]       t   e   x   t   [
0000040   H   E   R   E   : 224   ]      \n   [   H   E   R   E   :   {
0000060   ]       [   H   E   R   E   :   "   ]       a   [   H   E   R
0000100   E   :   "   ]       [   H   E   R   E   :   :   ]       1   [
0000120   H   E   R   E   :   }   ]      \n

[[:alnum:]

[^[:alnum:]

在C语言环境中，字符为单字节

echo -e '# \x93text\x94\n{"a":1}' | LC_ALL=C sed 's/[^[:alnum:]]/[HERE:&] /g' | od -c
0000000   [   H   E   R   E   :   #   ]       [   H   E   R   E   :
0000020   ]       [   H   E   R   E   : 223   ]       t   e   x   t   [
0000040   H   E   R   E   : 224   ]      \n   [   H   E   R   E   :   {
0000060   ]       [   H   E   R   E   :   "   ]       a   [   H   E   R
0000100   E   :   "   ]       [   H   E   R   E   :   :   ]       1   [
0000120   H   E   R   E   :   }   ]      \n

[[:alnum:]

[^[:alnum:]

echo-e'\x93text\x94\n{“a”：1}'| sed'/^[：space:][s/.*.*/s/[HERE]/'/od-c

0000000[he re]223 t x t 224\n{“a 0000020”：1}\n

LC_ALL=C

echo-e'\x93text\x94\n{“a”：1}sed'/^[[：space:][]*#.*/s/[HERE]/'| od-c

0000000[HERE]223tex224\n{“a 0000020”：1}\n

LC_ALL=C

export LC_ALL=C

s/$locale\u WORD/$REPLACEMENT/

LC\u ALL=C

export LC_ALL=C

s/$locale\u WORD/$REPLACEMENT/

LC\u ALL=C