在unix中获取逗号分隔的不同值_Unix_Awk

在unix中获取逗号分隔的不同值

unix awk

在unix中获取逗号分隔的不同值,unix,awk,Unix,Awk,我有一个unix文件Err_Call_sipregtracking.csv，如下所示 colnum~filename~date~fieldnum~name~value 15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~1~BDA_CA_Code~1 15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~2~ARN_Code~2 15~YYYYMMDD_BDACA_SELFRELATIV

我有一个unix文件Err_Call_sipregtracking.csv，如下所示

colnum~filename~date~fieldnum~name~value
15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~1~BDA_CA_Code~1
15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~2~ARN_Code~2
15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~544~ALL~0
15~YYYYMMDD_BDACA_SELFRELATIVE_ARN~30MAR2016:00:00:00~544~ALL~0

这里的delimeter是

。我希望将name列的不同值放入变量中

我需要的输出是：

'BDA_CA_Code','ARN_Code','ALL'

请帮我做到这一点，我试过了

cat Err_Call_sipregtracking.csv | awk -F'~' '{print $5}' | uniq

输出为：

name
BDA_CA_Code
ARN_Code
ALL

但我不希望结果中出现标题，我还希望它们以引号和逗号分隔。

这里的关键是将值存储在数组中，因此您可以打印所有元素：

$ awk -F'~' 'NR>1{item[$5]} END {for (i in item) print i}' file
ARN_Code
BDA_CA_Code
ALL

注意使用

NR>1

跳过标题

然后，您可以使用

printf“\047%s\047\n”，i

打印用单引号包装的元素，因为

print“\047hello\047”

打印

'hello'

：

$ awk -F'~' 'NR>1{item[$5]} END {for (i in item) printf "\047%s\047\n", i}' file
'ARN_Code'
'BDA_CA_Code'
'ALL'

要将这些项目连接到以逗号分隔的项目列表中，只需在从第二个项目开始的每个项目之前打印一个逗号（）：

在行动中看到它：

$ awk -F'~' 'NR>1{item[$5]} END {for (i in item) printf "%s\047%s\047", (++c>1 ? "," : ""), i; print ""}' file
'ARN_Code','BDA_CA_Code','ALL'

这可能不是很优化，但有效：

tail -n+2 Newfile.csv | awk -F'~' '{$5="\""$5"\""; print $5}' | uniq | tr '\n' ',' | sed 's/\,$/\n/'

如果您想要单引号：

tail -n+2 Newfile.csv | awk -F'~' '{a = "'"'"'"; print a $5 a}' | uniq | tr '\n' ',' | sed 's/\,$/\n/'

说明：

```
tail-n+2 Newfile.csv
```
省略第一行
```
awk-F'~'''{$5=“\'$5”\”；print$5}'
```
提取第5列并用引号将其括起来（对于单引号，请注意引号打印是多么的复杂，可能有一种解决方法）
```
uniq
```
删除重复项
```
tr'\n''，'
```
用逗号替换换行符
```
sed's/\，$/\n/'
```
删除最后一个逗号，并用换行符替换它（为了输出可读性）

$ var=$(awk  -v FS="~" 'NR>1 && !($5 in field){printf "\047%s\047,",$5;field[$5]}' Err_Call_sipregtracking.csv)
$ var="${var%,}" #Stripping the trailing comma
$ echo "$var"
'BDA_CA_Code','ARN_Code','ALL'

注释

我使用了octal
```
\047
```
作为他在评论中建议的单引号。看
还要检查GNU文档

sed 1d

cut

printf

printf "'%s'\n" $(sed 1d Err_Call_sipregtracking.csv | cut -d~ -f5 | sort -u)

printf "'%s'," $(sed 1d Err_Call_sipregtracking.csv | cut -d~ -f5 | sort -u)|sed 's/,$//'

cat Err|u Call|sipregtracking | awk-F'~'''{print$5}'| uniq | sed 1d | sed-n-e'H${x；s/\n/，/g；s/^，//；p；}'

cat文件| awk'things'

awk

awk

awk

NR>1

uniq

这些命令远远超出了awk的范围，文本处理

awk-F'~''NR>1{item[$5]}END{for（I in item）printf”%s\047%s\047“，（++c>1？”，“：”），I；print'}文件

print“\'''i”\''''

print“\047”i“\047”

awk'BEGIN{print“\x27foo！\x27”}

-vq=“””

-v

！查看[$5]+

\047

“

'foo.bar'

$0~（q“foo\\.bar”q）

/\047foo\.bar\047/

$0~

\0

\n

\r\n

printf”“

print”“

ORS

\n

\r\n

print”“

or

printf“\n”

printf "'%s'," $(sed 1d Err_Call_sipregtracking.csv | cut -d~ -f5 | sort -u)|sed 's/,$//'

$ awk -F'~' 'NR>1 && !seen[$5]++{printf "%s\047%s\047", (NR>2 ? "," : ""), $5} END{print ""}' file
'BDA_CA_Code','ARN_Code','ALL'