需要一个文件中的子字符串模式的grep帮助,并与另一个文件进行匹配,以查看该模式是否存在

需要一个文件中的子字符串模式的grep帮助,并与另一个文件进行匹配,以查看该模式是否存在,grep,Grep,我有一个这样的输入平面文件,有许多行: Apr 3 13:30:02 aag8-ca-acs01-en2 CisACS_01_PassedAuth p1n5ut5s 1 0 Message-Type=Authen OK,User-Name=joe7@it.test.com,NAS- IP-Address=4.196.63.55,Caller-ID=az-4d-31-89-92-90,EAP Type=17,EAP Type Name=LEAP,Response Time=0, Apr

我有一个这样的输入平面文件,有许多行:

Apr  3 13:30:02 aag8-ca-acs01-en2 CisACS_01_PassedAuth p1n5ut5s 1 0   Message-Type=Authen OK,User-Name=joe7@it.test.com,NAS-  IP-Address=4.196.63.55,Caller-ID=az-4d-31-89-92-90,EAP Type=17,EAP Type Name=LEAP,Response Time=0,
Apr  3 13:30:02 aag8-ca-acs01-en2 CisACS_01_PassedAuth p1n6ut5s 1 0 Message-Type=Authen OK,User-Name=bobe@jg.test.com,NAS-IP-Address=4.197.43.55,Caller-ID=az-4d-4q-x8-92-80,EAP Type=17,EAP Type Name=LEAP,Response Time=0,
Apr  3 13:30:02 abg8-ca-acs01-en2 CisACS_01_PassedAuth p1n4ut5s 1 0 Message-Type=Authen OK,User-Name=jerry777@it.test.com,NAS-IP-Address=7.196.63.55,Caller-ID=az-4d-n6-4e-y2-90,EAP Type=17,EAP Type Name=LEAP,Response Time=0,
Apr  3 13:30:02 aca8-ca-acs01-en2 CisACS_01_PassedAuth p1n4ut5s 1 0 Message-Type=Authen OK,User-Name=frctom@pe.test.com,NAS-IP-Address=4.196.263.55,Caller-ID=az-4d-x1-d3-c2-90,EAP Type=17,EAP Type Name=LEAP,Response Time=0,
Apr  3 13:30:02 aag8-ca-acs01-en2 CisACS_01_PassedAuth p1n4ut5s 1 0 Message-Type=Authen OK,User-Name=frc77@xed.test.com,NAS-IP-Address=4.136.163.55,Caller-ID=az-4d-4w-b5-s2-90,EAP Type=17,EAP Type Name=LEAP,Response Time=0,
Apr  3 13:30:02 aag8-ca-acs01-en2 CisACS_01_PassedAuth p1n4ut5s 1 0 Message-Type=Authen OK,User-Name=petejg@it.test.com,NAS-IP-Address=4.136.62.55,Caller-ID=az-4e-31-x3-92-c0,EAP Type=17,EAP Type Name=LEAP,Response Time=0
我正在尝试对输入文件中的电子邮件地址进行grep,以查看它们是否已经存在于主文件中

主平面文件如下所示:

a44e31999290;frc777o.@it.test.com;20150403
az4d4qx89280;bobe@jg.test.com;20150403
0dbgd0fed04t;rrfuf@us.test.com;20150403
28cbe9191d53;rttuu4en@us.test.com;20150403
az4d4wb5s290;frc77@xed.test.com;20150403
d89695174805;ccis6n@cn.test.com;20150403
s00dbg0fe04t;rrfuuuf@be.test.com;20150403
如果邮件在master中不存在,我需要一个简单的计数。因此,使用这些示例,我希望看到'count=5(bobe@jg.test.com & frc77@xed.test.com存在于主人之中,但其他人不存在)

我尝试过各种grep组合,下面的一个是我上次测试的,但仍然不起作用。。我在perl脚本中使用它来首先捕获电子邮件,然后对它们进行计数,但我真正需要的是从主文件中不存在的输入文件中计数电子邮件


grep-o-p'(?这不完全是一行,但这对我来说很有用:

for email in $(sed "s/.*User-Name=\(.[^,]*\),.*/\1/g" input.txt); do
grep -oc $email master.txt
done | sort | uniq -c | awk '{if ($2==0) print $1}' 
说明:

sed命令从输入文件中获取一个干净的电子邮件地址列表:

$ sed "s/.*User-Name=\(.[^,]*\),.*/\1/g" input.txt
joe7@it.test.com
bobe@jg.test.com
jerry777@it.test.com
frctom@pe.test.com
frc77@xed.test.com
petejg@it.test.com
grep命令在主文件中查找这些地址,并且(由于-c标志)返回0表示不匹配,返回1表示匹配:

$ for email in $(sed "s/.*User-Name=\(.[^,]*\),.*/\1/g" input.txt); do 
$ grep -oc $email master.txt 
$ done
0
1
0
0
1
0        
sort和uniq命令获取匹配和非匹配的频率:

$ |sort | uniq -c 
4 0
2 1
最后,awk命令打印出不匹配的数量(仅当第二列为0时,它才会打印第一列):


谢谢你的解释,非常感谢!
$ awk '{if ($2==0) print $1}' 
4