如何使用python从pcap文件中筛选字符串?

如何使用python从pcap文件中筛选字符串?,python,filter,wireshark,pcap,Python,Filter,Wireshark,Pcap,我有一些大的pcap文件(每个约100MB),我想过滤掉那些包含字典文件(txt)字符串的数据包。字典文件的格式如下: line 1: word1 line 2: word2 line 3: word3 line 4: word4 因此,如果word1出现在pcap文件中的任何位置(应该在TCP负载中?),我想删除该字符串,或者只是想从pcap文件中删除该数据包。 有什么方法可以有效地(足够快地)做到这一点吗?我是自己想出来的。对于其他用户,Tshark在搜索tcp流中的字符串时非常有用。如果

我有一些大的pcap文件(每个约100MB),我想过滤掉那些包含字典文件(txt)字符串的数据包。字典文件的格式如下:

line 1: word1
line 2: word2
line 3: word3
line 4: word4
因此,如果word1出现在pcap文件中的任何位置(应该在TCP负载中?),我想删除该字符串,或者只是想从pcap文件中删除该数据包。
有什么方法可以有效地(足够快地)做到这一点吗?

我是自己想出来的。对于其他用户,Tshark在搜索tcp流中的字符串时非常有用。如果要搜索字符串并输出源和目标的ip地址,以下内容可能很有用:

tshark -r <capture-file> -T fields -e ip.src -e ip.dst -e data |\
 grep `echo -n "<ascii-string>" | xxd -p` |\
 cut -f 1,2

你是说如果文件包含字符串,你想从中删除行吗?您可能想要澄清您正在尝试做什么,到目前为止您已经尝试了什么,并显示一些输入和预期输出。如果你有内存限制,你能说明你被限制的内存量吗?我现在没有任何内存限制。输入文件是一个普通pcap文件,包含网络中各种主机的流量。当我跟踪一些主机的TCP流时,我在pcap文件中发现了许多我不想要的不正确内容(成人内容)。因此,我想从pcap文件中去掉这些数据包/帧或行。由于stackoverflow不是代码编写服务,我将您的问题简化为您正在寻找一种使用Python修改pcap的方法,并且您将自己实现特定的修改。当你这样解释你的问题时,你的问题是重复的
value=`cat bad_words.txt`

for i in ${value[@]}; do tshark -r my_test.pcap -T fields -e ip.src -e ip.dst -e data |\
 grep `echo -n $i | xxd -p` |\
 cut -f 1| uniq > $i; echo $i; done