Statistics 来自netflow的数据包配置文件

Statistics 来自netflow的数据包配置文件,statistics,average,netflow,Statistics,Average,Netflow,我有上个月的netflow数据,每5分钟一个文件,我想做一个所有这些流量的数据包配置文件。我需要1个数据包流,2个数据包流等的百分比表示。它可以在类别,如1个数据包流,1-100个数据包流,100和更多。。。没那么重要。但我的问题是怎么做。如何对无法相加的数据进行百分比表示?类似于对每个文件进行百分比表示,然后对其进行某种类型的平均?我不能相加是什么意思?实际上,如果您查看手册,可以使用:-R expr/dir/file1:file2从file1到file2读取所有文件。距离 nfdump -R

我有上个月的netflow数据,每5分钟一个文件,我想做一个所有这些流量的数据包配置文件。我需要1个数据包流,2个数据包流等的百分比表示。它可以在类别,如1个数据包流,1-100个数据包流,100和更多。。。没那么重要。但我的问题是怎么做。如何对无法相加的数据进行百分比表示?类似于对每个文件进行百分比表示,然后对其进行某种类型的平均?

我不能相加是什么意思?实际上,如果您查看手册,可以使用:-R expr/dir/file1:file2从file1到file2读取所有文件。距离

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

将在16:09至16:39收集网络流量信息。然后,您可以对该数据执行所需的任何查询。

这听起来像是在描述直方图:您创建的“箱”大小与您用原始计数描述的大小相同。BIN的计数之和为会话总数。要获得总流量的百分比,只需将每个存储单元除以总流量计数即可正常化

因此,如果你做一个两箱柱状图,其中第一箱是小于100个数据包流的所有会话的计数,而其他100+个数据包流注意到不存在间隙或重叠,并且计算出前者为30个数据流,后者为60个,那么流的总数为90,并且有33%的流少于100个数据包

处理多个文件时,诀窍是始终使用相同的bin描述,并尽可能长时间地存储和处理原始计数,最后一步仅导出%s。只要柱状图的存储单元表示相同的内容,就可以毫不费力地将柱状图相加,然后在对结果进行规格化时,每个存储单元都有所有文件的总百分比。如果需要添加文件,只需跟踪原始计数,以便在有新数据时可以重新规范化

在Matlab这样的工具中可以很容易地完成这项工作,但要小心,因为这些工具中的许多工具都会自动为您确定垃圾箱的宽度。因此,一个文件的柱状图可能有{x<100,100=200}和另一个文件{x<90,90=180},您将无法将结果相加