Statistics 来自netflow的数据包配置文件_Statistics_Average_Netflow

Statistics 来自netflow的数据包配置文件

statistics

Statistics 来自netflow的数据包配置文件,statistics,average,netflow,Statistics,Average,Netflow,我有上个月的netflow数据，每5分钟一个文件，我想做一个所有这些流量的数据包配置文件。我需要1个数据包流，2个数据包流等的百分比表示。它可以在类别，如1个数据包流，1-100个数据包流，100和更多。。。没那么重要。但我的问题是怎么做。如何对无法相加的数据进行百分比表示？类似于对每个文件进行百分比表示，然后对其进行某种类型的平均？我不能相加是什么意思？实际上，如果您查看手册，可以使用：-R expr/dir/file1:file2从file1到file2读取所有文件。距离 nfdump -R

我有上个月的netflow数据，每5分钟一个文件，我想做一个所有这些流量的数据包配置文件。我需要1个数据包流，2个数据包流等的百分比表示。它可以在类别，如1个数据包流，1-100个数据包流，100和更多。。。没那么重要。但我的问题是怎么做。如何对无法相加的数据进行百分比表示？类似于对每个文件进行百分比表示，然后对其进行某种类型的平均？

我不能相加是什么意思？实际上，如果您查看手册，可以使用：-R expr/dir/file1:file2从file1到file2读取所有文件。距离

nfdump -R /yournetflowfolder/nfcapd.201204051609:nfcapd.201204051639

将在16:09至16:39收集网络流量信息。然后，您可以对该数据执行所需的任何查询。

这听起来像是在描述直方图：您创建的“箱”大小与您用原始计数描述的大小相同。BIN的计数之和为会话总数。要获得总流量的百分比，只需将每个存储单元除以总流量计数即可正常化

因此，如果你做一个两箱柱状图，其中第一箱是小于100个数据包流的所有会话的计数，而其他100+个数据包流注意到不存在间隙或重叠，并且计算出前者为30个数据流，后者为60个，那么流的总数为90，并且有33%的流少于100个数据包

处理多个文件时，诀窍是始终使用相同的bin描述，并尽可能长时间地存储和处理原始计数，最后一步仅导出%s。只要柱状图的存储单元表示相同的内容，就可以毫不费力地将柱状图相加，然后在对结果进行规格化时，每个存储单元都有所有文件的总百分比。如果需要添加文件，只需跟踪原始计数，以便在有新数据时可以重新规范化

在Matlab这样的工具中可以很容易地完成这项工作，但要小心，因为这些工具中的许多工具都会自动为您确定垃圾箱的宽度。因此，一个文件的柱状图可能有{x<100，100=200}和另一个文件{x<90，90=180}，您将无法将结果相加