Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/354.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 熊猫:计算分组在一起的类似列的平均值、var_Python_Pandas_Ip - Fatal编程技术网

Python 熊猫:计算分组在一起的类似列的平均值、var

Python 熊猫:计算分组在一起的类似列的平均值、var,python,pandas,ip,Python,Pandas,Ip,尝试使用pandas对网络跟踪数据进行分析。我已读取转储文件并创建了以下DataFrame: 因此,为了检测数据框中的单个流,我使用以下代码段,根据['ip_src'、'ip_dst'、'sport'、'ip_proto'、'service']对整个数据框进行分组: flow = ['ip_src', 'ip_dst', 'sport', 'dport', 'ip_proto', 'service'] grp1 = data2.groupby(flow, sort=False) 因此,当我对

尝试使用pandas对网络跟踪数据进行分析。我已读取转储文件并创建了以下
DataFrame

因此,为了检测
数据框中的单个流,我使用以下代码段,根据
['ip_src'、'ip_dst'、'sport'、'ip_proto'、'service']
对整个
数据框进行分组:

flow = ['ip_src', 'ip_dst', 'sport', 'dport', 'ip_proto', 'service']
grp1 = data2.groupby(flow, sort=False)
因此,当我对
data2
的前二十行执行
grp1.size()
时,我得到以下信息:

我现在想做的是计算
ip_len
平均值
packet_len
var
ip_len
packet_len
和包间到达时间的
平均值
(使用属于同一流的包的
时间戳

如何在pandas中实现这一点,以便我获得的数据帧包含每个流的统计信息,即列应包含
ip_src
ip_dst
sport
dport
ip_proto
service
,以及前面计算的平均值和var值。我尝试了
aggr
apply
两种方法,但都没有成功。提前谢谢

data2.groupby(['colName1','colName2']).mean() 

应该做这项工作。

这些答案有帮助吗?