Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/344.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何从大型数据集中提取特定行集以查找统计操作。每一组的两边都增加1?_Python_Python 3.x_Pandas_Statistics - Fatal编程技术网

Python 如何从大型数据集中提取特定行集以查找统计操作。每一组的两边都增加1?

Python 如何从大型数据集中提取特定行集以查找统计操作。每一组的两边都增加1?,python,python-3.x,pandas,statistics,Python,Python 3.x,Pandas,Statistics,我想从大型数据集(.mat)中找到一些统计操作,如均值、中位数、标准差和方差。比如说,它包含1000*1。 在这里,我想为每10行查找平均值和中值等,并将其保留在新列中。i、 e 类似地,中位数、标准差等这些值保持在col1(平均值)中;col2(中值)、col3(变异)和col4(标准差)。 我能够为我的整个数据集解决这些特性。但在这里,每次索引在两个方向上都增加1 我应该写的意思是,中位数。。。函数在FOR循环本身中或单独使用。你能给我举个例子吗 这是我的代码!!!但在产量方面没有运气 已签

我想从大型数据集(.mat)中找到一些统计操作,如均值、中位数、标准差和方差。比如说,它包含1000*1。
在这里,我想为每10行查找平均值和中值等,并将其保留在新列中。i、 e

类似地,中位数、标准差等这些值保持在col1(平均值)中;col2(中值)、col3(变异)和col4(标准差)。 我能够为我的整个数据集解决这些特性。但在这里,每次索引在两个方向上都增加1

我应该写的意思是,中位数。。。函数在FOR循环本身中或单独使用。你能给我举个例子吗

这是我的代码!!!但在产量方面没有运气


已签入堆栈门户。但我没有发现两边都是递增的,也没有发现这些特性。请帮帮我。

熊猫通过以下方式提供即时统计数据:;例如,如果

values = pd.Series(np.random.uniform(size=1000))
然后,您可以使用

values.rolling(window=10).agg([np.mean, np.median, np.var, np.std])

非常感谢您的回复。它在两个方向上都增加一吗?我应该加入循环吗!我对数据科学非常陌生。比如说,第一列的
i
th值是值的平均值。
i-10+1
i
;尝试在
np.arange(1000)
上运行它,并检查结果是否符合您的期望。谢谢,我正在得到我需要的。但我这里有一个.mat文件。我试图通过将mat文件转换为.csv或txt文件来读取mat文件,但没有成功。我得到的前9个值是无。这些值是NaN,因为它们前面没有10个值,所以这是预期的行为。值=pd.Series(np.random.uniform(size=1000))这里1000是不固定的。我想要一个.mat文件。给出了前1到20个值(51,57,62,66,70,73,76,77,77,76,73,70,66,62,57,0,46,41,36,32…)。这里的大小取自我的mat1文件,或者随机取1000个数字。
values = pd.Series(np.random.uniform(size=1000))
values.rolling(window=10).agg([np.mean, np.median, np.var, np.std])