Python 将数据帧转换为矩阵
最终,我必须对数据集执行矩阵操作 我想弄明白的是如何获取堆积的数据(特别是来自SQL的数据)并将其转换为矩阵?(它可以是2d numpy阵列) 假设我的SQL查询返回以下类型的内容:Python 将数据帧转换为矩阵,python,pandas,Python,Pandas,最终,我必须对数据集执行矩阵操作 我想弄明白的是如何获取堆积的数据(特别是来自SQL的数据)并将其转换为矩阵?(它可以是2d numpy阵列) 假设我的SQL查询返回以下类型的内容: Name Data Value a 2016-05-01 5 b 2016-05-01 7 c 2016-05-01 7 a 2016-06-01 4 b 2016-06-01 3 c 2016-06-01 2 d 2016-06-
Name Data Value
a 2016-05-01 5
b 2016-05-01 7
c 2016-05-01 7
a 2016-06-01 4
b 2016-06-01 3
c 2016-06-01 2
d 2016-06-01 2
我想要的输出是
Data/Name a b c d
2016-05-01 5 7 7 NaN
2016-06-01 4 3 2 2
我知道我可以循环所有的值,但我在这里寻找的是性能。是否有更直接/快速/通灵的方法?针对数据帧使用该函数
对于给定的df
:
df
Out[19]:
Name Data Value
0 a 2016-05-01 5
1 b 2016-05-01 7
2 c 2016-05-01 7
3 a 2016-06-01 4
4 b 2016-06-01 3
5 c 2016-06-01 2
6 d 2016-06-01 2
通过设置要从原始数据帧使用的索引和列来调用pivot
:
df.pivot('Data', 'Name')
Out[20]:
Value
Name a b c d
Data
2016-05-01 5.0 7.0 7.0 NaN
2016-06-01 4.0 3.0 2.0 2.0
非常感谢!我可以为缺少的值选择一个值吗?
df.pivot('Data','Name').fillna(42.0)