Python 2.7 熊猫-创建两列-简单,不是吗?
大家好 我想创建一个名为df的(panda)数据集。此df panda表单必须包含“Id”和“Feature”列。你知道怎么做吗 我已经完成了以下代码,但是。。。这些@字典很乱,随机放在两列中。我希望“Id”作为第一列,“Feature”作为第二列 提前谢谢你!祝你周末愉快Python 2.7 熊猫-创建两列-简单,不是吗?,python-2.7,pandas,Python 2.7,Pandas,大家好 我想创建一个名为df的(panda)数据集。此df panda表单必须包含“Id”和“Feature”列。你知道怎么做吗 我已经完成了以下代码,但是。。。这些@字典很乱,随机放在两列中。我希望“Id”作为第一列,“Feature”作为第二列 提前谢谢你!祝你周末愉快 df = DataFrame({'Feature': X["Feature"],'Id': X["Id"] }) 如果这是你想要的 import pandas as pd data=["id","Feature"] ind
df = DataFrame({'Feature': X["Feature"],'Id': X["Id"] })
如果这是你想要的
import pandas as pd
data=["id","Feature"]
index=[1,2]
s = pd.Series(data,index=index)
df = pd.DataFrame(np.random.randn(2,2), index=index, columns=('id','features'))
数据帧:
>>df['id']
1 0.254105
2 -0.132025
Name: id, dtype: float64
>>df['features']
1 0.189972
2 2.262103
Name: features, dtype: float64
从“如果没有传递任何列,则列将是dict键的排序列表”中,我使用这个简单的技巧来排列列。只需在列名的开头加上“1”、“2”等。例如:
>>>> df1 = pd.DataFrame({"Id":[1,2,3],"Feature":[5,6,7]})
>>>> df1
Feature Id
0 5 1
1 6 2
2 7 3
>>>> df2 = pd.DataFrame({"1Id":[1,2,3],"2Feature":[5,6,7]})
>>>> df2
1Id 2Feature
0 1 5
1 2 6
2 3 7
>>>> df2.columns = ["Id","Feature"]
>>>> df2
Id Feature
0 1 5
1 2 6
2 3 7
现在您有了打印或保存数据帧所需的订单 这里的问题是dict中键的顺序本质上不一定与创建顺序相同,您可以在执行
df=df.ix[:,['Id','Feature']]
之后对列重新排序,非常感谢!如果您有任何关于如何在不使用这两个步骤的情况下使用熊猫的想法,我将非常感谢您的帮助。这只是特征选择,但仍然不确定如何处理它。“我希望“Id”作为第一列,“feature”作为第二列”。在我看来,没有什么好的理由想要这样。只有在显示/打印数据帧时,您才需要第二步(例如,print
),在这一步中,您可以使用EdChum的解决方案。。。因此,我试图找到一种方法来分离它们(但主要是为了理解这是如何工作的)。顺序是不相关的,您可以使用名称对列进行索引,这样就不重要了。kinda~我还需要:X[“Id”]和X[“Feature”]中的值,而不仅仅是数据和索引。不过,对于这一误解,我深表歉意,并感谢您的努力。