List 引用存储在Python字典对象中的数据帧的特定列
我有一个关于Pandas DataFrame对象的Python字典,看起来像这样(如果这样做更好的话,我可以很容易地将其更改为列表…): 这就是我的钥匙:'东西1','东西2',…'事情5’(有时这些可能是不连续的,比如:“你好,伙计”,“你疯了”,“再见”,“3”,“伙计” 我希望对dict执行操作,以便返回“Actual”列中所有值的新字典/列表。换句话说,我希望:List 引用存储在Python字典对象中的数据帧的特定列,list,python-3.x,dictionary,indexing,pandas,List,Python 3.x,Dictionary,Indexing,Pandas,我有一个关于Pandas DataFrame对象的Python字典,看起来像这样(如果这样做更好的话,我可以很容易地将其更改为列表…): 这就是我的钥匙:'东西1','东西2',…'事情5’(有时这些可能是不连续的,比如:“你好,伙计”,“你疯了”,“再见”,“3”,“伙计” 我希望对dict执行操作,以便返回“Actual”列中所有值的新字典/列表。换句话说,我希望: dict2 = {'Thing 1': df Actual Date
dict2 =
{'Thing 1': df
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
2014-09-17 427.99
2014-09-18 484.87
...
'Thing 5': hf
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
}
然后我想对生成的字典/列表执行一些操作,例如:groupby(pandas.TimeGrouper…,cumsum(),等等。我想不惜一切代价避免“for”循环。我有一个使用“for”的解决方案循环,但它的计算成本很高。我尝试过许多变通方法,但不知道从何开始。我尝试过的都不起作用。我尝试过使用items()、update()和类似方法的多种变体。有什么想法吗…?没有“for”循环和/或快速执行将非常有用。我找到了两种解决此问题的方法 1.)使用PYDSE时,使用自动数据拟合的成本很高。不要这样做 2.)使用全新的电脑而不是10年以上的旧电脑总是很有帮助的。特别是当它是一个满负荷的15英寸MacPro而不是一个预算购买的电子机器
由于这两个发现,我从未正式解决过这个问题,但我认为我应该结束这个问题。不是100%确定您想要什么,但是如何将数据帧存储在pandas面板中?您可以访问类似panelname['Thing 1']['Actual']的列,并执行类似panelname['Thing 1']的操作。groupby('Date')。count()正如Bob所说,这看起来熊猫面板更适合您的数据结构。您可以发布一些生成虚拟数据的代码,并将您当前的代码用于计时。我认为您可以对所有数据帧进行压缩,结果数据帧将具有多索引。然后您可以在不使用for-loop的情况下对计算进行点播。今晚将尝试执行(ET)。我以前在字典上使用过concat。鲍勃,我对pandas面板不太熟悉,但这看起来就像我过去处理字典的方式。当键是顺序键(或我强制键是顺序键)时,我可以循环并完全按照你的建议执行。但是,我不知道“Thing1”、“Thing2”的名称“等等,先天的。对于每个用户来说,它们都是唯一的名称,并且具有唯一的顺序。但是,每个字典项中都有相同的列。我需要能够引用特定的列(dict对象中的每个实际dict项中实际上有6列),并使用这些列中的数据来获取组等
dict2 =
{'Thing 1': df
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
2014-09-17 427.99
2014-09-18 484.87
...
'Thing 5': hf
Actual
Date
2014-09-15 140.00
2014-09-15 358.03
2014-09-16 373.04
}