Pandas 基于2列的熊猫装箱数据

Pandas 基于2列的熊猫装箱数据,pandas,grouping,Pandas,Grouping,想象一下以下情况: data = {'Person': ['A', 'A', 'B', 'B', 'C', 'C', 'C', 'C', 'C'], 'Field': ['Age', 'Weight', 'Age', 'Height', 'Height', 'year', 'month', 'day', 'city']} df = pd.DataFrame(data) Field Person Age A Weight A Age B He

想象一下以下情况:

data = {'Person': ['A', 'A', 'B', 'B', 'C', 'C', 'C', 'C', 'C'], 'Field': ['Age', 'Weight', 'Age', 'Height', 'Height', 'year', 'month', 'day', 'city']}
df = pd.DataFrame(data)

  Field Person
    Age      A
 Weight      A
    Age      B
 Height      B
 Height      C
   year      C
  month      C
    day      C
   city      C
想象一下,我想减少从每个人那里获取字段所需的查询数量。所以我会先在一个房间里找A和B,问他们的年龄,然后我会问A他的身高,然后我可以找B&C,问他们的身高,最后问C所有剩余的字段

这听起来可能比单独问A、B和C更复杂。但想象一下我有:

  Field Person
    Age      A
    Age      B
 Height      B
 Height      B
   year      B
  month      B
    Age      C
 Height      C
 Height      C
   year      C
  month      C
很明显,向每个人询问这些信息不如向A、B和C询问年龄,然后向B和C询问身高、体重、年份和月份


我可以用编程的方式想出很多方法,但我想知道最有效的方法是什么。

这个问题实际上是这个问题的翻版:还有这个和无数其他问题,但是你的措辞有点不同。你想要与我的答案或链接的答案不同吗posts@EdChum谢谢你的回复。我不知道Factorize做了类似的事情,但并不完全符合我的需要,所以我重新编写了这个问题。我想你需要更清楚地解释一下这里的逻辑,我将删除我的答案