Python 如何更改数据帧以计算变量
我有这样一个数据帧:Python 如何更改数据帧以计算变量,python,pandas,dataframe,count,Python,Pandas,Dataframe,Count,我有这样一个数据帧: df = pd.DataFrame({"X":['a', 'b', 'c', 'b', 'b', 'a'], "Y":['A', 'B', 'A', 'C', 'A', 'A']}) a b c A 2 1 1 B 0 1 0 C 0 1 0 我可以使用哪种方法来计算相似的值并进行如下更改: df = pd.DataFrame({"X":['a', 'b
df = pd.DataFrame({"X":['a', 'b', 'c', 'b', 'b', 'a'],
"Y":['A', 'B', 'A', 'C', 'A', 'A']})
a b c
A 2 1 1
B 0 1 0
C 0 1 0
我可以使用哪种方法来计算相似的值并进行如下更改:
df = pd.DataFrame({"X":['a', 'b', 'c', 'b', 'b', 'a'],
"Y":['A', 'B', 'A', 'C', 'A', 'A']})
a b c
A 2 1 1
B 0 1 0
C 0 1 0
可能您可以尝试
交叉表():
结果:
X a b c
Y
A 2 1 1
B 0 1 0
C 0 1 0
X a b c
Y
A 2 1 1
B 0 1 0
C 0 1 0
您可以使用方法,第一个参数是数据源,我认为列
参数、索引
参数和填充值
参数不需要解释,但是,我想澄清一点aggfunc
参数:“size”将包括nan
值,如果您将此参数设置为“count”,然后只计算无nan
值。你可以在回答中读到更多关于这方面的内容
输出: