Python 理解泰坦尼克号数据集上的卡方检验
目前我正在数据集上进行假设检验 在阅读卡方检验时,我通过Kaggle找到了这个笔记本: 这是对泰坦尼克号数据集的卡方假设检验 为了计算等级和生存之间的关系,他使用了以下代码: 1)用于获取列联表(观察值)Python 理解泰坦尼克号数据集上的卡方检验,python,python-3.x,machine-learning,chi-squared,hypothesis-test,Python,Python 3.x,Machine Learning,Chi Squared,Hypothesis Test,目前我正在数据集上进行假设检验 在阅读卡方检验时,我通过Kaggle找到了这个笔记本: 这是对泰坦尼克号数据集的卡方假设检验 为了计算等级和生存之间的关系,他使用了以下代码: 1)用于获取列联表(观察值) PClass\u survd=pd.pivot\u表(数据,索引=['PClass'],列=['surved'],aggfunc='size') 2)阶级和生存是如何分布的 pct\u class=pcclass\u survd.sum(轴=1)/891 pct=PClass\u survd
PClass\u survd=pd.pivot\u表(数据,索引=['PClass'],列=['surved'],aggfunc='size')
2)阶级和生存是如何分布的
pct\u class=pcclass\u survd.sum(轴=1)/891
pct=PClass\u survd.sum(轴=0)/891
3)计算期望值
pct\u class.to\u frame()@(pct\u.to\u frame().T)
我不明白在步骤3中如何计算期望值。我知道将序列转换为数据帧
谁能详细解释一下第3步,或者不使用统计中的卡方函数,如何从数据集中计算出一般期望值(如果可能,请举例说明)
提前感谢看起来你真的有一道数学题,而不是一道编程题。你试过math.stackexchange.com吗?你明白这段代码的意思吗,用常规的方式,把它写在你的数学作业活页夹中?特别是,您是否需要它解释
@
符号在此上下文中的作用,或者.T
?问题到底是什么?是的,.T
和@
。以及如何使用它来计算期望值。是的,这是一道与假设检验有关的数学题。你熟悉熊猫和努比吗?你试过阅读文档吗?