Python 3.x CSV导入到t-test

Python 3.x CSV导入到t-test,python-3.x,csv,t-test,Python 3.x,Csv,T Test,我有一个带有特定列的.csv文件,需要对其进行双尾t检验。下面是我的.csv文件的一个示例: Type|No.|Count A |2 |4 B |5 |2 我需要将这两种类型(A和B)分配给t检验的不同变量。更具体地说,我需要一个for循环(我假设),它将使用文件中所有a类型的No.值,并对a类型和B类型的No.值进行双尾t检验。然后,我需要对所有A类型和B类型的计数值进行另一个双尾t检验。 我一直在看pandas,这似乎对排序.csv文件很有用。我用它做了一个测试,看起来像这样:

我有一个带有特定列的.csv文件,需要对其进行双尾t检验。下面是我的.csv文件的一个示例:

Type|No.|Count
A   |2  |4
B   |5  |2
我需要将这两种类型(A和B)分配给t检验的不同变量。更具体地说,我需要一个for循环(我假设),它将使用文件中所有a类型的No.值,并对a类型和B类型的No.值进行双尾t检验。然后,我需要对所有A类型和B类型的计数值进行另一个双尾t检验。 我一直在看pandas,这似乎对排序.csv文件很有用。我用它做了一个测试,看起来像这样:

groupby_type = data.groupby('A_B')
for type, value in groupby_type['No.']:
    print((type, value.mean()))
这将产生正确的结果。然而,当我尝试使用scipy讲座中的示例进行双尾t检验时,我得到了一个NAN结果。代码如下:

A_type = (data[data['A_B'] == 'A']['No.'])
B_type = (data[data['A_B'] == 'B']['No.'])
sig = scipy.stats.ttest_ind([A_type], [B_type])
运行此命令时,我收到以下消息:

Ttest_indResult(statistic=nan, pvalue=nan)
我不知道为什么会得到一个nan值,并且我很难理解如何绕过这个问题。谢谢大家!

当您试图读取文件时,请尝试使用“|”作为分隔符的模块。当您试图读取文件时,请尝试使用“|”作为分隔符的模块