Python 3.x CSV导入到t-test_Python 3.x_Csv_T Test

Python 3.x CSV导入到t-test

python-3.x csv

Python 3.x CSV导入到t-test,python-3.x,csv,t-test,Python 3.x,Csv,T Test,我有一个带有特定列的.csv文件，需要对其进行双尾t检验。下面是我的.csv文件的一个示例： Type|No.|Count A |2 |4 B |5 |2 我需要将这两种类型（A和B）分配给t检验的不同变量。更具体地说，我需要一个for循环（我假设），它将使用文件中所有a类型的No.值，并对a类型和B类型的No.值进行双尾t检验。然后，我需要对所有A类型和B类型的计数值进行另一个双尾t检验。我一直在看pandas，这似乎对排序.csv文件很有用。我用它做了一个测试，看起来像这样：

我有一个带有特定列的.csv文件，需要对其进行双尾t检验。下面是我的.csv文件的一个示例：

Type|No.|Count
A   |2  |4
B   |5  |2

我需要将这两种类型（A和B）分配给t检验的不同变量。更具体地说，我需要一个for循环（我假设），它将使用文件中所有a类型的No.值，并对a类型和B类型的No.值进行双尾t检验。然后，我需要对所有A类型和B类型的计数值进行另一个双尾t检验。我一直在看pandas，这似乎对排序.csv文件很有用。我用它做了一个测试，看起来像这样：

groupby_type = data.groupby('A_B')
for type, value in groupby_type['No.']:
    print((type, value.mean()))

这将产生正确的结果。然而，当我尝试使用scipy讲座中的示例进行双尾t检验时，我得到了一个NAN结果。代码如下：

A_type = (data[data['A_B'] == 'A']['No.'])
B_type = (data[data['A_B'] == 'B']['No.'])
sig = scipy.stats.ttest_ind([A_type], [B_type])

运行此命令时，我收到以下消息：

Ttest_indResult(statistic=nan, pvalue=nan)

我不知道为什么会得到一个nan值，并且我很难理解如何绕过这个问题。谢谢大家!

当您试图读取文件时，请尝试使用“|”作为分隔符的模块。当您试图读取文件时，请尝试使用“|”作为分隔符的模块