Python基于第二列值的不同数据解释
我正在解释和创建类似标题的数据帧。但不知道如何处理每行的不同标题 我有一个很大的文本文件,比如abcde.txt 文件中显示的数据格式如下所示:(第二列值表示其余的格式,不同的列#2类型的标题名称不同。) 列#2的值最多为5。和文件具有相同列类型的多行 例如:Python基于第二列值的不同数据解释,python,pandas,csv,Python,Pandas,Csv,我正在解释和创建类似标题的数据帧。但不知道如何处理每行的不同标题 我有一个很大的文本文件,比如abcde.txt 文件中显示的数据格式如下所示:(第二列值表示其余的格式,不同的列#2类型的标题名称不同。) 列#2的值最多为5。和文件具有相同列类型的多行 例如: DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3… DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC
DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…
:::::
编辑:
我试着对这个问题作进一步的解释
所以我想根据第二列的值(可以是0到5)制作单独的数据帧进行分析
如果您在示例中看到第二列has value==0(第#1行),这是5个标题格式,所以我想准备5个值并在数据帧中创建一行,然后读取同一行中的下5组值,并使用重复的时间戳将行插入到数据帧中。所以,如果有10次重复的5值集,它将是10X(5+1(对于时间戳))维数据帧。我必须对第二列的值=0的所有行重复这一点,并将其添加到数据帧中,以生成第二列的完整数据帧==0
Something like this: (this is the data frame where second column value ==0)
Header: timestamp A B C D E
12345 A1 B1 C1 D1 E1
12345 A2 B2 C2 D2 E2
12345 A3 B3 C3 D3 E3
(new line in file) 14567 A4 B4 C4 D4 E4
14567 A5 B5 C5 D5 E5
14567 A6 B6 C6 D6 E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.
桑杰,这让我很困惑。你能再澄清一点吗?第二列中两行值相同的区别是什么?
Something like this: (this is the data frame where second column value ==0)
Header: timestamp A B C D E
12345 A1 B1 C1 D1 E1
12345 A2 B2 C2 D2 E2
12345 A3 B3 C3 D3 E3
(new line in file) 14567 A4 B4 C4 D4 E4
14567 A5 B5 C5 D5 E5
14567 A6 B6 C6 D6 E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.