使用Python将2列合并到txt文件中的新列

使用Python将2列合并到txt文件中的新列,python,Python,大家好,这是我的txt文件,我想将第一列和第二列合并成一个新列,我尝试将文件扩展名更改为Excel,并使用concatenate命令,但是有超过1000000个数据,Excel只能显示有限的数量,因此我将丢失一些数据。所以我想问一下专业人士,Python中是否有一种方法可以直接将两列合并到txt文件中,而无需进行格式转换 Datum Zeit W [cm] Status DT-Index W [mNHN] 01/05/2016 00:

大家好,这是我的txt文件,我想将第一列和第二列合并成一个新列,我尝试将文件扩展名更改为Excel,并使用
concatenate
命令,但是有超过1000000个数据,Excel只能显示有限的数量,因此我将丢失一些数据。所以我想问一下专业人士,Python中是否有一种方法可以直接将两列合并到txt文件中,而无需进行格式转换

Datum       Zeit        W [cm]      Status      DT-Index    W [mNHN]    
01/05/2016  00:01:00    313,000000  U   42491,000694    -1,87   
01/05/2016  00:02:00    313,000000  U   42491,001389    -1,87   
01/05/2016  00:03:00    313,000000  U   42491,002083    -1,87   
01/05/2016  00:04:00    313,000000  U   42491,002778    -1,87   
...... # over 1000000 datas
我想要的是:

Datum       Zeit        W [cm]      Status      DT-Index    W [mNHN]    Datetime
01/05/2016  00:01:00    313,000000  U   42491,000694    -1,87       01/05/2016/00:01:00 
01/05/2016  00:02:00    313,000000  U   42491,001389    -1,87       01/05/2016/00:02:00     
01/05/2016  00:03:00    313,000000  U   42491,002083    -1,87       01/05/2016/00:03:00 
01/05/2016  00:04:00    313,000000  U   42491,002778    -1,87       01/05/2016/00:04:00 
...... #over 1000000 datas

您可以使用pandas库来实现这一点,应该相对简单

import pandas as pd
df = pd.read_csv("C:/your_csv.csv", sep="\t")
df["Datetime"] = df["Datum"] + "/" + df["Zeit"]

虽然值得一提的是,您可以使用datetime格式做一些更复杂的事情,这些格式可能更适合您的用例

谢谢您的回复,但是我需要
编写datetime
还是其他什么?这是pandas.\u libs.hashtable.PyObjectHashTable.get\u item key错误
文件“pandas\\u libs\hashtable\u class\u helper.pxi”,第1500行,在pandas.\u libs.hashtable.PyObjectHashTable.get\u key错误:'Datum'
看起来您的csv可能没有正确读取,如果您的文件以制表符分隔(因为您的数据值中有逗号),您可以尝试使用参数
sep=“\t”
还是一样的错误<代码>文件“pandas\\u libs\hashtable\u class\u helper.pxi”,第1500行,在pandas.\u libs.hashtable.PyObjectHashTable.get\u item key错误:“Datum”我需要添加一些关于日期时间格式的命令吗?例如:
df['time']=pd.to_datetime(df['time'],格式=“%d.%m.%Y/%H:%m:%S”)
该错误的意思是在数据帧中找不到列“Datum”。这很可能是因为没有正确读入(或者列名中有空格)。没有这些数据,我很难说为什么。但是您可以键入
print(df.columns)
查看已加载列的名称,这可能会给您一个线索。数据无法打印,而且我认为整个列都无法读取,错误仍然与以前相同。