Python 如何使用多个文本文件进行数据清理

Python 如何使用多个文本文件进行数据清理,python,pandas,text-files,data-cleaning,logfile,Python,Pandas,Text Files,Data Cleaning,Logfile,我有一个包含日志文件的目录。 因此,对于读取和连接,我使用以下命令: filenames = glob('*.log') df = [pd.read_csv(f) for f in filenames 每个日志文件如下所示: Tracer: (1) 18F-Nb25 Batch no: 3459 Date: 2020-01- 3 Time IS current IS volt. Dee RF Magnet Probe Coll-l Foil Targ

我有一个包含日志文件的目录。 因此,对于读取和连接,我使用以下命令:

filenames = glob('*.log')
df = [pd.read_csv(f) for f in filenames
每个日志文件如下所示:

Tracer: (1) 18F-Nb25    Batch no: 3459  Date: 2020-01- 3


Time       IS current   IS volt.    Dee RF  Magnet  Probe   Coll-l  Foil Target Coll-r  Vacuum
05:25:39    0   0   0.0 0.0 130.85  0.1 0.1 0.0 0.1 0.1 2.2E-06
05:25:40    0   0   0.0 0.0 130.85  0.1 0.1 0.0 0.1 0.1 2.2E-06
05:25:41    0   0   0.0 0.0 130.85  0.1 0.1 0.0 0.1 0.1 2.2E-06
05:25:42    0   0   0.0 0.0 130.85  0.1 0.1 0.0 0.1 0.1 4.2E-06
对于数据清理和转换,我使用:

fline=open("abc.csv", ).readline().rstrip()
输出:

'Tracer: (1) 18F-Nb25 \tBatch no: 3451 \tDate: 2020-01- 2,Tracer: (1) 18F-Nb25 \tBatch no: 3452 \tDate: 2020-01- 2,Tracer: (1) 18F-Nb25 \tBatch no: 3453 \tDate: 2020-01- 2,Tracer: (1) 18F-Nb25 \tBatch no: 3454 \tDate: 2020-01- 2,Tracer: (1) 18F-Nb25 \tBatch no: 3455 \tDate: 2020-01- 2,Tracer: (1) 18F-Nb25 \tBatch no: 3456 \tDate: 2020-01- 3,Tracer: (1) 18F-Nb25 \tBatch no: 3457 \tDate: 2020-01- 3,Tracer: (1) 18F-Nb25 \tBatch no: 3458 \tDate: 2020-01- 3'
之后,对于拆分:

fline = fline.split('\t')
最后:

df = pd.read_csv('abc.csv',  sep='\t', skiprows=[0,1,2,3], names=['Time','IS current','IS volt.','Dee','RF','Magnet','Probe','Coll-l','Foil','Target','Coll-r', 'Vacuum'])

df['Date'] = fline[2].replace("Date: ","")
df['Batch'] = fline[1].replace("Batch no: ","") 
但根据第一次读取的日志文件,csv中显示了日期和批号。。。。。 需要帮助以正确的方式显示日期和批号


任何帮助都将不胜感激。提前感谢

欢迎来到SO!请按照说明格式化问题中的代码和输出。这将帮助人们更好地理解您的代码、您试图实现的目标以及问题所在。