Python 我需要访问文件进行处理。文件具有相同的数据,但每行具有不同的分隔符类型(空格、逗号、制表符)

Python 我需要访问文件进行处理。文件具有相同的数据,但每行具有不同的分隔符类型(空格、逗号、制表符),python,delimiter,Python,Delimiter,我需要访问文件进行处理。这些文件具有相同的数据,但具有不同的 每行分隔符类型(空格、逗号、制表符) 我的代码如下: import os import glob DIR = "directory_path" FILES = glob.glob(os.path.join(DIR, "*")) for file in FILES: if os.path.isfile(file): content = open(file).readlines() for li

我需要访问文件进行处理。这些文件具有相同的数据,但具有不同的 每行分隔符类型(空格、逗号、制表符)

我的代码如下:

import os
import glob

DIR = "directory_path"
FILES = glob.glob(os.path.join(DIR, "*"))

for file in FILES:
    if os.path.isfile(file):
        content = open(file).readlines()
        for lines in content:
            line = lines.split(" " or "\t" or ":")
            .
            .
            .
            "processing content of line"
对于“”情况,行可以拆分,但对于其他情况,行不能拆分。如何处理不同的分隔符。

使用

|
基本上是指or,因此在任何空格或
上拆分:

for line in content:
    split_line = re.split("[ \t:]",line)

我想这就是您想要的

您可以导入re模块并利用其拆分功能拆分文件的行

import re
import os
import glob

DIR = "directory path"
FILES = glob.glob(os.path.join(DIR, "*"))

for file in FILES:
    if os.path.isfile(file):
        content = open(file).readlines()
        for lines in content:
            line = re.split(r'[\s,\t]\s*',lines)
            .
            .
            .
            process content per line

确保提供相关的样本输入。
import re
import os
import glob

DIR = "directory path"
FILES = glob.glob(os.path.join(DIR, "*"))

for file in FILES:
    if os.path.isfile(file):
        content = open(file).readlines()
        for lines in content:
            line = re.split(r'[\s,\t]\s*',lines)
            .
            .
            .
            process content per line