Pandas Python使用正确的字符分隔符和正确的编码方式读取csv_Pandas_Csv_Encoding_Delimiter

Pandas Python使用正确的字符分隔符和正确的编码方式读取csv

pandas csv encoding

Pandas Python使用正确的字符分隔符和正确的编码方式读取csv,pandas,csv,encoding,delimiter,Pandas,Csv,Encoding,Delimiter,下面是原始csv文件，有不同的分隔符，如“或”；“或；它还包括曼德林中文 "2IOUT_TOT_L1 Time";"2IOUT_TOT_L1 ValueY";"2IOUT_TOT_L2 Time";"2IOUT_TOT_L2 ValueY" 2019/7/31 上午 12:00:00;46145.625;2019/7/31 上午 12:00:00;44032.5 2019/7/31 上午 12:00:01;46125;2019/7/31 上午 12:00:01;44032.5 2

下面是原始csv文件，有不同的分隔符，如“或”；“或；它还包括曼德林中文

       "2IOUT_TOT_L1 Time";"2IOUT_TOT_L1 ValueY";"2IOUT_TOT_L2 Time";"2IOUT_TOT_L2 ValueY"
2019/7/31 上午 12:00:00;46145.625;2019/7/31 上午 12:00:00;44032.5
2019/7/31 上午 12:00:01;46125;2019/7/31 上午 12:00:01;44032.5
2019/7/31 上午 12:00:02;46125;2019/7/31 上午 12:00:02;44032.5
2019/7/31 上午 12:00:03;46125;2019/7/31 上午 12:00:03;44032.5
2019/7/31 上午 12:00:04;46156.875;2019/7/31 上午 12:00:04;44032.5
2019/7/31 上午 12:00:05;46156.875;2019/7/31 上午 12:00:05;44028.75
2019/7/31 上午 12:00:06;46156.875;2019/7/31 上午 12:00:06;44028.75

我试过的如下所示

df1=pd.read\u csv（'0731-0814.csv'，sep=r'；（？=\S'），engine='python'，encoding='big5'）

结果是-> UnicodeDecodeError:“big5”编解码器无法解码位置0中的字节0xff:非法的多字节序列

df3=pd.read\u csv（'0731-0814.csv'，sep=r'；（？=\S'），engine='python'）

结果是->

似乎分隔符的选择和编码方式都不对。我希望它像下面这样

2IOUT_TOT_L1 Time   2IOUT_TOT_L1 ValueY 2IOUT_TOT_L2 Time   2IOUT_TOT_L2 ValueY
0   2019/7/31 上午 12:00:00   46145.625   2019/7/31 上午 12:00:00   44032.5
1   2019/7/31 上午 12:00:01   46125.000   2019/7/31 上午 12:00:01   44032.5

希望有人能弄明白。

我将非常感激。

一种可能的方法是将分隔符定义为regex。请参考以下文章了解如何使用它们

一种可能的方法是将分隔符定义为正则表达式

首先读取文件并将分隔符转换为精确的一个分隔符。因此，您可以使用Pandas读取文件并将分隔符转换为精确的一个分隔符。因此，您可以使用PandaStanks读取文件以获取信息，但我仍然无法解决它。我已再次编辑了该问题。如果您有其他建议，我将非常感谢。Tha谢谢你的信息，但我仍然无法解决。我已经再次编辑了这个问题。如果你有其他建议，我将非常感谢。