Python 将带有异常分隔符的文本文件读取到panda dataframe_Python_Pandas_Text

Python 将带有异常分隔符的文本文件读取到panda dataframe

python pandas text

Python 将带有异常分隔符的文本文件读取到panda dataframe,python,pandas,text,Python,Pandas,Text,我有一个如下所示的文本文件： Hypothesis: drink Reference: Drake WER: 100.0 Time: 2.416645050048828 "---------------------------" Hypothesis: Ed Sheeran Reference: Ed Sheeran WER: 0.0 Time: 2.854194164276123 当我尝试将其作为panda.DataFrame读取，并将[“假设”、“参考”、“

我有一个如下所示的文本文件：

Hypothesis:

drink

Reference:

Drake
WER:

100.0

Time:

2.416645050048828

"---------------------------"

Hypothesis:

Ed Sheeran

Reference:

Ed Sheeran

WER:

0.0

Time:

2.854194164276123

当我尝试将其作为panda.DataFrame读取，并将

[“假设”、“参考”、“WER”、“时间”]

作为列时，它返回一个错误

我试过：

txt= pd.read_csv("/home/kolagaza/Desktop/IAIS_en.txt", sep="---------------------------", header = None, engine='python')

data.columns = ["Hypothesis", "Reference","WER","Time"]

我认为，如果不先进行一些预处理，就无法将该文本文件直接读入pandas

DataFrame

。一种方法是将您的输入转换为pandas

记录

格式，即字典列表，如下所示：

[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
 {'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]

我尝试了以下代码，它对我有效（我复制了您的示例文本文件）：

我认为，如果不先进行一些预处理，就无法将该文本文件直接读入pandas

DataFrame

。一种方法是将您的输入转换为pandas

记录

格式，即字典列表，如下所示：

[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
 {'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]

我尝试了以下代码，它对我有效（我复制了您的示例文本文件）：

您正在尝试访问

数据

而不进行声明。错误消息是什么？这里的txt和数据变体只是一个输入错误，但错误是关于分隔符sep=“------------------------------”您正在尝试访问

数据

而不进行声明。错误消息是什么？这里的txt和数据变体只是一个输入错误，但是错误是关于分隔符sep=“-----------------------------------”您好，谢谢您的回答，但是它发送了一个错误：ValueError:没有足够的值来解包（预期2，得到1）您好，谢谢您的回答，但是它发送了一个错误：ValueError:没有足够的值来解包（预期2，得到1）