Python 将带有异常分隔符的文本文件读取到panda dataframe

Python 将带有异常分隔符的文本文件读取到panda dataframe,python,pandas,text,Python,Pandas,Text,我有一个如下所示的文本文件: Hypothesis: drink Reference: Drake WER: 100.0 Time: 2.416645050048828 "---------------------------" Hypothesis: Ed Sheeran Reference: Ed Sheeran WER: 0.0 Time: 2.854194164276123 当我尝试将其作为panda.DataFrame读取,并将[“假设”、“参考”、“

我有一个如下所示的文本文件:

Hypothesis:

drink

Reference:

Drake
WER:

100.0

Time:

2.416645050048828

"---------------------------"

Hypothesis:

Ed Sheeran

Reference:

Ed Sheeran

WER:

0.0

Time:

2.854194164276123

当我尝试将其作为panda.DataFrame读取,并将
[“假设”、“参考”、“WER”、“时间”]
作为列时,它返回一个错误

我试过:

txt= pd.read_csv("/home/kolagaza/Desktop/IAIS_en.txt", sep="---------------------------", header = None, engine='python')

data.columns = ["Hypothesis", "Reference","WER","Time"]

我认为,如果不先进行一些预处理,就无法将该文本文件直接读入pandas
DataFrame
。一种方法是将您的输入转换为pandas
记录
格式,即字典列表,如下所示:

[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
 {'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]
我尝试了以下代码,它对我有效(我复制了您的示例文本文件):


我认为,如果不先进行一些预处理,就无法将该文本文件直接读入pandas
DataFrame
。一种方法是将您的输入转换为pandas
记录
格式,即字典列表,如下所示:

[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
 {'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]
我尝试了以下代码,它对我有效(我复制了您的示例文本文件):


您正在尝试访问
数据
而不进行声明。错误消息是什么?这里的txt和数据变体只是一个输入错误,但错误是关于分隔符sep=“------------------------------”您正在尝试访问
数据
而不进行声明。错误消息是什么?这里的txt和数据变体只是一个输入错误,但是错误是关于分隔符sep=“-----------------------------------”您好,谢谢您的回答,但是它发送了一个错误:ValueError:没有足够的值来解包(预期2,得到1)您好,谢谢您的回答,但是它发送了一个错误:ValueError:没有足够的值来解包(预期2,得到1)