Python 将带有异常分隔符的文本文件读取到panda dataframe
我有一个如下所示的文本文件:Python 将带有异常分隔符的文本文件读取到panda dataframe,python,pandas,text,Python,Pandas,Text,我有一个如下所示的文本文件: Hypothesis: drink Reference: Drake WER: 100.0 Time: 2.416645050048828 "---------------------------" Hypothesis: Ed Sheeran Reference: Ed Sheeran WER: 0.0 Time: 2.854194164276123 当我尝试将其作为panda.DataFrame读取,并将[“假设”、“参考”、“
Hypothesis:
drink
Reference:
Drake
WER:
100.0
Time:
2.416645050048828
"---------------------------"
Hypothesis:
Ed Sheeran
Reference:
Ed Sheeran
WER:
0.0
Time:
2.854194164276123
当我尝试将其作为panda.DataFrame读取,并将[“假设”、“参考”、“WER”、“时间”]
作为列时,它返回一个错误
我试过:
txt= pd.read_csv("/home/kolagaza/Desktop/IAIS_en.txt", sep="---------------------------", header = None, engine='python')
data.columns = ["Hypothesis", "Reference","WER","Time"]
我认为,如果不先进行一些预处理,就无法将该文本文件直接读入pandas
DataFrame
。一种方法是将您的输入转换为pandas记录
格式,即字典列表,如下所示:
[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
{'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]
我尝试了以下代码,它对我有效(我复制了您的示例文本文件):
我认为,如果不先进行一些预处理,就无法将该文本文件直接读入pandas
DataFrame
。一种方法是将您的输入转换为pandas记录
格式,即字典列表,如下所示:
[{'Hypothesis': 'drink', 'Reference': 'Drake', 'WER': '100.0', 'Time': '2.416645050048828'},
{'Hypothesis': 'Ed Sheeran','Reference': 'Ed Sheeran', 'WER': '0.0', 'Time': '2.854194164276123'}]
我尝试了以下代码,它对我有效(我复制了您的示例文本文件):
您正在尝试访问
数据
而不进行声明。错误消息是什么?这里的txt和数据变体只是一个输入错误,但错误是关于分隔符sep=“------------------------------”您正在尝试访问数据
而不进行声明。错误消息是什么?这里的txt和数据变体只是一个输入错误,但是错误是关于分隔符sep=“-----------------------------------”您好,谢谢您的回答,但是它发送了一个错误:ValueError:没有足够的值来解包(预期2,得到1)您好,谢谢您的回答,但是它发送了一个错误:ValueError:没有足够的值来解包(预期2,得到1)