Python 如何将文本文件加载到数据框中?
我有一个文本文件,看起来像这样: ` 其中分隔符是四个空格。我正在尝试Python 如何将文本文件加载到数据框中?,python,pandas,Python,Pandas,我有一个文本文件,看起来像这样: ` 其中分隔符是四个空格。我正在尝试read\u csv函数,以便将其转换为熊猫数据帧 data= pd.read_csv('file.txt', sep=" ", header = None) 然而,它给了我很多价值观 101\tthe\tthe\t10115 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 102\tto\tto\t5491 NaN NaN NaN N
read\u csv
函数,以便将其转换为熊猫数据帧
data= pd.read_csv('file.txt', sep=" ", header = None)
然而,它给了我很多价值观
101\tthe\tthe\t10115 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
102\tto\tto\t5491 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
103\tof\tof\t4767 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
104\ta\ta\t4532 NaN NaN NaN NaN NaN NaN NaN NaN NaN Na
是否有任何方法可以将文本文件读取为正确的csv格式。如果需要,请使用分隔符
4
空白:
data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)
如果需要分隔一个或多个空格,请使用参数delim_whitespace=True
(谢谢)或\s+
:
data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)
但如果分隔符是选项卡
:
data = pd.read_csv('file.txt', sep="\t", header = None)
如果需要分隔符
4
空白:
data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)
如果需要分隔一个或多个空格,请使用参数delim_whitespace=True
(谢谢)或\s+
:
data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)
但如果分隔符是选项卡
:
data = pd.read_csv('file.txt', sep="\t", header = None)
您有一个固定宽度的文件,因此可以使用它来嗅探文件的格式:
In[79]:
pd.read_fwf('file.txt', header=None)
Out[79]:
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325
您有一个固定宽度的文件,因此可以使用它来嗅探文件的格式:
In[79]:
pd.read_fwf('file.txt', header=None)
Out[79]:
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325