如何将文本导入DataFrame列,跳过colspec(PYTHON)
我有以下表格的文本:如何将文本导入DataFrame列,跳过colspec(PYTHON),python,pandas,Python,Pandas,我有以下表格的文本: adadaff afdfsfs fdsfsfsd 32421 2 4321 12 adadaff afdfsfs fdsfsfsd 32421 4321 12 adadaff afdfsfs fdsfsfsd 32421 4321 12 adadaff afdfsfs fdsfsfsd 32421 4321 12 adadaff afdfsfs fdsfsfsd 32421 4321 12 adadaff
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
我想把它放在数据帧的col1中,比如:
col1
0 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
1 adadaff afdfsfs fdsfsfsd 32421 4321 12
2 adadaff afdfsfs fdsfsfsd 32421 4321 12
3 adadaff afdfsfs fdsfsfsd 32421 4321 12
4 adadaff afdfsfs fdsfsfsd 32421 4321 12
5 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
我正在使用:pd.read_fwd(“text.txt”,header=None),但由于它返回一个包含7列的数据帧,所以无法工作
我怎么能把所有的文字都放在一列呢 用这个
temp = StringIO("""
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
""")
df = pd.read_csv(temp, sep='|', names=['col1'])
输出
col1
0 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
1 adadaff afdfsfs fdsfsfsd 32421 4321 12
2 adadaff afdfsfs fdsfsfsd 32421 4321 12
3 adadaff afdfsfs fdsfsfsd 32421 4321 12
4 adadaff afdfsfs fdsfsfsd 32421 4321 12
5 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
用这个
temp = StringIO("""
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 4321 12
adadaff afdfsfs fdsfsfsd 32421 2 4321 12
""")
df = pd.read_csv(temp, sep='|', names=['col1'])
输出
col1
0 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
1 adadaff afdfsfs fdsfsfsd 32421 4321 12
2 adadaff afdfsfs fdsfsfsd 32421 4321 12
3 adadaff afdfsfs fdsfsfsd 32421 4321 12
4 adadaff afdfsfs fdsfsfsd 32421 4321 12
5 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
您可以使用colspecs参数来实现这一点 colspecs将给出每行固定宽度字段范围的成对(元组)列表作为半开间隔(即,[from,to[])。 在本例中,我将间隔设置为100(任何更高的数值) 输出:
Col1
0 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
1 adadaff afdfsfs fdsfsfsd 32421 4321 12
2 adadaff afdfsfs fdsfsfsd 32421 4321 12
3 adadaff afdfsfs fdsfsfsd 32421 4321 12
4 adadaff afdfsfs fdsfsfsd 32421 4321 12
5 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
您可以使用colspecs参数来实现这一点 colspecs将给出每行固定宽度字段范围的成对(元组)列表作为半开间隔(即,[from,to[])。 在本例中,我将间隔设置为100(任何更高的数值) 输出:
Col1
0 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
1 adadaff afdfsfs fdsfsfsd 32421 4321 12
2 adadaff afdfsfs fdsfsfsd 32421 4321 12
3 adadaff afdfsfs fdsfsfsd 32421 4321 12
4 adadaff afdfsfs fdsfsfsd 32421 4321 12
5 adadaff afdfsfs fdsfsfsd 32421 2 4321 12
@耶斯雷尔谢谢…这是我用过的旧东西…从来没有真正费心去改变..是的,在这种情况下,它没有什么意义diff@jezrael谢谢……这是我用过的旧东西……从来没有真正费心去改变……是的,在这种情况下,它没有什么区别