Python 使用固定宽度的列保存数据帧
我需要编辑来自一个使用固定宽度列的程序的输入。我设法正确地加载了它并计算出了我需要的内容,但我不知道如何保存编辑过的文件以保持相同的列宽度Python 使用固定宽度的列保存数据帧,python,pandas,text,Python,Pandas,Text,我需要编辑来自一个使用固定宽度列的程序的输入。我设法正确地加载了它并计算出了我需要的内容,但我不知道如何保存编辑过的文件以保持相同的列宽度 import pandas as pd file = pd.read_fwf('file.inp', colspecs = [(0, 6), (6, 11), (11, 16), (16, 20), (20, 22), (22, 26), (26, 38),
import pandas as pd
file = pd.read_fwf('file.inp',
colspecs = [(0, 6), (6, 11), (11, 16), (16, 20), (20, 22),
(22, 26), (26, 38), (38, 46), (46, 54), (54, 61),
(61, 68), (68, 90)])
问题是列之间的空格数量或数据字符串的长度不同,因此我不能简单地在列之间添加固定数量的空格
要编辑的文件如下所示:
ATOM 873 N ALA A 59 41.629 23.754-163.394 1.00 12.93 N
ATOM 5089 NH1 ARG A 315 21.344 -13.371 187.612 1.00 66.09 N1+
ATOM 7839 H5'' A B 3 31.406 -4.882-165.817 1.00 16.98 H
HETATM 7766 H161 G3A B 1 42.941 1.714-165.146 1.00 14.70 H
它是数字、字符串、特殊字符和列粘在一起的混合体。正如我所评论的,我在pandas中找不到
write_fdf
方法。但是,我认为您可以通过制表
实现您想要的。我基于以下代码,但尚未运行:
import pandas as pd
from tabulate import tabulate
df = pd.read_fwf('file.inp',
colspecs = [(0, 6), (6, 11), (11, 16), (16, 20), (20, 22),
(22, 26), (26, 38), (38, 46), (46, 54), (54, 61),
(61, 68), (68, 90)])
with open("...", "w") as f:
f.write(
tabulate(
[list(row) for row in df.values],
tablefmt="plain"
)
)
请再次注意,我没有运行此功能,只是演示如何使用表格:
- 我没有传递
参数,如果需要,可以使用该参数标题
- 我使用“普通”格式来避免任何类似桌子的装饰
然而,我在格式中看到一个例外,它似乎违反了规则:行=0,列=2:“N”似乎在您的示例中居中@jezrael-我这样做了,元组列表中的宽度是正确的。文件已正确加载到数据帧中。我只是在用相同的列宽再次保存它时遇到了问题。有趣的是,我发现了一个
read\u fwf
,而不是write\u fwf
!我觉得就快到了。但问题是,我现在不知道如何告诉tablate,使列具有特定的宽度。以某种方式传递colspec元组列表并告诉TABLATE在特定列之间放置数据将是理想的……嗯,我没想到!我会查看文档,但不确定是否支持此功能。。。
import pandas as pd
import sys
# Mock data
lst = [
["ATOM", 873, "N", "ALA", "A", 59, 41.629, 23.754, -163.394, 1.00, 12.93, "N"],
["ATOM", 5089, "NH1", "ARG", "A", 315, 21.344, -13.371, 187.612, 1.00 ,66.09, "N1+"],
["ATOM", 7839, "H5''", "A", "B", 3, 31.406, -4.882, -165.817, 1.00, 16.98, "H" ],
["HETATM", 7766, "H161", "G3A", "B", 1, 42.941, 1.714, -165.146, 1.00, 14.70, "H"],
]
# NOTE the spaces at the end, only when needed
colspecs = [
"{: <6} ", # left, width=6
"{: >4} ", # right, width=4
"{: >4} ",
"{: >3} ",
"{: >1} ",
"{: >3} ",
"{: >11} ",
"{: >7}",
"{: >8} ",
"{: >5} ",
"{: <15} ",
"{: <3}",
]
def write_fdf(fpath, pd, specs):
"""
Write a Pandas dataframe in fixed width column format with the given
column specs
Args:
fpath: File path
ps: Dataframe
specs: A list of python formats
"""
with open(fpath, "w") as f:
for _, row in df.iterrows():
for idx, value in enumerate(row):
sys.stdout.write(specs[idx].format(value))
f.write(specs[idx].format(value))
f.write("\n")
print("")
df = pd.DataFrame(lst)
write_fdf("/tmp/out.dat", pd, colspecs)
$ python ~/tmp/test.py
ATOM 873 N ALA A 59 41.629 23.754-163.394 1.0 12.93 N
ATOM 5089 NH1 ARG A 315 21.344 -13.371 187.612 1.0 66.09 N1+
ATOM 7839 H5'' A B 3 31.406 -4.882-165.817 1.0 16.98 H
HETATM 7766 H161 G3A B 1 42.941 1.714-165.146 1.0 14.7 H
$ cat /tmp/out.dat
ATOM 873 N ALA A 59 41.629 23.754-163.394 1.0 12.93 N
ATOM 5089 NH1 ARG A 315 21.344 -13.371 187.612 1.0 66.09 N1+
ATOM 7839 H5'' A B 3 31.406 -4.882-165.817 1.0 16.98 H
HETATM 7766 H161 G3A B 1 42.941 1.714-165.146 1.0 14.7 H