从文本文件到自定义格式的python panda帮助

从文本文件到自定义格式的python panda帮助,python,pandas,text,utc,Python,Pandas,Text,Utc,我正在寻找python方面的帮助,在这里我可以将以下内容转换为列 文本文件中的数据: ---[职务信息:2926]---- 姓名:Run26 用户:abc 帐户:xyz 分区:q_24小时 节点:node3 核心:36 国家:已完成 出口代码:0:0 提交时间:2020-12-15T10:23:22 开始时间:2020-12-15T10:23:22 完:2020-12-15T14:13:50 等待时间:00:00:00 预约时间:1-00:00:00 使用时间:03:50:28 已用CPU时间:

我正在寻找python方面的帮助,在这里我可以将以下内容转换为列

文本文件中的数据:

---[职务信息:2926]----
姓名:Run26
用户:abc
帐户:xyz
分区:q_24小时
节点:node3
核心:36
国家:已完成
出口代码:0:0
提交时间:2020-12-15T10:23:22
开始时间:2020-12-15T10:23:22
完:2020-12-15T14:13:50
等待时间:00:00:00
预约时间:1-00:00:00
使用时间:03:50:28
已用CPU时间:00:00:00
所需输出:-[保持此标题连续]

作业id、名称、用户、帐户、分区、节点、核心 2926,abc,xyz,q_24小时,节点3,36
提前感谢….

您可以使用此示例,了解如何使用
re
模块解析文本文件:

重新导入
打开(“your_file.txt”、“r”)作为f_in:
data=f_in.read()
作业ID=re.findall(r“作业信息:(\d+),数据)
names=re.findall(r“Name\s*:\s*(*)”,数据)
users=re.findall(r“User\s*:\s*(*)”,数据)
accounts=re.findall(r“Account\s*:\s*(*)”,数据)
partitions=re.findall(r“Partition\s*:\s*(*)”,数据)
nodes=re.findall(r“nodes\s*:\s*(*)”,数据)
cores=re.findall(r“cores\s*:\s*(*)”,数据)
df=pd.DataFrame(
zip(作业ID、名称、用户、帐户、分区、节点、核心),
纵队=[
“作业id”,
“姓名”,
“用户”,
“帐户”,
“分区”,
“节点”,
“核心”,
],
)
打印(df)
df.to_csv(“data.csv”,index=False)
创建
数据.csv

作业id、名称、用户、帐户、分区、节点、核心 2926,Run26,abc,xyz,q_24小时,节点3,36
是的,我希望创建一个数据框,使标题保持不变,并相应地对值进行排序。您尝试了什么?虽然我不认为有使用pandas的直接解决方案,但是您可以打开文件来读取所有行并解析结果以获得所需内容。