从文本文件到自定义格式的python panda帮助_Python_Pandas_Text_Utc

从文本文件到自定义格式的python panda帮助

python pandas text

从文本文件到自定义格式的python panda帮助,python,pandas,text,utc,Python,Pandas,Text,Utc,我正在寻找python方面的帮助，在这里我可以将以下内容转换为列文本文件中的数据： ---[职务信息：2926]---- 姓名：Run26 用户：abc 帐户：xyz 分区：q_24小时节点：node3 核心：36 国家：已完成出口代码：0:0 提交时间：2020-12-15T10:23:22 开始时间：2020-12-15T10:23:22 完：2020-12-15T14:13:50 等待时间：00:00:00 预约时间：1-00:00:00 使用时间：03:50:28 已用CPU时间：

我正在寻找python方面的帮助，在这里我可以将以下内容转换为列

文本文件中的数据：

---[职务信息：2926]----
姓名：Run26
用户：abc
帐户：xyz
分区：q_24小时
节点：node3
核心：36
国家：已完成
出口代码：0:0
提交时间：2020-12-15T10:23:22
开始时间：2020-12-15T10:23:22
完：2020-12-15T14:13:50
等待时间：00:00:00
预约时间：1-00:00:00
使用时间：03:50:28
已用CPU时间：00:00:00

所需输出：-[保持此标题连续]

作业id、名称、用户、帐户、分区、节点、核心 2926，abc，xyz，q_24小时，节点3,36

提前感谢….

您可以使用此示例，了解如何使用

re

模块解析文本文件：

重新导入
打开（“your_file.txt”、“r”）作为f_in:
data=f_in.read（）
作业ID=re.findall（r“作业信息：（\d+），数据）
names=re.findall（r“Name\s*：\s*（*）”，数据）
users=re.findall（r“User\s*：\s*（*）”，数据）
accounts=re.findall（r“Account\s*：\s*（*）”，数据）
partitions=re.findall（r“Partition\s*：\s*（*）”，数据）
nodes=re.findall（r“nodes\s*：\s*（*）”，数据）
cores=re.findall（r“cores\s*：\s*（*）”，数据）
df=pd.DataFrame(
zip（作业ID、名称、用户、帐户、分区、节点、核心），
纵队=[
“作业id”，
“姓名”，
“用户”，
“帐户”，
“分区”，
“节点”，
“核心”，
],
)
打印（df）
df.to_csv（“data.csv”，index=False）

创建

数据.csv

：

作业id、名称、用户、帐户、分区、节点、核心 2926，Run26，abc，xyz，q_24小时，节点3,36

是的，我希望创建一个数据框，使标题保持不变，并相应地对值进行排序。您尝试了什么？虽然我不认为有使用pandas的直接解决方案，但是您可以打开文件来读取所有行并解析结果以获得所需内容。