Python 读取多个txt文件，然后将每个文件另存为xlsx文件，每个文件的标题相同_Python_Python 3.x_Pandas

Python 读取多个txt文件，然后将每个文件另存为xlsx文件，每个文件的标题相同

python python-3.x pandas

Python 读取多个txt文件，然后将每个文件另存为xlsx文件，每个文件的标题相同,python,python-3.x,pandas,Python,Python 3.x,Pandas,我的任务是使用SAP自定义报告，该报告以文本文件形式提供给我-下面的示例（删除了名称，并将此示例的所有值设为0.00）。任务是使用此数据并根据此数据创建xlsx文件。我在一个特定的文件夹中有100个这些txt文件。如何将其加载到python中，并创建一个xlsx文件，将每个文件的头数据保存在表上方相同的位置/格式中我有下面的代码为每个文件创建xlsx，但格式都很混乱。每个单元格/列/行都需要更好的格式非常感谢您的帮助当前代码： import glob import os from xlsx

我的任务是使用SAP自定义报告，该报告以文本文件形式提供给我-下面的示例（删除了名称，并将此示例的所有值设为0.00）。任务是使用此数据并根据此数据创建xlsx文件。我在一个特定的文件夹中有100个这些txt文件。如何将其加载到python中，并创建一个xlsx文件，将每个文件的头数据保存在表上方相同的位置/格式中

我有下面的代码为每个文件创建xlsx，但格式都很混乱。每个单元格/列/行都需要更好的格式

非常感谢您的帮助

当前代码：

import glob
import os
from xlsxwriter import Workbook
filepath = 'mypath'
txtfiles = glob.glob(os.path.join(filepath, '*z*.txt*'))

def is_number(s):
    try:
        float(s)
        return True
    except ValueError:
        return False

for filename in txtfiles:
    readfiles = open(filename, 'r') 

    row_list = []

    for row in readfiles:
        row_list.append(row.split('\n'))

    column_list = zip(*row_list)

    workbook = Workbook(filename.replace('.txt', '.xlsx'))
    worksheet = workbook.add_worksheet('Sheet1')

    i = 0
    for column in column_list:
        for item in range(len(column)):
            value = column[item].strip()
            if is_number(value):
                worksheet.write(item, i, float(value))
            else:
                worksheet.write(item, i, value)
        i += 1
    workbook.close()

报告样本如下：

                                                 SAMPLE REPORT TEMPLATE

Page Number:  1 of   1                                                                         Time of Output:06:37:00
Author of Report:ME                                                                            Date of Output:09/27/2018
Ledger:SAMPLE                                                                                  Version: 1
Currency: USD                                                                                  Fiscal Year:2018
Report Group:RANDOM                                                                            Period:  0 to   10

|.                                                           |    Outside MONEY    | Outside MONEY2      |    Outside MONEY3   |   Subtotal MONIES   |
|------------------------------------------------------------|---------------------|---------------------|---------------------|---------------------|
|   INCOME MONIES BEFORE CERTAIN CALCULATIONS SAMPLE         |                0.00 |                0.00 |                0.00 |                0.00 |
|------------------------------------------------------------|---------------------|---------------------|---------------------|---------------------|
|   1 - Line Data 1                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   1 - Line Data 2                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   1 - Line Data 3                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   1 - Line Data 4                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   1 - Line Data 5                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   2 - Line Data 1                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   2 - Line Data 2                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   2 - Line Data 3                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|*  Sample Random Line W/ Star                               |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 1                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 2                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 3                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 4                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 5                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 6                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 7                                          |                0.00 |                0.00 |                0.00 |                0.00 |
|   3 - Line Data 8                                          |                0.00 |                0.00 |                0.00 |                0.00 |

从文本文件中读取并将每一行作为项目添加到列表中，可以按如下方式进行：

lines = []
with open('input_file.txt', 'r') as textinputfile:
    for readline in textinputfile:
        lines.append(readline)

由于文本报告字段的长度固定，因此可以使用一个函数提取标题，使用另一个函数提取数据。因此，在您的示例中，每行数据是151个字符。因为标题要短得多，所以您可以很容易地知道当前循环中的行是来自标题还是数据

我建议将行按“：”拆分（如果是标题），并按“|”拆分（如果是数据）。循环结束时，每一行的字段都将正确分隔

如果您在管理数据方面遇到更多问题，或者需要更多详细信息，我建议使用regex模块。

是的，逐行读取txt文件并在python列表或字典中收集数据相对容易。没有必要用熊猫来做这个。然后，您可以使用XlsxWriter（）将它们编写为excel。如果您需要更多帮助，请尝试并发布您的代码。@576i您会使用readlines（）或list吗？很抱歉，我从来没有做过这样的事情，因为我通常使用文件作为表格轻松上传到数据框中。使用“打开”（“文件名”）作为f1:对于f1中的行：使用行执行某些操作-谢谢你的建议。我应该在我的帖子中指定该文件只是一个示例，每个txt文件都有不同的长度。为了发布一个例子，它只是让发布这样的长度变得更容易。好吧，如果它们足够大，你可以使用相同的逻辑。比如说，标题永远不会大于100个字符，数据总是大于100个字符；您可以使用这种逻辑，也可以用“|”分割所有内容，只有一个字段的行将成为标题。那些你可以事后治疗的。