如何在插入数据库之前格式化表输出中的Python变量

如何在插入数据库之前格式化表输出中的Python变量,python,ocr,tesseract,Python,Ocr,Tesseract,我有一个变量,其中text关键字是从表表单中提取的 在将其插入数据库之前,有人能建议我如何正确格式化它吗 以下是变量的代码和输出: output = pytesseract.image_to_string(image) print(output) 输出结果= 1) JP *00000.0000/UNT 0.07704 61628.21 0%(E) 0.00 ND 您可以先拆分字符串,然后将所有小数转换为浮点 output='1) JP *00000.0000/UNT 0.07704 616

我有一个变量,其中text关键字是从表表单中提取的

在将其插入数据库之前,有人能建议我如何正确格式化它吗

以下是变量的代码和输出:

output = pytesseract.image_to_string(image)
print(output)
输出结果=

1) JP *00000.0000/UNT 0.07704 61628.21 0%(E) 0.00 ND

您可以先拆分字符串,然后将所有小数转换为浮点

output='1) JP *00000.0000/UNT 0.07704 61628.21 0%(E) 0.00 ND'
l = output.split()
for idx, le in enumerate(l):
    try:
        l[idx] = float(l[idx])
    except:
        continue
l
是一个列表

['1)', 'JP', '*00000.0000/UNT', 0.07704, 61628.21, '0%(E)', 0.0, 'ND']
当你说“格式正确”时,你是什么意思?您希望文本以某种方式格式化吗?字符串包含字符和数字。文本应该根据位置或空间进行分割吗?