Tensorflow 自定义数据集的字符、填充和空值

Tensorflow 自定义数据集的字符、填充和空值,tensorflow,Tensorflow,我正在开发一个自定义数据集来训练和测试模型attention_ocr和street,但不清楚函数encode_utf8_string在做什么。填充和使用null来确定字符数组(填充和未添加)的目的是什么 给定以下字符集、长度(5)和空字符(3): 这些是正确的填充和未添加结果(请注意文本中的空格) 是否要将数据集转换为FSNS数据集格式?。在本文中,null是133,space是0。检查:是的,我有图像(每个图像按文本/标签放在文件夹中)和一个包含图像中所有预期文本的文件。我希望在创建FSNS数

我正在开发一个自定义数据集来训练和测试模型attention_ocr和street,但不清楚函数encode_utf8_string在做什么。填充和使用null来确定字符数组(填充和未添加)的目的是什么

给定以下字符集、长度(5)和空字符(3):

这些是正确的填充和未添加结果(请注意文本中的空格)


是否要将数据集转换为FSNS数据集格式?。在本文中,
null
133
space
0
。检查:是的,我有图像(每个图像按文本/标签放在文件夹中)和一个包含图像中所有预期文本的文件。我希望在创建FSNS数据集时将这些数据完全结合起来。我现在看到了空格(0),但不确定null的用法,也不确定应该如何填充。为什么有填充和未添加的标签(类)?
{'a':0, 'b':1, 'c':2}, 
'bc': padded: [1,2,3,3,3], unpadded: [1,2]
'a a': padded: [0,3,0,3,3], unpadded: [0,3,0]