synth90k数据集上的tensorflow注意力ocr

synth90k数据集上的tensorflow注意力ocr,tensorflow,ocr,Tensorflow,Ocr,我想用Synth 90k测试集评估attention ocr模型。问题是评估结果很差,只报告了0.1个字符的精度。似乎每个输入图像模型的输出都与FSNS数据集有关: 以下是使用此命令运行eval.py脚本时的输入和输出值列表: python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10 弹劾:周州街 诱惑:刘泰顿街 潜行:卢

我想用Synth 90k测试集评估attention ocr模型。问题是评估结果很差,只报告了0.1个字符的精度。似乎每个输入图像模型的输出都与FSNS数据集有关:

以下是使用此命令运行eval.py脚本时的输入和输出值列表:

python eval.py --split_name test --train_log_dir attention_ocr_2017_05_17 --dataset_name synth90k --num_batches 10
  • 弹劾:周州街
  • 诱惑:刘泰顿街
  • 潜行:卢厄街
以下是一些实施细节:

我用Synth90k测试子集中的10个示例创建了tfrecord。此外,我还创建了charset_synth90k.txt文件,其中包含字符编码(与fsns charset_size=134.txt的内容相同)

这是我的synth90k.py数据集文件(仅包括更改的行):

默认的_DATASET_DIR=os.path.join(os.path.dirname(文件),'synth90k')

默认配置={

'name':'synth90k'

“分裂”:{

   'test': {
       'size': 10,
       'pattern': 'synth90k_test*.tfrecord'
   }
},

'charset_filename':'charset_synth90k.txt'

“图像形状”:(31200,3)

“视图数”:1

“最大序列长度”:37

“空代码”:133

}


注意力OCR模型仅使用FSNS训练数据集进行训练,它仅适用于看起来或多或少类似于法国街道名称的图像。为了将其应用于来自不同发行版的图像,您需要使用来自该发行版的图像对其进行重新训练(或至少微调)。

注意力OCR模型仅使用FSNS火车数据集进行训练,并且仅适用于看起来或多或少类似于法国街道名称的图像。为了将其应用于来自不同发行版的图像,您需要使用来自该发行版的图像重新训练(或至少微调)