在JPEG图像中存储OCR数据/元数据的任何常规标准？_Ocr_Rdf_Exif_Xmp_Dublin Core

在JPEG图像中存储OCR数据/元数据的任何常规标准？

rdf

在JPEG图像中存储OCR数据/元数据的任何常规标准？,ocr,rdf,exif,xmp,dublin-core,Ocr,Rdf,Exif,Xmp,Dublin Core,我想通过将元数据和文本内容（OCR’ed）添加到相同的jpeg文件中来组织扫描文档（收据、银行对账单等）的集合。是否有任何或多或少被普遍接受的存储此类数据的方法？有常用的模式吗？例如，对于元数据，我发现了一个都柏林核心方案，但我想要的大多数字段都不存在，我不确定添加自定义字段的好方法是什么——我可以像使用DC或XMP方案一样使用它们吗（即myvalue或myvalue），或者我必须通过添加xmlns:myScheme来定义我自己的方案="http://myScheme.uri“然后将其用作my

我想通过将元数据和文本内容（OCR’ed）添加到相同的jpeg文件中来组织扫描文档（收据、银行对账单等）的集合。是否有任何或多或少被普遍接受的存储此类数据的方法？有常用的模式吗？
例如，对于元数据，我发现了一个都柏林核心方案，但我想要的大多数字段都不存在，我不确定添加自定义字段的好方法是什么——我可以像使用DC或XMP方案一样使用它们吗（即

myvalue

或

myvalue

），或者我必须通过添加

xmlns:myScheme来定义我自己的方案="http://myScheme.uri“

然后将其用作

myvalue

？
此外，在我找到的所有示例中，这些数据都存储在

中，而

中则是

中，这是标准要求吗？我在

现在，基于这些示例，我计划嵌入如下内容：


图像/jpeg
扫描
20190519121225_003.jpg
1684
2788
恩美
2019-05-19T12:12:25Z
2019-01-02
6.
2.
银行
陈述
02/01/2019
第2页，共6页
（这里是原始OCR内容
作为多行文本）
银行
陈述

这有意义吗？我相信很多人已经做过类似的工作，我不想重新发明轮子