在JPEG图像中存储OCR数据/元数据的任何常规标准?

在JPEG图像中存储OCR数据/元数据的任何常规标准?,ocr,rdf,exif,xmp,dublin-core,Ocr,Rdf,Exif,Xmp,Dublin Core,我想通过将元数据和文本内容(OCR’ed)添加到相同的jpeg文件中来组织扫描文档(收据、银行对账单等)的集合。是否有任何或多或少被普遍接受的存储此类数据的方法?有常用的模式吗? 例如,对于元数据,我发现了一个都柏林核心方案,但我想要的大多数字段都不存在,我不确定添加自定义字段的好方法是什么——我可以像使用DC或XMP方案一样使用它们吗(即myvalue或myvalue),或者我必须通过添加xmlns:myScheme来定义我自己的方案="http://myScheme.uri“然后将其用作my

我想通过将元数据和文本内容(OCR’ed)添加到相同的jpeg文件中来组织扫描文档(收据、银行对账单等)的集合。是否有任何或多或少被普遍接受的存储此类数据的方法?有常用的模式吗?
例如,对于元数据,我发现了一个都柏林核心方案,但我想要的大多数字段都不存在,我不确定添加自定义字段的好方法是什么——我可以像使用DC或XMP方案一样使用它们吗(即
myvalue
myvalue
),或者我必须通过添加
xmlns:myScheme来定义我自己的方案="http://myScheme.uri“
然后将其用作
myvalue

此外,在我找到的所有示例中,这些数据都存储在
中,而
中则是
中,这是标准要求吗?我在

现在,基于这些示例,我计划嵌入如下内容:


图像/jpeg
扫描
20190519121225_003.jpg
1684
2788
恩美
2019-05-19T12:12:25Z
2019-01-02
6.
2.
银行
陈述
02/01/2019
第2页,共6页
(这里是原始OCR内容
作为多行文本)
银行
陈述
这有意义吗?我相信很多人已经做过类似的工作,我不想重新发明轮子