用于可视化的HOCR到HTML

用于可视化的HOCR到HTML,html,ocr,hocr,Html,Ocr,Hocr,如何转换为HTML进行可视化 如果打开原始hOCR文件,其仅呈现为纯文本(元素未定位)hOCR是HTML。您可以在web浏览器中查看此任务。此任务有不同的解决方案,我知道以下三种: (将hocr数据覆盖在图像上,不同的选项如何显示) (左侧显示图像,右侧显示hocr数据,可用于输入校正) 所有这些repo似乎主要由一些JavaScript和CSS文件组成。前两个回购协议都有一个链接,指向我拍摄照片的演示页面 第一个提供了Greasemonkey/Tampermonkey脚本,该脚本允许

如何转换为HTML进行可视化


如果打开原始hOCR文件,其仅呈现为纯文本(元素未定位)

hOCR是HTML。您可以在web浏览器中查看此任务。

此任务有不同的解决方案,我知道以下三种:

  • (将hocr数据覆盖在图像上,不同的选项如何显示)

  • (左侧显示图像,右侧显示hocr数据,可用于输入校正)

所有这些repo似乎主要由一些JavaScript和CSS文件组成。前两个回购协议都有一个链接,指向我拍摄照片的演示页面


第一个提供了Greasemonkey/Tampermonkey脚本,该脚本允许将此覆盖注入任何合适的hocr网站在线和本地(可能有一些配置)。我不知道为您自己的hocr文件使用其他解决方案有多困难,但这应该是可行的。

要将接口添加到普通hocr文件,请在结束标记之前添加以下行:

<script src="https://unpkg.com/hocrjs"></script>

然后在浏览器中打开html(hOCR)文件