Java 任何有处理Nuance'的XML格式经验的人;什么是OmniPage SDK?

Java 任何有处理Nuance'的XML格式经验的人;什么是OmniPage SDK?,java,c,pdf,ocr,Java,C,Pdf,Ocr,我正在使用Nuance OmniPage SDK对图像和PDF执行OCR,在我的一个案例中,我必须解析OCR在识别文件时生成的XML文件,但这些数字没有真正意义。以下是SDK的示例输出: <page ocr-vers="OmniPageCSDK16" app-vers="OfficeDrop"> <description backColor="ffffff"> <source file="C:\Users\worksp

我正在使用Nuance OmniPage SDK对图像和PDF执行OCR,在我的一个案例中,我必须解析OCR在识别文件时生成的XML文件,但这些数字没有真正意义。以下是SDK的示例输出:

<page ocr-vers="OmniPageCSDK16" app-vers="OfficeDrop">
    <description backColor="ffffff">
        <source
            file="C:\Users\workspace\jobs\src\test\resources\test-docs\0003.tiff"
            dpix="300" dpiy="300" sizex="2480" sizey="3509" />
        <theoreticalPage size="Custom" marginLeft="0"
            marginTop="0" marginRight="0" marginBottom="0" width="2480" height="3509" />
    </description>
    <zones>
        <textZone l="1814" t="1517" r="4694" b="1733" fillingMethod="omnifont"
            recognitionModule="omnifontPlus2w" chrFilter="all">
            <ln l="1814" t="1517" r="4690" b="1728" baseLine="1680"
                underlined="none" fontSize="1100">
                <wd l="1814" t="1517" r="2539" b="1728">Sample</wd>
                <space width="67" />
                <wd l="2606" t="1541" r="2995" b="1680">text</wd>
                <space width="72" />
                <wd l="3067" t="1570" r="3302" b="1680">on</wd>
                <space width="72" />
                <wd l="3374" t="1517" r="3734" b="1680">line</wd>
                <space width="91" />
                <wd l="3826" t="1522" r="3912" b="1680">1</wd>
                <space width="82" />
                <wd l="3994" t="1570" r="4459" b="1728">page</wd>
                <space width="91" />
                <wd l="4550" t="1522" r="4690" b="1680">1.</wd>
                <space />
            </ln>
        </textZone>
    </zones>
</page>

样品
文本
在…上
线
1.
页
1.
页面大小定义很容易计算,((2480*72)/300)将为最终PDF页面提供正确的页面宽度(以点为单位,然后是高度),但其他值没有任何意义

1100的字体大小是多少?这些单词坐标呢?他们怎么能拥有页面上不存在的位置上的坐标

有没有人知道这种XML格式是什么,或者可以指点我做文档?我已经搜索了SDK附带的所有手册,但仍然找不到与这些值表示的内容或它们使用的单位相关的任何内容(我想肯定不是像素或点)


感谢您的帮助。我正在使用java绑定访问OmniPage C SDK。

Omni Page word coordidates通常以Twips的形式输出,您需要进行相应的点或像素转换。例如,如果我想计算200 dpi图像的测量值,我需要这样做(值*200)/1440像素。要进行交叉检查,只需在画笔中打开图像,查看每个单词的指针位置。

全页单词坐标通常以Twips为单位输出,您需要进行相应的点或像素转换。例如,如果我想计算200 dpi图像的测量值,我需要这样做(值*200)/1440像素。要交叉检查,只需在画笔中打开图像,查看每个单词的指针位置