Image processing Tesseract box文件中的数字是多少?
看在我的份上,我找不到任何关于Tesseract box文件如何工作以及坐标代表什么的文档 例如,我得到:Image processing Tesseract box文件中的数字是多少?,image-processing,ocr,tesseract,Image Processing,Ocr,Tesseract,看在我的份上,我找不到任何关于Tesseract box文件如何工作以及坐标代表什么的文档 例如,我得到: T 2768 165 2789 191 0 第一个标记显然是字符。我知道Tesseract使用左下角2768应位于底部。第四个标记(2789)似乎位于顶部。我不知道第三(165)、第五(191)和第六(0)令牌是什么165和191作为左/右坐标是不正确的,0我不知道它指的是什么 有人能帮我吗?这些是像素坐标,还是必须考虑图像的DPI 谢谢 根据,每行的格式为 <symbol>
T 2768 165 2789 191 0
第一个标记显然是字符。我知道Tesseract使用左下角<因此,代码>2768应位于底部。第四个标记(2789
)似乎位于顶部。我不知道第三(165
)、第五(191
)和第六(0
)令牌是什么165和191作为左/右坐标是不正确的,0
我不知道它指的是什么
有人能帮我吗?这些是像素坐标,还是必须考虑图像的DPI
谢谢 根据,每行的格式为
<symbol> <left> <bottom> <right> <top> <page>
会是
- 字符:
T
- 左:
2768
- 底部:
165
- 右:
2789
- 顶部:
191
- 页面:
0
Ha!感谢您链接文档!我猜坐标和坐标是错的。它只是一个字符,所以如果是像素或点,数字应该非常相似。我会看一下这些文件,看看能不能找到更多。谢谢这些数字是如何计算的。如何转换为笛卡尔坐标?
T 2768 165 2789 191 0