Node.js Tesseract-如何从图像中提取输入坐标的文本?
我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作 您需要查看从Tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框 参考: 更新: 我为你做了一些调查。 这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo ✓&q=tesseract+语言%3Ajavascript 最好的是Node.js Tesseract-如何从图像中提取输入坐标的文本?,node.js,ocr,tesseract,image-recognition,text-recognition,Node.js,Ocr,Tesseract,Image Recognition,Text Recognition,我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作 您需要查看从Tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框 参考: 更新: 我为你做了一些调查。 这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo ✓&q=tesseract+语言%3Ajavascript 最好的
tesseract.js
,拥有超过10000颗星星,最近仍有提交
我突出显示的部分是
.hocr
(tesseract.js
将其命名为html
)您需要查看从tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框
参考:
更新:
我为你做了一些调查。
这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo
✓&q=tesseract+语言%3Ajavascript
最好的是tesseract.js
,拥有超过10000颗星星,最近仍有提交
我强调的部分是
.hocr
(tesseract.js
将其命名为html
)我知道这是一个旧线程,但是我有同样的要求,找不到解决方案,所以我修改了模块并发布到Git上:
我知道这是一个旧线程,但是我有同样的要求,找不到解决方案,所以我修改了模块并发布到Git上:
当我们也使用节点tesseract时,.hocr文件是否存在?(从npm获得的软件包)如何访问它?更新了我的答案,我不写nodejs和使用node-tesseract,因此无法就此给出答案。当我们使用node-tesseract时,.hocr文件是否也存在?(从npm获得的软件包)如何访问它?更新了我的答案,我不写nodejs和使用node-tesseract,所以不能给你这个答案。