Node.js Tesseract-如何从图像中提取输入坐标的文本?

Node.js Tesseract-如何从图像中提取输入坐标的文本?,node.js,ocr,tesseract,image-recognition,text-recognition,Node.js,Ocr,Tesseract,Image Recognition,Text Recognition,我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作 您需要查看从Tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框 参考: 更新: 我为你做了一些调查。 这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo ✓&q=tesseract+语言%3Ajavascript 最好的

我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作

您需要查看从Tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框

参考:

更新

我为你做了一些调查。 这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo

✓&q=tesseract+语言%3Ajavascript

最好的是
tesseract.js
,拥有超过10000颗星星,最近仍有提交


我突出显示的部分是
.hocr
tesseract.js
将其命名为
html

您需要查看从tesseract返回的.hocr文件(您可以先在谷歌上搜索hocr以获取更多信息)。.hocr包括文本的所有边界框(x、y、宽度、高度、语言等)。然后计算所有位于输入坐标内的框

参考:

更新

我为你做了一些调查。 这里是您可以在github上找到的Javascript中的“最佳”(大多数明星)github repo

✓&q=tesseract+语言%3Ajavascript

最好的是
tesseract.js
,拥有超过10000颗星星,最近仍有提交


我强调的部分是
.hocr
tesseract.js
将其命名为
html

我知道这是一个旧线程,但是我有同样的要求,找不到解决方案,所以我修改了模块并发布到Git上:


我知道这是一个旧线程,但是我有同样的要求,找不到解决方案,所以我修改了模块并发布到Git上:


当我们也使用节点tesseract时,.hocr文件是否存在?(从npm获得的软件包)如何访问它?更新了我的答案,我不写nodejs和使用node-tesseract,因此无法就此给出答案。当我们使用node-tesseract时,.hocr文件是否也存在?(从npm获得的软件包)如何访问它?更新了我的答案,我不写nodejs和使用node-tesseract,所以不能给你这个答案。