Node.js Tesseract-如何从图像中提取输入坐标的文本？_Node.js_Ocr_Tesseract_Image Recognition_Text Recognition

Node.js Tesseract-如何从图像中提取输入坐标的文本？

node.js

Node.js Tesseract-如何从图像中提取输入坐标的文本？,node.js,ocr,tesseract,image-recognition,text-recognition,Node.js,Ocr,Tesseract,Image Recognition,Text Recognition,我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作您需要查看从Tesseract返回的.hocr文件（您可以先在谷歌上搜索hocr以获取更多信息）。.hocr包括文本的所有边界框（x、y、宽度、高度、语言等）。然后计算所有位于输入坐标内的框参考：更新：我为你做了一些调查。这里是您可以在github上找到的Javascript中的“最佳”（大多数明星）github repo ✓&q=tesseract+语言%3Ajavascript 最好的

我需要输入图像和坐标。输入坐标中的文本必须作为输出读取。如何使用节点tesseract执行此操作

您需要查看从Tesseract返回的.hocr文件（您可以先在谷歌上搜索hocr以获取更多信息）。.hocr包括文本的所有边界框（x、y、宽度、高度、语言等）。然后计算所有位于输入坐标内的框

参考：

更新：

我为你做了一些调查。这里是您可以在github上找到的Javascript中的“最佳”（大多数明星）github repo

✓&q=tesseract+语言%3Ajavascript

最好的是

tesseract.js

，拥有超过10000颗星星，最近仍有提交

我突出显示的部分是

.hocr

（

tesseract.js

将其命名为

html

）

您需要查看从tesseract返回的.hocr文件（您可以先在谷歌上搜索hocr以获取更多信息）。.hocr包括文本的所有边界框（x、y、宽度、高度、语言等）。然后计算所有位于输入坐标内的框

参考：

更新：

我为你做了一些调查。这里是您可以在github上找到的Javascript中的“最佳”（大多数明星）github repo

✓&q=tesseract+语言%3Ajavascript

最好的是

tesseract.js

，拥有超过10000颗星星，最近仍有提交

我强调的部分是

.hocr

（

tesseract.js

将其命名为

html

）

我知道这是一个旧线程，但是我有同样的要求，找不到解决方案，所以我修改了模块并发布到Git上：

当我们也使用节点tesseract时，.hocr文件是否存在？（从npm获得的软件包）如何访问它？更新了我的答案，我不写nodejs和使用node-tesseract，因此无法就此给出答案。当我们使用node-tesseract时，.hocr文件是否也存在？（从npm获得的软件包）如何访问它？更新了我的答案，我不写nodejs和使用node-tesseract，所以不能给你这个答案。