Node.js 无法使用节点tesseract从表单中读取手写文本
我无法使用node-tesseract准确读取表单。只有表单的打印文本才能正确识别和返回,而手写文本返回时带有一些特殊字符 我的密码是Node.js 无法使用节点tesseract从表单中读取手写文本,node.js,tesseract,Node.js,Tesseract,我无法使用node-tesseract准确读取表单。只有表单的打印文本才能正确识别和返回,而手写文本返回时带有一些特殊字符 我的密码是 var options = { l: 'deu', psm: 6, env: { maxBuffer: 4096 * 4096 } }; tesseract.process('./server/image
var options = {
l: 'deu',
psm: 6,
env: {
maxBuffer: 4096 * 4096
}
};
tesseract.process('./server/images/form.jpg', options, function (err,text) {
if (err) {
return console.log("An error occured: ", err);
}
console.log("Recognized text:");
console.log(text);
});
我的输入------->所有者Brian Dude
输出------->OW_NERägga])ggé;='代码>
在这里,所有者是此处存档的一些文本您可以训练tesseract识别您的手写文本。
看
请看以下文件。这两个都是使用Tesseract训练过程进行手写识别的示例李>
查看Tesseract官方培训页面
下面的链接将带您完成培训过程,它对我帮助很大。
使用第三方GUI进行Tesseract培训,将使您的生活更加轻松。我推荐tesseract4java和jTessBoxEditor(两者都适用于OS X)
可能重复的