Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/swift/20.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Computer vision 计算机视觉OCR的训练_Computer Vision_Ocr_Azure Cognitive Services - Fatal编程技术网

Computer vision 计算机视觉OCR的训练

Computer vision 计算机视觉OCR的训练,computer-vision,ocr,azure-cognitive-services,Computer Vision,Ocr,Azure Cognitive Services,我设置了Azure计算机视觉服务并在我的应用程序中使用。当我尝试在一些图像上执行OCR时,它无法识别所有文本(即在“cups”中省略“S”)。 当无法正确识别文本时,是否可以在OCR中对其进行培训/再培训?OCR工具并非总能检测到所有内容。您可以尝试在将某些图像发送到azure之前对其进行预处理。 根据您提供的图像和信息,我快速检查了Computer Vision API的输出,该API具有多个文本处理操作: OCR:原始的,同步的 识别文本:第二个,异步,最后一个将不推荐使用 批读取(2.0

我设置了Azure计算机视觉服务并在我的应用程序中使用。当我尝试在一些图像上执行OCR时,它无法识别所有文本(即在“cups”中省略“S”)。
当无法正确识别文本时,是否可以在OCR中对其进行培训/再培训?

OCR工具并非总能检测到所有内容。您可以尝试在将某些图像发送到azure之前对其进行预处理。

根据您提供的图像和信息,我快速检查了Computer Vision API的输出,该API具有多个文本处理操作:

  • OCR:原始的,同步的
  • 识别文本:第二个,异步,最后一个将不推荐使用
  • 批读取(2.0和2.1)>读取(3.0):最新版本,也是异步的
在结果质量方面,读取操作更好,尤其是对于旋转项目和其他情况

下面是一个带有图像()的输出示例,由认知工作台生成,这是一个开源的认知服务演示

光学字符识别

您可以看到一些错误:

  • “能干”后面有一个“*”
  • “我们自己”缺少“S”
  • 最后一个句点是逗号
识别文本

这里唯一的问题是末尾缺少的时间段

批读

这里唯一的问题是末尾缺少的时间段


结论:使用目前普遍可用的Read 3.0。API链接:

您在应用程序中使用了哪种OCR操作?认识文字,还是阅读?您还可以提供一个示例图像吗?我使用的是RecognizePrintedTextAsync和该图像。它没有识别最后一行“我们自己”中的“S”。另外,将句点识别为逗号。看起来您实际上使用的是“OCR”操作,而不是“RecognizeText”或“BatchRead”。我将填写一个回复,以指导您获得正确的结果谢谢您的详细回复。根据我最初的问题,这些功能中的任何一个可以进行培训/再培训吗?不,它们不能进行培训