Computer vision 计算机视觉OCR的训练_Computer Vision_Ocr_Azure Cognitive Services

Computer vision 计算机视觉OCR的训练

computer-vision

Computer vision 计算机视觉OCR的训练,computer-vision,ocr,azure-cognitive-services,Computer Vision,Ocr,Azure Cognitive Services,我设置了Azure计算机视觉服务并在我的应用程序中使用。当我尝试在一些图像上执行OCR时，它无法识别所有文本（即在“cups”中省略“S”）。当无法正确识别文本时，是否可以在OCR中对其进行培训/再培训？OCR工具并非总能检测到所有内容。您可以尝试在将某些图像发送到azure之前对其进行预处理。根据您提供的图像和信息，我快速检查了Computer Vision API的输出，该API具有多个文本处理操作： OCR：原始的，同步的识别文本：第二个，异步，最后一个将不推荐使用批读取（2.0

我设置了Azure计算机视觉服务并在我的应用程序中使用。当我尝试在一些图像上执行OCR时，它无法识别所有文本（即在“cups”中省略“S”）。

当无法正确识别文本时，是否可以在OCR中对其进行培训/再培训？

OCR工具并非总能检测到所有内容。您可以尝试在将某些图像发送到azure之前对其进行预处理。

根据您提供的图像和信息，我快速检查了Computer Vision API的输出，该API具有多个文本处理操作：

OCR：原始的，同步的
识别文本：第二个，异步，最后一个将不推荐使用
批读取（2.0和2.1）>读取（3.0）：最新版本，也是异步的

在结果质量方面，读取操作更好，尤其是对于旋转项目和其他情况

下面是一个带有图像（）的输出示例，由认知工作台生成，这是一个开源的认知服务演示

光学字符识别

您可以看到一些错误：

“能干”后面有一个“*”
“我们自己”缺少“S”
最后一个句点是逗号

识别文本

这里唯一的问题是末尾缺少的时间段

批读

这里唯一的问题是末尾缺少的时间段

结论：使用目前普遍可用的Read 3.0。API链接：

您在应用程序中使用了哪种OCR操作？认识文字，还是阅读？您还可以提供一个示例图像吗？我使用的是RecognizePrintedTextAsync和该图像。它没有识别最后一行“我们自己”中的“S”。另外，将句点识别为逗号。看起来您实际上使用的是“OCR”操作，而不是“RecognizeText”或“BatchRead”。我将填写一个回复，以指导您获得正确的结果谢谢您的详细回复。根据我最初的问题，这些功能中的任何一个可以进行培训/再培训吗？不，它们不能进行培训