在swift中使用OCR扫描发票_Swift_Ocr_Firebase Mlkit_Text Recognition

在swift中使用OCR扫描发票

swift

在swift中使用OCR扫描发票,swift,ocr,firebase-mlkit,text-recognition,Swift,Ocr,Firebase Mlkit,Text Recognition,我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体，格式相同示例发票的底部如下所示这是用户需要扫描的内容我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。但我得到的结果是：我可以计算这些值是否正确，除了中间出现的量。在本例中，它显示为“355700”，但如果用户将相机向右移动一点，我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词，我不知道是否给出了完整的总和如果我在单词前有一个

我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体，格式相同

示例发票的底部如下所示

这是用户需要扫描的内容

我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。但我得到的结果是：

我可以计算这些值是否正确，除了中间出现的量。在本例中，它显示为“355700”，但如果用户将相机向右移动一点，我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词，我不知道是否给出了完整的总和

如果我在单词前有一个空格，我可以得到一个完整的“单词”，在这个例子中是一个总和

任何人都知道如何使用哪个图书馆才能获得最佳效果？

询问图书馆是离题的，你的问题将被社区关闭。问题可能不在于你使用的是什么库，它可以检测文本，但在某些角度它会失去准确性，它们很可能都会这样做。你可能需要改进你的逻辑。例如，您可以添加额外的逻辑来检查您是否可以看到页面的边缘，是否在底部检测到5个“块”，页面的边缘是否指示相机直接指向页面，而不是以某个角度等。这里无法解释太多了