Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/swift/20.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在swift中使用OCR扫描发票_Swift_Ocr_Firebase Mlkit_Text Recognition - Fatal编程技术网

在swift中使用OCR扫描发票

在swift中使用OCR扫描发票,swift,ocr,firebase-mlkit,text-recognition,Swift,Ocr,Firebase Mlkit,Text Recognition,我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体,格式相同 示例发票的底部如下所示 这是用户需要扫描的内容 我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。 但我得到的结果是: 我可以计算这些值是否正确,除了中间出现的量。在本例中,它显示为“355700”,但如果用户将相机向右移动一点,我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词,我不知道是否给出了完整的总和 如果我在单词前有一个

我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体,格式相同

示例发票的底部如下所示

这是用户需要扫描的内容

我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。 但我得到的结果是:

我可以计算这些值是否正确,除了中间出现的量。在本例中,它显示为“355700”,但如果用户将相机向右移动一点,我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词,我不知道是否给出了完整的总和

如果我在单词前有一个空格,我可以得到一个完整的“单词”,在这个例子中是一个总和


任何人都知道如何使用哪个图书馆才能获得最佳效果?

询问图书馆是离题的,你的问题将被社区关闭。问题可能不在于你使用的是什么库,它可以检测文本,但在某些角度它会失去准确性,它们很可能都会这样做。你可能需要改进你的逻辑。例如,您可以添加额外的逻辑来检查您是否可以看到页面的边缘,是否在底部检测到5个“块”,页面的边缘是否指示相机直接指向页面,而不是以某个角度等。这里无法解释太多了