在swift中使用OCR扫描发票
我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体,格式相同 示例发票的底部如下所示 这是用户需要扫描的内容 我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。 但我得到的结果是: 我可以计算这些值是否正确,除了中间出现的量。在本例中,它显示为“355700”,但如果用户将相机向右移动一点,我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词,我不知道是否给出了完整的总和 如果我在单词前有一个空格,我可以得到一个完整的“单词”,在这个例子中是一个总和在swift中使用OCR扫描发票,swift,ocr,firebase-mlkit,text-recognition,Swift,Ocr,Firebase Mlkit,Text Recognition,我目前正在使用OCR扫描扫描发票。所有发票均使用“OCRB”字体,格式相同 示例发票的底部如下所示 这是用户需要扫描的内容 我尝试了许多不同的库来检测我想要什么。但是大多数库并没有给出正确的结果。最好的结果来自Firebase ML视觉文本识别。 但我得到的结果是: 我可以计算这些值是否正确,除了中间出现的量。在本例中,它显示为“355700”,但如果用户将相机向右移动一点,我得到的结果是“55700”。由于MLKit和其他库都围绕着这个词,我不知道是否给出了完整的总和 如果我在单词前有一个
任何人都知道如何使用哪个图书馆才能获得最佳效果?询问图书馆是离题的,你的问题将被社区关闭。问题可能不在于你使用的是什么库,它可以检测文本,但在某些角度它会失去准确性,它们很可能都会这样做。你可能需要改进你的逻辑。例如,您可以添加额外的逻辑来检查您是否可以看到页面的边缘,是否在底部检测到5个“块”,页面的边缘是否指示相机直接指向页面,而不是以某个角度等。这里无法解释太多了