Python 图像中的文本检测

Python 图像中的文本检测,python,ios,swift,ocr,coreml,Python,Ios,Swift,Ocr,Coreml,我使用下面的示例代码,使用coreml和vision在图像(非手写)中进行文本检测 在这方面,他们使用了只支持大写和数字的机器学习模型。在我的项目中,我需要大写、小写、数字和一些特殊字符(如:,-) 我没有任何python方面的经验来进行所需的更改并使用train数据生成所需的.mlmodel文件(我的需求中也没有这方面的经验) 下面是如何创建.mlmodel的链接 有人有这样的.mlmodel吗?或者有人能帮我实现这个目标吗 这是我想要检测文本的图像如果你想检测各种类型的字符,那么为什么不

我使用下面的示例代码,使用coreml和vision在图像(非手写)中进行文本检测

在这方面,他们使用了只支持大写和数字的机器学习模型。在我的项目中,我需要大写、小写、数字和一些特殊字符(如:,-)

我没有任何python方面的经验来进行所需的更改并使用train数据生成所需的.mlmodel文件(我的需求中也没有这方面的经验)

下面是如何创建.mlmodel的链接

有人有这样的.mlmodel吗?或者有人能帮我实现这个目标吗


这是我想要检测文本的图像

如果你想检测各种类型的字符,那么为什么不使用一些OCR引擎,比如Tesseract(),你可以看看这个()我曾经使用过tesseract,但在iOS上,它并不能为我正在使用的图像类型提供最佳效果。在做了大量的研发之后,我决定使用coreml来实现这一点。还有,我的图像是多行的。有人能帮我吗?要检测文本,你可以简单地使用Vision,它提供包含文本的矩形。要识别文本,你必须弄清楚这些矩形中的像素表示什么。(如果您总是尝试扫描完全相同类型的标签,那么您已经知道文本矩形的位置。)