Python 我将如何进行图像标签/分类?

Python 我将如何进行图像标签/分类?,python,machine-learning,deep-learning,classification,Python,Machine Learning,Deep Learning,Classification,假设我有一组护照的图片。我正在进行一个项目,在这个项目中,我必须识别每个护照上的名称,并最终将该对象转换为文本 对于标签(或分类(我想是初学者)的第一部分,每个护照上都有名字,我该怎么做 我可以使用什么技术/软件来实现这一点 在伟大的细节或任何链接将是伟大的。我正试图弄清楚这到底是怎么做到的,这样我就可以开始编码了 我知道训练一个模特可能会涉及,但我只是不确定 如果这很重要的话,我正在使用Python 谢谢您可以选择两条路线,一条是您标记了数据(或者您想自己标记数据),另一条是您没有标记数据 让

假设我有一组护照的图片。我正在进行一个项目,在这个项目中,我必须识别每个护照上的名称,并最终将该对象转换为文本

对于标签(或分类(我想是初学者)的第一部分,每个护照上都有名字,我该怎么做

我可以使用什么技术/软件来实现这一点

在伟大的细节或任何链接将是伟大的。我正试图弄清楚这到底是怎么做到的,这样我就可以开始编码了

我知道训练一个模特可能会涉及,但我只是不确定

如果这很重要的话,我正在使用Python


谢谢

您可以选择两条路线,一条是您标记了数据(或者您想自己标记数据),另一条是您没有标记数据

让我们从后者开始。假设你有护照的图像。您希望检测图像中的文本位置以及该文本所说的内容。您可以使用名为
pytessaract
的库来实现这一点。这是一个人工智能,为你做到这一点。它工作得很好,因为它已经在很多其他图像上训练过,所以它在检测任何图像中的文本方面都很好


如果您有标签,您可以使用
pytessaract
改进您的模型,但这要困难得多。无论如何,如果你想学习它,我建议你学习
ŧensorflow
,并使用“迁移学习”来改进你的模型。

你可以采取两种方法,一种是你标记了数据(或者你想标记自己的数据),另一种是你没有标记数据

让我们从后者开始。假设你有护照的图像。您希望检测图像中的文本位置以及该文本所说的内容。您可以使用名为
pytessaract
的库来实现这一点。这是一个人工智能,为你做到这一点。它工作得很好,因为它已经在很多其他图像上训练过,所以它在检测任何图像中的文本方面都很好


如果您有标签,您可以使用
pytessaract
改进您的模型,但这要困难得多。如果你想学习它,我建议你学习
ŧensorflow
,并使用“迁移学习”来改进你的模型。

谢谢!我自己如何给图片贴标签?如果我想自己给图片贴标签,你会想在图片中的文本周围画一个边界框,并为每个边界框标记文本。所以当我贴标签时,比如说我正在处理2000张图片,我给500张图片贴标签。我是否会标记我想要的文本,以便能够提供培训,以便使用机器学习自动标记其余的文本?如果您从头开始(即不使用转移学习),500张图像将不足以执行纯文本(无额外处理)检测。如果你真的使用迁移学习,500张额外的图片可能会让它更好一些,但不会有太大的区别。我知道你要的是classific,但我觉得你不需要。因为护照是很好的护照,所以我只需要使用
numpy
将所有字母分开,然后分别识别每个字母,或者使用一个简单的预训练模型,甚至将其与模板进行比较(因为所有护照(可能)使用相同的字体。谢谢!我自己怎么给图片贴标签?如果我想自己给图片贴标签,你会想在图片中的文本周围画边界框,并为每个边界框标记文本。所以当我贴标签的时候,假设我正在用2000张图片做标签实例和我标记500。我是否会标记我想要的文本,以便我能够提供培训,以便使用机器学习自动标记其余的文本?如果你从头开始(即,你不使用转移学习),500张图像将不足以做简单的(无需额外处理)文本检测。如果你真的使用转移学习,500张额外的图像可能会让它更好一些,但不会有太大的区别。我知道你要求分类,但我认为你不需要。因为护照是很好的护照,我只需要使用
numpy
将所有字母分开,然后分别识别每个字母,或者使用一个简单的预先训练过的模型,或者甚至将其与模板进行比较(因为所有护照(可能)都有相同的字体)。