Ios Swift 3-我使用哪种像素格式类型进行最佳的文本识别?

Ios Swift 3-我使用哪种像素格式类型进行最佳的文本识别?,ios,swift,swift3,tesseract,Ios,Swift,Swift3,Tesseract,我正在使用Swift 3构建一个移动应用程序,允许用户拍照并在生成的图像上运行Tesseract OCR 据此: 我有很多可能的像素格式类型,可以用来格式化iPhone 7上拍摄的像素。我对所有这些术语一开始都意味着什么感到有点迷茫,但有没有人对什么格式能给我提供改进Tesseract文本识别的最佳机会提出建议 kCVPixelFormatType\u 24RGB、kCVPixelFormatType\u 24BGR、kCVPixelFormatType\u 32ARGB、kCVPixelFor

我正在使用Swift 3构建一个移动应用程序,允许用户拍照并在生成的图像上运行Tesseract OCR

据此:


我有很多可能的像素格式类型,可以用来格式化iPhone 7上拍摄的像素。我对所有这些术语一开始都意味着什么感到有点迷茫,但有没有人对什么格式能给我提供改进Tesseract文本识别的最佳机会提出建议

kCVPixelFormatType\u 24RGB、kCVPixelFormatType\u 24BGR、kCVPixelFormatType\u 32ARGB、kCVPixelFormatType\u 32BGRA、kCVPixelFormatType\u 32ABGR、kCVPixelFormatType\u 32RGBA
所有这些都是最佳选项,通常是最常见的选项(即:24位位图、24位PNG、32位位图、32位PNG等)

基本上,24位只包含R、G、B和像素分量,而alpha通道完全缺失。32位包含alpha通道,因此将使用R、G、B、A组件。通常,24位在Tesseract上工作得非常好,而32位在alpha通道透明时工作得非常好(所有字节为0x0或0xFF)。这相当于使用BMP或PNG格式

注:以上仅为格式。理想情况下,您的图像质量也需要相当好(最好的通常是白色文本、黑色背景或黑色文本、白色背景或文本与背景之间的对比度)。它也将取决于图像(不仅仅是格式)

至于捕获设置:
avcapturepotosettings
,分配一个将为您提供默认设置。您可以使用以下方法创建自己的:

它告诉您要传递哪些参数。它还允许您确定是否应该是高分辨率、实时照片等。。有关更多信息,请参见此处:

availablephotocodecytypes
返回JPEG、PNG、BMP等格式。只是支持压缩以进行捕获的不同格式。捕获原始或BMP时,将对其进行解压缩。例如,BMP压缩使用RLE(行程编码)。PNG使用zlib压缩,JPEG也使用zlib压缩


对于视频,它可能会返回MP4、MPEG-4等。请参阅:例如。

kCVPixelFormatType_24RGB、kCVPixelFormatType_24BGR、kCVPixelFormatType_32ARGB、kCVPixelFormatType_32BGRA、kCVPixelFormatType_32ABGR、kCVPixelFormatType_32RGBA所有这些都是最佳选项,通常是最常见的选项(即:24位位图、24位PNG、32位位图、32位PNG等)

基本上,24位仅包含R、G、B、像素组件,alpha通道完全缺失。32位包含alpha通道,因此将使用R、G、B、A组件。通常,24位在Tesseract上非常有效,而32位在alpha通道透明(所有字节为0x0或0xFF)时非常有效。这相当于使用BMP或PNG格式

注:以上只是格式。理想情况下,您的图像质量也需要相当好(最好的通常是白色文本、黑色背景或黑色文本、白色背景或文本与背景之间的对比度)。这也取决于图像(而不仅仅是格式)

至于捕获设置:
avcapturepotosettings
,分配一个将为您提供默认设置。您可以使用以下方法创建自己的设置:

它告诉您要传递的参数。它还允许您确定是否应该是高分辨率、实时照片等。您可以在此处查看更多信息:

availablePhotoCodecTypes
返回JPEG、PNG、BMP等格式。只是支持压缩以进行捕获的不同格式。当捕获原始或BMP时,它是未压缩的。例如,BMP压缩使用RLE(行程编码)。PNG使用zlib进行压缩,JPEG也使用zlib进行压缩


对于视频,它可能会返回MP4、MPEG-4等。请参阅:例如。

@Brandon感谢您的评论。如果您想写一个答案,我将接受它。此外,我正在尝试在我的
AVCapturePhotoSettings
初始值设定项中设置照片编解码器类型,但此页面没有提供关于编解码器的信息,只是它们是什么都在这个数组中。我怎么知道数组中有什么?@Brandon谢谢你的评论。如果你想写答案,我会接受。此外,我正在尝试在我的
AVCapturePhotoSettings
初始值设定项中设置照片编解码器类型,但本页没有告诉我编解码器是什么,只是它们在这个数组中。如何设置我知道数组中有什么吗?