Image processing 从扫描纸中提取单词图像
我想得到一个小的图像,每个字在许多扫描书籍(即在波斯语(阿拉伯语脚本))。 我在图像处理方面没有实验。Image processing 从扫描纸中提取单词图像,image-processing,image-segmentation,scanning,Image Processing,Image Segmentation,Scanning,我想得到一个小的图像,每个字在许多扫描书籍(即在波斯语(阿拉伯语脚本))。 我在图像处理方面没有实验。 如何才能以最有效的方式完成这项工作?我建议您在MATLAB中编写一个类似这样的脚本。 a:字母之间最大距离的一半(以像素为单位) b:单词之间最小距离的一半。(以像素为单位) (希望a
如何才能以最有效的方式完成这项工作?我建议您在MATLAB中编写一个类似这样的脚本。
a:字母之间最大距离的一半(以像素为单位)
b:单词之间最小距离的一半。(以像素为单位)
(希望a 对页面的扫描图像设置阈值
I(I < Th) = 0;I(I > Th) = 1;
这将把字母连接在一起。消除噪音
I = bwareaopen(I,n);
这将删除少于n个像素的所有连接组件。进行连接组件分析
CC = bwconncomp(I);
Rect = regionprops(I,'BoundingBox');
这将返回包含单个单词的矩形坐标列表。
从原始副本中提取子矩阵,并使用imwrite()写入图像
CC = bwconncomp(I);
Rect = regionprops(I,'BoundingBox');