Java 如何裁剪图像以分离其中包含的文本?

Java 如何裁剪图像以分离其中包含的文本?,java,android,image,image-processing,tesseract,Java,Android,Image,Image Processing,Tesseract,如果你看附件中的图片,你会发现上面有图片+文字。我想要的是裁剪这个图像,使包含部分内容的文本被分离出来,其余部分被丢弃。我该怎么做呢?你的要求很难。一个图像识别库可以让你开始学习,但是要从中获得一致的结果是非常困难的。这类问题进入了研究领域。以下是一篇可能会有所帮助的博客文章: 你说得对,我已经在处理tesseract了,问这个问题是因为tesseract只识别图像的纯文本部分,否则返回垃圾。如果清除图像的彩色部分,只留下文本部分,如本任务中最新技术要求的f分数低于70%,请注意这一点。你需要简

如果你看附件中的图片,你会发现上面有图片+文字。我想要的是裁剪这个图像,使包含部分内容的文本被分离出来,其余部分被丢弃。我该怎么做呢?

你的要求很难。一个图像识别库可以让你开始学习,但是要从中获得一致的结果是非常困难的。这类问题进入了研究领域。以下是一篇可能会有所帮助的博客文章:


你说得对,我已经在处理tesseract了,问这个问题是因为tesseract只识别图像的纯文本部分,否则返回垃圾。如果清除图像的彩色部分,只留下文本部分,如本任务中最新技术要求的f分数低于70%,请注意这一点。你需要简化你的任务,在你的情况下简化是可以的。您想从整个图像中提取文本还是仅从浏览器中提取文本?只保留浏览器窗口。现在,您可以直接访问此站点。通过解析它生成的html,制作它的纯文本版本要简单得多。之后,从中获取单个图像,并对其进行单独处理以提取文本。