用于测试Lucene的图像包-Hibernate搜索

用于测试Lucene的图像包-Hibernate搜索,lucene,hibernate-search,Lucene,Hibernate Search,我们正在电子档案项目中使用Lucene。因为我们没有那么多(图像版本的)文档,所以我们需要某种图像包来测试lucene。我上网查了一下,但没有找到上面的关键词。有人知道在哪里可以找到这些信息吗?或者我应该使用什么样的关键字?你说的“图像”包是什么意思?你的意思是你有真实的图像(如gif或png)并想从中提取文本?在本例中,我们讨论的是OCR软件,它可以从图像中提取文本,然后将文本馈送给Lucene。或者我完全误解了你的意思;-)很抱歉给你带来了困惑。首先,我们必须对图像进行OCR,然后将结果反馈

我们正在电子档案项目中使用Lucene。因为我们没有那么多(图像版本的)文档,所以我们需要某种图像包来测试lucene。我上网查了一下,但没有找到上面的关键词。有人知道在哪里可以找到这些信息吗?或者我应该使用什么样的关键字?

你说的“图像”包是什么意思?你的意思是你有真实的图像(如gif或png)并想从中提取文本?在本例中,我们讨论的是OCR软件,它可以从图像中提取文本,然后将文本馈送给Lucene。或者我完全误解了你的意思;-)很抱歉给你带来了困惑。首先,我们必须对图像进行OCR,然后将结果反馈给Lucene。因为OCR的问题,我们需要文档的图像。你试过搜索类似“OCR测试图像”的东西吗?就我个人而言,我会尝试获取与您的用例相匹配的测试数据。谢谢您的评论。。它只适用于测试OCR,而不适用于Lucene。但是OCR部分和Lucene部分是完全正交的。你必须拿出自己的工具链。