使用Solr 3.6为每个实体行运行的嵌套CachedSqEntityProcessor?

使用Solr 3.6为每个实体行运行的嵌套CachedSqEntityProcessor?,solr,dataimporthandler,Solr,Dataimporthandler,我刚从Solr3.4升级到Solr3.6;我在两个版本中使用相同的data-import.xml。导入功能在3.4中正常运行 我使用嵌套实体来获取与每个文档关联的作者,并且使用CachedSqlEntityProcessor来避免不合理的命中DB次数。但是,在索引时,Solr索引速度非常慢,似乎正在为每个文档获取数据库中的所有作者。指数应为~500兆欧;当达到~6Gig时,我中止了索引。如果我注释掉下面嵌套的author实体,Solr将正常索引 我是否遗漏了一些明显的东西,或者这是一个bug &

我刚从Solr3.4升级到Solr3.6;我在两个版本中使用相同的data-import.xml。导入功能在3.4中正常运行

我使用嵌套实体来获取与每个文档关联的作者,并且使用CachedSqlEntityProcessor来避免不合理的命中DB次数。但是,在索引时,Solr索引速度非常慢,似乎正在为每个文档获取数据库中的所有作者。指数应为~500兆欧;当达到~6Gig时,我中止了索引。如果我注释掉下面嵌套的author实体,Solr将正常索引

我是否遗漏了一些明显的东西,或者这是一个bug

<document name="documents">
    <entity name="document" dataSource="production"
     transformer="HTMLStripTransformer,TemplateTransformer,RegexTransformer"
     query="select id, ..., from document">
        <field column="id" name="id"/>
        <field column="uid" name="uid" template="DOC${document.id}"/>
        <!-- more fields .. -->
        <entity name="author" dataSource="production"
         query="select 
                cast(da.document_id as text) as document_id, 
                a.id, a.name, a.signature from document_author da 
                left outer join author a on a.id = da.author_id"
         cacheKey="document_id"
         cacheLookup="document.id" 
         processor="CachedSqlEntityProcessor">
             <field name="author_id" column="id" />
             <field name="author" column="name" />
             <field name="author_signature" column="signature" />
        </entity>
    </entity>
</document>
中是对某个问题的引用。也许有个提示给你。