Ruby on rails 上载200页2.4 MB的大文件时,出现此错误
RSolr::Error::Http-400错误请求Ruby on rails 上载200页2.4 MB的大文件时,出现此错误,ruby-on-rails,solr,fedora-commons,Ruby On Rails,Solr,Fedora Commons,RSolr::Error::Http-400错误请求 错误:“将文档id jd472w44j写入索引时出现异常;可能的分析错误:文档在field=“suggest”(其UTF8编码长于最大长度32766)中至少包含一个巨大的术语,所有这些术语都被跳过。请更正分析器,使其不产生此类术语。第一个巨大术语的前缀是:\'[10,114,116,105,-62,-80,49,52,32,9,32,49,49,49,49,49,102,105,108,108,108,105,108,108,32,49]…\
错误:“将文档id jd472w44j写入索引时出现异常;可能的分析错误:文档在field=“suggest”(其UTF8编码长于最大长度32766)中至少包含一个巨大的术语,所有这些术语都被跳过。请更正分析器,使其不产生此类术语。第一个巨大术语的前缀是:\'[10,114,116,105,-62,-80,49,52,32,9,32,49,49,49,49,49,102,105,108,108,108,105,108,108,32,49]…\',原始消息:字节的长度最多为32766;得到36558。可能文档的索引字符串字段(solr.StrField)太大“,”code'=>400},因为文档的字段值大于lucene限制。
更改模式文件中的字段类型它表示您的一个术语(“单词”)大于32KB。出现此错误的常见原因是,您正在将全文添加到
标准字段
中,或者使用文本字段
和不拆分单词的标记器(例如关键字标记器
)
检查您的架构,查看哪些字段处理大部分文本。确保它是
TextField
,并且具有合适的标记器。ASCII 32是空格,它出现在您粘贴的术语前缀中,因此WhiteSpaceTokenizer
可能是您所需要的。感谢您的解决方案。我试图更改数据类型bt给出了这个错误{“responseHeader”:{“status”:0,“QTime”:35},“errors”:[{“errorMessages”:“schema不可编辑”}]}
我正在使用solr 6.3.0。如果您在云模式下运行,您可以手动编辑模式,上载新版本,将其分配给集合并重新加载索引。您可以使模式可编辑: