Ruby on rails 上载200页2.4 MB的大文件时,出现此错误

Ruby on rails 上载200页2.4 MB的大文件时,出现此错误,ruby-on-rails,solr,fedora-commons,Ruby On Rails,Solr,Fedora Commons,RSolr::Error::Http-400错误请求 错误:“将文档id jd472w44j写入索引时出现异常;可能的分析错误:文档在field=“suggest”(其UTF8编码长于最大长度32766)中至少包含一个巨大的术语,所有这些术语都被跳过。请更正分析器,使其不产生此类术语。第一个巨大术语的前缀是:\'[10,114,116,105,-62,-80,49,52,32,9,32,49,49,49,49,49,102,105,108,108,108,105,108,108,32,49]…\

RSolr::Error::Http-400错误请求
错误:“将文档id jd472w44j写入索引时出现异常;可能的分析错误:文档在field=“suggest”(其UTF8编码长于最大长度32766)中至少包含一个巨大的术语,所有这些术语都被跳过。请更正分析器,使其不产生此类术语。第一个巨大术语的前缀是:\'[10,114,116,105,-62,-80,49,52,32,9,32,49,49,49,49,49,102,105,108,108,108,105,108,108,32,49]…\',原始消息:字节的长度最多为32766;得到36558。可能文档的索引字符串字段(solr.StrField)太大“,”code'=>400}

,因为文档的字段值大于lucene限制。


更改模式文件中的字段类型

它表示您的一个术语(“单词”)大于32KB。出现此错误的常见原因是,您正在将全文添加到
标准字段
中,或者使用
文本字段
和不拆分单词的标记器(例如
关键字标记器


检查您的架构,查看哪些字段处理大部分文本。确保它是
TextField
,并且具有合适的标记器。ASCII 32是空格,它出现在您粘贴的术语前缀中,因此
WhiteSpaceTokenizer
可能是您所需要的。

感谢您的解决方案。我试图更改数据类型bt给出了这个错误
{“responseHeader”:{“status”:0,“QTime”:35},“errors”:[{“errorMessages”:“schema不可编辑”}]}
我正在使用solr 6.3.0。如果您在云模式下运行,您可以手动编辑模式,上载新版本,将其分配给集合并重新加载索引。您可以使模式可编辑: