Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/ant/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Indexing 阿拉伯语内容的Solr索引(带变音符号)_Indexing_Solr_Arabic - Fatal编程技术网

Indexing 阿拉伯语内容的Solr索引(带变音符号)

Indexing 阿拉伯语内容的Solr索引(带变音符号),indexing,solr,arabic,Indexing,Solr,Arabic,每个文档由3个字段组成,两个字段是整数,第三个是带变音符号的阿拉伯文本,用户可能使用带/不带变音符号的单词,甚至有些字母可能带变音符号,而其他字母可能不带变音符号,我找不到schema.xml在这种情况下有帮助 my schema.xml现在如下所示: <?xml version="1.0" encoding="UTF-8" ?> <schema name="quran" version="1.5"> <fields> <field name

每个文档由3个字段组成,两个字段是整数,第三个是带变音符号的阿拉伯文本,用户可能使用带/不带变音符号的单词,甚至有些字母可能带变音符号,而其他字母可能不带变音符号,我找不到schema.xml在这种情况下有帮助

my schema.xml现在如下所示:

<?xml version="1.0" encoding="UTF-8" ?>

<schema name="quran" version="1.5">

<fields>
    <field name="_version_" type="long" indexed="true" stored="true"/>
    <field name="_id" type="long" indexed="true" stored="true" />
    <field name="sura_number" type="int" indexed="true" stored="true" />
    <field name="verse_number" type="int" indexed="true" stored="true" />
    <field name="verse_text" type="text_ar" indexed="true" stored="true"/>
 </fields>



<types>
    <fieldType name="string" class="solr.StrField" sortMissingLast="true" />
    <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true"/>

    <fieldType name="int" class="solr.TrieIntField" precisionStep="0" positionIncrementGap="0"/>
    <fieldType name="float" class="solr.TrieFloatField" precisionStep="0" positionIncrementGap="0"/>
    <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
    <fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" positionIncrementGap="0"/>

    <fieldType name="date" class="solr.TrieDateField" precisionStep="0" positionIncrementGap="0"/>

    <fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/>
    <dynamicField name="*_coordinate"  type="tdouble" indexed="true"  stored="false"/>

   <!--  Arabic  -->
   <fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
   <analyzer>
   <tokenizer class="solr.StandardTokenizerFactory"/>
   <!--  normalizes ﻯ to ﻱ, etc  -->
   <filter class="solr.ArabicNormalizationFilterFactory"/>
   <filter class="solr.ArabicStemFilterFactory"/>
   </analyzer>
   </fieldType>


</types>

</schema>

我还需要synonyms.txt作为阿拉伯语的同义词。

您要使用。这有点难理解,但如果你按照过滤器本身的链接,然后到ICU用户指南,你会发现


其中有些内容很难理解,因此您可能会发现作为起点很有用。

您认为如何使用schema.xml[幻灯片18]中的配置


您希望实现什么目标?现在没有索引?如果没有-请显示您当前的schema.xml、solrconfig.xml另请参阅同事为solr索引中文、韩文和日文文本所做的工作:这是一项相当艰巨的任务,但它是可行的。在进行查询时,我仍然无法得到任何结果,而且我还注释掉了最后两个过滤器,因为它们打开时无法加载索引。