Lucidworks Hadoop Solr-将文本拆分为段落
我正在使用这个项目:和 我试着把一些文本分成段落,然后搜索单词。但作为回报,我接受了这句话。有可能做那样的事吗 我用的是:Lucidworks Hadoop Solr-将文本拆分为段落,hadoop,solr,lucidworks,bigdata,Hadoop,Solr,Lucidworks,Bigdata,我正在使用这个项目:和 我试着把一些文本分成段落,然后搜索单词。但作为回报,我接受了这句话。有可能做那样的事吗 我用的是: hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob -Dlww.commit.on.close=true -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="(?sm)^.*?\.\s*$" -Dcom.lu
hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob
-Dlww.commit.on.close=true
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="(?sm)^.*?\.\s*$"
-Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=match1_ss
-cls com.lucidworks.hadoop.ingest.RegexIngestMapper -c test2 -i /usr/local/hadoop/input
-s http://127.0.1.1:8983/solr -of com.lucidworks.hadoop.io.LWMapRedOutputFormat