Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/308.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/apache/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 西班牙语文本的apache mahout_Java_Apache_Mahout - Fatal编程技术网

Java 西班牙语文本的apache mahout

Java 西班牙语文本的apache mahout,java,apache,mahout,Java,Apache,Mahout,有人知道ApacheMahout是否能很好地处理西班牙语文本吗?我需要对西班牙语的报纸文章进行聚类,但没有很多工具可以进行聚类。我认为Mahout是一个很酷的框架,但是它在处理西班牙语文本时好吗?为什么不好?您可以使用bin/mahout脚本的seq2sparse命令,并使用-a选项指定相应的Lucene analyzer org.apache.Lucene.analysis.es.SpanishAnalyzer。见第8章第199-200页。。。在行动手册中的Mahout 除此之外,您还可以使用

有人知道ApacheMahout是否能很好地处理西班牙语文本吗?我需要对西班牙语的报纸文章进行聚类,但没有很多工具可以进行聚类。我认为Mahout是一个很酷的框架,但是它在处理西班牙语文本时好吗?

为什么不好?您可以使用bin/mahout脚本的seq2sparse命令,并使用-a选项指定相应的Lucene analyzer org.apache.Lucene.analysis.es.SpanishAnalyzer。见第8章第199-200页。。。在行动手册中的Mahout


除此之外,您还可以使用现有的分析器编写自己的分析器。本书包含许多示例,您可以找到源代码。

非常感谢您提供的信息,我们将对此进行介绍