Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/api/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Carrot2API不支持日语_Api_Carrot2 - Fatal编程技术网

Carrot2API不支持日语

Carrot2API不支持日语,api,carrot2,Api,Carrot2,我正在尝试使用Carrot2API对日语文档进行集群。它发出了这样的警告: org.carrot2.text.language.DefaultTokenizerFactory:日语ja的标记器不可用。这可能会降低日语内容的聚类质量 因此,群集过程失败,所有文档都属于其他主题群集 解决这个问题有什么帮助吗 提前感谢。遗憾的是,Carrot2中提供的开源算法不支持日语。增加该常数是为了涵盖未来可能对日本人的支持 或者,您可以尝试使用定制的语言管道运行Carrot2,Carrot2 Java API发

我正在尝试使用Carrot2API对日语文档进行集群。它发出了这样的警告:

org.carrot2.text.language.DefaultTokenizerFactory:日语ja的标记器不可用。这可能会降低日语内容的聚类质量

因此,群集过程失败,所有文档都属于其他主题群集

解决这个问题有什么帮助吗


提前感谢。

遗憾的是,Carrot2中提供的开源算法不支持日语。增加该常数是为了涵盖未来可能对日本人的支持


或者,您可以尝试使用定制的语言管道运行Carrot2,Carrot2 Java API发行版中的示例类展示了如何实现这一点。

我知道这一点。但它们支持创建自定义语言模型来自定义文本分析器。然而,由于Carrot2API缺乏指南和文档,我很难覆盖他们的文本分析器。是否有详细的文档/示例用于覆盖语言模型?这一点很好。我编辑了答案,添加了自定义代码示例的链接。