Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java文本和关键字限定_Java_String_Algorithm_Text Analysis_Keyword Search - Fatal编程技术网

Java文本和关键字限定

Java文本和关键字限定,java,string,algorithm,text-analysis,keyword-search,Java,String,Algorithm,Text Analysis,Keyword Search,我有140个字符的文本和一组关键字。 我想做的是编写一个算法,帮助我计算文本和关键字之间的百分比匹配,以便将文本限定为重复IT事件注释 例如: 文本:“明天将举行我们的每周活动,关于计算机。我们将讨论如何实现算法。这将是非常棒的。” 关键词:“事件、计算机、数据库、软件、算法” 这里匹配的是5个关键词中的3个词,即60% 使用单词计数并将其与关键字的数量进行比较,这有意义吗?这个方法准确吗? 以前有人处理过类似的事情吗 谢谢你的支持。是的,这绝对有道理。但是,您必须在实践中评估它是否足够精确以达

我有140个字符的文本和一组关键字。 我想做的是编写一个算法,帮助我计算文本和关键字之间的百分比匹配,以便将文本限定为重复IT事件注释

例如: 文本:“明天将举行我们的每周活动,关于计算机。我们将讨论如何实现算法。这将是非常棒的。” 关键词:“事件、计算机、数据库、软件、算法”

这里匹配的是5个关键词中的3个词,即60%

使用单词计数并将其与关键字的数量进行比较,这有意义吗?这个方法准确吗? 以前有人处理过类似的事情吗


谢谢你的支持。

是的,这绝对有道理。但是,您必须在实践中评估它是否足够精确以达到您的目的。这在很大程度上取决于你正在处理的文本

如果你想尝试更高级但不太复杂的东西:是比较文本的另一个常用方法

有大量用于文本分类的算法和库。是一个很好的Java库,可能会对您有所帮助


如果您对使用库感兴趣,您可以在最上面的答案中找到一个很好的概述。

是的,这绝对有意义。但是,您必须在实践中评估它是否足够精确以达到您的目的。这在很大程度上取决于你正在处理的文本

如果你想尝试更高级但不太复杂的东西:是比较文本的另一个常用方法

有大量用于文本分类的算法和库。是一个很好的Java库,可能会对您有所帮助

如果您对使用库感兴趣,您可以在最上面的答案中找到一个很好的概述