Machine learning 如何根据同一个单词对句子进行聚类?

Machine learning 如何根据同一个单词对句子进行聚类?,machine-learning,data-mining,cluster-analysis,Machine Learning,Data Mining,Cluster Analysis,以下是我的示例数据: maybe add a higher-level description min of spare daemons data in the appropriate order the compiled max daemons an iovec to store the trailer sent after the file data in the wrong order an iovec to store the headers sent before the file ret

以下是我的示例数据:

maybe add a higher-level description
min of spare daemons
data in the appropriate order
the compiled max daemons
an iovec to store the trailer sent after the file
data in the wrong order
an iovec to store the headers sent before the file
return err maybe add a higher-level desc
if a user manually creates a data file
我想采用一种集群方法,自动将这些数据分类 同一个词出现在句子中,所以我想要达到的是:

  • 也许可以添加一个更高层次的描述

    return err可能会添加更高级别的描述

  • 达蒙斯

    备用守护进程的最小值

    编译的max守护进程

  • iovec

    用于存储文件前发送的标题的iovec

    iovec用于存储文件后发送的拖车

  • 资料

    数据顺序错误

    按适当顺序排列数据

    如果用户手动创建数据文件


  • 谁能给我一些帮助吗?多谢各位

    听起来好像你想找到最常用的单词


    不是很难做到(也不是“聚类”,只是按常用词进行计数和分组),你尝试了什么,你被困在哪里了?

    听起来好像你想找到最常用的词


    不是很难做到(也不是“聚类”,只是按常用词进行计数和分组),你尝试了什么,你被困在哪里了?

    我认为你特别想要的是一个最小覆盖范围。每个句子都可以被其中的任何一个单词“覆盖”,你想要一组至少覆盖每个句子一次的单词,对吗

    你可以在上读到关于这类问题的具体内容,事实上,要在NP完全中做到完美

    一种方法是一个简单的贪婪算法,寻找一个包含最多句子的单词(集合中最频繁的单词,没有重复计算的句子),然后把这组单词转移到剩下的单词上

    在很多情况下,这远远不是最优的,特别是如果你希望团队规模相似的话。实际上,您可能想扔掉覆盖太多的单词——例如,根据集合的不同,“程序”可能出现在许多项目中,而与大多数项目没有特别的相关性


    在这种情况下,找到相关内容就成了一个问题。也许有一些参数A是有意义的,用于组的数量,然后你的程序可以针对每个单词给出大致N/A的句子?数一数单词频率,寻找该点(频率为N/a),然后慢慢添加单词,直到所有内容都被覆盖。然后在最后一个后期阶段,尝试合并公共集合的子集,以使其整体更干净。

    我认为您特别需要的是一个最小覆盖。每个句子都可以被其中的任何一个单词“覆盖”,你想要一组至少覆盖每个句子一次的单词,对吗

    你可以在上读到关于这类问题的具体内容,事实上,要在NP完全中做到完美

    一种方法是一个简单的贪婪算法,寻找一个包含最多句子的单词(集合中最频繁的单词,没有重复计算的句子),然后把这组单词转移到剩下的单词上

    在很多情况下,这远远不是最优的,特别是如果你希望团队规模相似的话。实际上,您可能想扔掉覆盖太多的单词——例如,根据集合的不同,“程序”可能出现在许多项目中,而与大多数项目没有特别的相关性


    在这种情况下,找到相关内容就成了一个问题。也许有一些参数A是有意义的,用于组的数量,然后你的程序可以针对每个单词给出大致N/A的句子?数一数单词频率,寻找该点(频率为N/a),然后慢慢添加单词,直到所有内容都被覆盖。然后在最后一个后期阶段,尝试合并公共集合的子集,以使其整体更干净。

    非常感谢您,我想我们的答案就是我要找的!非常感谢你,亲爱的,我想我们的答案就是我想要的!嗨,亚历克斯,非常感谢你的友好回复,我从中受益匪浅,希望你一切顺利!嗨,亚历克斯,非常感谢你的友好回复,我从中受益匪浅,希望你一切顺利!