如何使用python根据主题对英语单词进行分类?

如何使用python根据主题对英语单词进行分类?,python,Python,如何使用python根据主题对英语单词进行分类?例如国家和政府:政权、政治、政治家、官员、民主……此外,还有其他主题:教育/家庭/经济/科目等等 我想整理一下《经济学人》杂志的词汇表,并根据频率和主题对它们进行分类。 目前,我已经完成了词频统计,下一步是如何用python自动分类这些单词?听起来很难处理。而且这不是一项简单的任务。如果我是你,我会考虑2种方法来做你所要求的。< /P> 制定你自己的规则 如果你完成了单词的计数,那么你应该将这些单词与主题匹配起来。没有免费的午餐。制定自己的分类规

如何使用python根据主题对英语单词进行分类?例如国家和政府:政权、政治、政治家、官员、民主……此外,还有其他主题:教育/家庭/经济/科目等等

我想整理一下《经济学人》杂志的词汇表,并根据频率和主题对它们进行分类。
目前,我已经完成了词频统计,下一步是如何用python自动分类这些单词?

听起来很难处理。而且这不是一项简单的任务。如果我是你,我会考虑2种方法来做你所要求的。< /P>
  • 制定你自己的规则

    • 如果你完成了单词的计数,那么你应该将这些单词与主题匹配起来。没有免费的午餐。制定自己的分类规则。e、 娱乐有很多“电视”和“戏剧”,所以如果一些文本有,那么我们可以猜测它属于娱乐
  • 机器学习

    • 如果你负担不起制定规则,就让机器来做吧。但即使在这种情况下,您也应该使用所需的类(主题)标记文章

    • 这里也可以使用无监督的预培训(例如聚类)。但最后,我们需要有主题的监督数据集

    • 你应该决定主题的分类

  • 欢迎来到ML世界。
    希望这有助于找到正确的起点

    你想做的事叫做。有很多方法可以做到这一点,但通常训练一个简单的模型就足够了。您还可以将TF-IDF矢量化与LSA结合起来进行主题建模。是比较两者的好指南。

    尝试学习函数映射(),它可以帮助您您好,非常感谢。你的建议对我帮助很大!但是我现在很困惑,不知道如何开始。我可以直接在互联网上找到现成的工具吗?如果没有,我应该如何做或学习主题建模?我是电气专业的硕士,有数学和Python方面的基础。@peak有很多关于如何使用Python进行LDA主题建模的指南,请参阅其中一个,并尝试用他们的数据模拟他们的示例,然后将所学知识应用到自己的数据中。对于库,spacy(用于文本预处理)和gensim用于机器学习逻辑。