Python 如何使用pycharm应用TFIDF查找csv文件中的重要单词

Python 如何使用pycharm应用TFIDF查找csv文件中的重要单词,python,csv,nltk,tf-idf,Python,Csv,Nltk,Tf Idf,我有一个包含一些数据的文件 我所拥有的数据的一个例子 +------------+---------------------------------+-------------------------+ | SOC Code | Title | Occupational Category | +------------+---------------------------------+-------------------------

我有一个包含一些数据的文件

我所拥有的数据的一个例子

+------------+---------------------------------+-------------------------+
|  SOC Code  |              Title              |  Occupational Category  |
+------------+---------------------------------+-------------------------+
| 11-1011.03 | Chief Sustainability Officers   | New & Emerging          |
| 11-1021.00 | General and Operations Managers | Enhanced Skills         |
+------------+---------------------------------+-------------------------+
我需要找到文件中最常用的单词
关于如何应用这一点有什么想法吗?以代码片段为例

您可以使用NLTK
FreqDist
方法计算单词并返回最频繁的单词

欢迎来到stackoverflow。查看TF-IDF上的wikipedia条目,你会发现如果你只有一个文档,那么它就没有意义了——你需要一个包含许多文档的集合,TF-IDF可以从中进行选择。你可能需要一个不同的指标,你肯定需要一个更好的问题陈述。请注意,在这个网站上,你给了我们一些代码,我们会帮助你改进。阅读这个相关的问题:这与PyCharm无关。只是个编辑。您可以编写Python程序,在任意数量的编辑器中对CSV文件进行操作。