Python 如何使用pycharm应用TFIDF查找csv文件中的重要单词
我有一个包含一些数据的文件 我所拥有的数据的一个例子Python 如何使用pycharm应用TFIDF查找csv文件中的重要单词,python,csv,nltk,tf-idf,Python,Csv,Nltk,Tf Idf,我有一个包含一些数据的文件 我所拥有的数据的一个例子 +------------+---------------------------------+-------------------------+ | SOC Code | Title | Occupational Category | +------------+---------------------------------+-------------------------
+------------+---------------------------------+-------------------------+
| SOC Code | Title | Occupational Category |
+------------+---------------------------------+-------------------------+
| 11-1011.03 | Chief Sustainability Officers | New & Emerging |
| 11-1021.00 | General and Operations Managers | Enhanced Skills |
+------------+---------------------------------+-------------------------+
我需要找到文件中最常用的单词
关于如何应用这一点有什么想法吗?以代码片段为例您可以使用NLTK
FreqDist
方法计算单词并返回最频繁的单词 欢迎来到stackoverflow。查看TF-IDF上的wikipedia条目,你会发现如果你只有一个文档,那么它就没有意义了——你需要一个包含许多文档的集合,TF-IDF可以从中进行选择。你可能需要一个不同的指标,你肯定需要一个更好的问题陈述。请注意,在这个网站上,你给了我们一些代码,我们会帮助你改进。阅读这个相关的问题:这与PyCharm无关。只是个编辑。您可以编写Python程序,在任意数量的编辑器中对CSV文件进行操作。