文本挖掘-挖掘描述性excel工作表数据的最佳方法是什么

文本挖掘-挖掘描述性excel工作表数据的最佳方法是什么,excel,text-mining,data-analysis,vba,Excel,Text Mining,Data Analysis,Vba,我从excel表格中的数据库中提取了大学就业数据。我需要对公司提供的工作描述进行文本挖掘,这是所有行的描述性字段,然后对需求中的概要文件进行分析。 这是数据的快照 有人能帮我开始这项活动吗 谢谢 Saurabh我不是数据专家,但我有一些数据挖掘经验。首先,我会尝试以下步骤: Excel不适合进行这种分析。找到一些专用于数据挖掘的工具,例如RStudio。R有许多有用的开箱即用的数据挖掘算法 清除数据,例如,将所有文本小写,删除停止词,删除标点符号,删除额外的空格 标记化数据,例如1个单词标记-

我从excel表格中的数据库中提取了大学就业数据。我需要对公司提供的工作描述进行文本挖掘,这是所有行的描述性字段,然后对需求中的概要文件进行分析。 这是数据的快照

有人能帮我开始这项活动吗

谢谢
Saurabh

我不是数据专家,但我有一些数据挖掘经验。首先,我会尝试以下步骤:

  • Excel不适合进行这种分析。找到一些专用于数据挖掘的工具,例如RStudio。R有许多有用的开箱即用的数据挖掘算法

  • 清除数据,例如,将所有文本小写,删除停止词,删除标点符号,删除额外的空格

  • 标记化数据,例如1个单词标记-“金融”、“学士”

  • 决定您将如何断言某个配置文件是否有需求?如果通过配置文件,您的意思是您需要数据中出现的某些代币的频率信息,而不是其他代币的频率信息,例如“金融”、“学士”等,那么只需创建一个频率矩阵。R允许你创建这个单词云的可视化

  • 这是一个开始:)。我相信在这件事上还有很多建议