R 为时间序列分析和可视化重新格式化此数据的代码是什么?

R 为时间序列分析和可视化重新格式化此数据的代码是什么?,r,time-series,data-cleaning,R,Time Series,Data Cleaning,StackOverflow的第一篇帖子!我是R的初学者,在网上学习了几门数据科学课程。我希望您能帮助我重新安排一些数据的格式,以便我可以将其用于时间序列分析和ggplot2的可视化。我尝试过搜索,但当我的术语知识仍然缺乏时,很难做一个好的搜索(我不确定这是不是数据“操纵”、“咀嚼”、“争吵”、“数据清理”或其他我想要的东西) 我的数据当前看起来像,但我也希望它看起来像。我在R怎么做?一些包裹能帮我吗 注:我并不介意“净收入”和“年度”栏是否切换。此外,我刚刚使用excel快速创建了所需数据格式的

StackOverflow的第一篇帖子!我是R的初学者,在网上学习了几门数据科学课程。我希望您能帮助我重新安排一些数据的格式,以便我可以将其用于时间序列分析和ggplot2的可视化。我尝试过搜索,但当我的术语知识仍然缺乏时,很难做一个好的搜索(我不确定这是不是数据“操纵”、“咀嚼”、“争吵”、“数据清理”或其他我想要的东西)

我的数据当前看起来像,但我也希望它看起来像。我在R怎么做?一些包裹能帮我吗

注:我并不介意“净收入”和“年度”栏是否切换。此外,我刚刚使用excel快速创建了所需数据格式的快照

请注意,这个数据集持续了大约2000行,所以无论我在R中使用什么代码,我都需要它来处理这个巨大的数据集

谢谢


John

从宽格式到长格式,请参见软件包


data\u将示例数据放入问题中;imgur链接可能不会永远存在。看见同时,调查
重塑
library(reshape2)

#Get a vector that includes the column names you want to change from wide to long format, e.g.
yearsVector=c("2006","2007","2008")

melt(dat, measure.vars=yearsVector, variable="Year", value.name="income")
data_melted <- melt(data, id.vars = c("company", "sub.industry"), measured.vars = c("2006","2007","2008", "2009", "2010", "2011", "2012", "2013", "2014", "2015", "2016"), variable = "Year", value.name="income")