R “如何缩放功能”;年龄“;哪个是文本格式?
我需要从以下格式的数据集中缩放“Age”属性。如何在R中缩放基于文本的变量R “如何缩放功能”;年龄“;哪个是文本格式?,r,date,data-processing,feature-scaling,R,Date,Data Processing,Feature Scaling,我需要从以下格式的数据集中缩放“Age”属性。如何在R中缩放基于文本的变量 age_upon_outcome 2 weeks 1 month 3 months 1 year 3 weeks 2 months 8 months 处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式 在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行 如果按天计算,您通常会有(考虑到一周有7天,一个月有30天): 如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周): 现在您已经
age_upon_outcome
2 weeks
1 month
3 months
1 year
3 weeks
2 months
8 months
处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式 在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行 如果按天计算,您通常会有(考虑到一周有7天,一个月有30天): 如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周): 现在您已经有了它们的数量,可以很容易地对它们进行缩放,例如,流行的MinMaxScaling:
MinMaxScaleFeature <- function(x)
{
return((x - min(x)) /(max(x) - min(x)))
}
MinMaxScaleFeature处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式
在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行
如果按天计算,您通常会有(考虑到一周有7天,一个月有30天):
如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周):
现在您已经有了它们的数量,可以很容易地对它们进行缩放,例如,流行的MinMaxScaling:
MinMaxScaleFeature <- function(x)
{
return((x - min(x)) /(max(x) - min(x)))
}
MinMaxScaleFeaturerequire(dplyr)
需要(三年)
结果时的年龄百分比分离(结果时的年龄,分为=c('age','unit'),sep='')%>%
变异(单位为天=案例)时(单位为周)~7,
单位==“月”~30,
单位==“月”~30,
单位==‘年份’~365))%>%
变异(年龄=数值(年龄)*单位(单位:天)%>%
变异(标度年龄=(年龄-平均(年龄))/sd(年龄))
输出
age unit unit_in_days scaled_age
<dbl> <chr> <dbl> <dbl>
1 14 weeks 7 -0.769
2 30 month 30 -0.650
3 90 months 30 -0.202
4 365 year 365 1.85
5 21 weeks 7 -0.717
6 60 months 30 -0.426
7 240 months 30 0.916
年龄单位(单位:天)按比例计算的年龄
1 14周7-0.769
2 30个月30-0.650
3 90个月30-0.202
4365年365 1.85
5 21周7-0.717
6 60个月30-0.426
7240个月30 0.916
需要(dplyr)
需要(三年)
结果时的年龄百分比分离(结果时的年龄,分为=c('age','unit'),sep='')%>%
变异(单位为天=案例)时(单位为周)~7,
单位==“月”~30,
单位==“月”~30,
单位==‘年份’~365))%>%
变异(年龄=数值(年龄)*单位(单位:天)%>%
变异(标度年龄=(年龄-平均(年龄))/sd(年龄))
输出
age unit unit_in_days scaled_age
<dbl> <chr> <dbl> <dbl>
1 14 weeks 7 -0.769
2 30 month 30 -0.650
3 90 months 30 -0.202
4 365 year 365 1.85
5 21 weeks 7 -0.717
6 60 months 30 -0.426
7 240 months 30 0.916
年龄单位(单位:天)按比例计算的年龄
1 14周7-0.769
2 30个月30-0.650
3 90个月30-0.202
4365年365 1.85
5 21周7-0.717
6 60个月30-0.426
7240个月30 0.916
您能否更清楚地了解age的格式?在进行任何缩放之前,您必须将文本字段转换为数字字段。@a.K.年龄的格式为2周、1个月、3个月、1年。您能更清楚地了解年龄的格式吗?在进行任何缩放之前,您必须将文本字段转换为数字字段。@a.K.年龄的格式为2周、1个月、3个月、1年
age unit unit_in_days scaled_age
<dbl> <chr> <dbl> <dbl>
1 14 weeks 7 -0.769
2 30 month 30 -0.650
3 90 months 30 -0.202
4 365 year 365 1.85
5 21 weeks 7 -0.717
6 60 months 30 -0.426
7 240 months 30 0.916