R “如何缩放功能”;年龄“;哪个是文本格式?

R “如何缩放功能”;年龄“;哪个是文本格式?,r,date,data-processing,feature-scaling,R,Date,Data Processing,Feature Scaling,我需要从以下格式的数据集中缩放“Age”属性。如何在R中缩放基于文本的变量 age_upon_outcome 2 weeks 1 month 3 months 1 year 3 weeks 2 months 8 months 处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式 在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行 如果按天计算,您通常会有(考虑到一周有7天,一个月有30天): 如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周): 现在您已经

我需要从以下格式的数据集中缩放“Age”属性。如何在R中缩放基于文本的变量

age_upon_outcome
2 weeks
1 month
3 months
1 year
3 weeks
2 months
8 months

处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式

在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行

如果按天计算,您通常会有(考虑到一周有7天,一个月有30天):

如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周):

现在您已经有了它们的数量,可以很容易地对它们进行缩放,例如,流行的MinMaxScaling:

MinMaxScaleFeature <- function(x)
{
    return((x - min(x)) /(max(x) - min(x)))
}

MinMaxScaleFeature处理文本数据的一般规范是将它们转换为数字格式,即完整的数字格式

在你的例子中,由于变量是周、月或年的顺序,一种方法是在周或天内进行

如果按天计算,您通常会有(考虑到一周有7天,一个月有30天):

如果你按周计算,你通常会有(考虑到一个月有4周,一年有52周):

现在您已经有了它们的数量,可以很容易地对它们进行缩放,例如,流行的MinMaxScaling:

MinMaxScaleFeature <- function(x)
{
    return((x - min(x)) /(max(x) - min(x)))
}
MinMaxScaleFeature
require(dplyr)
需要(三年)
结果时的年龄百分比分离(结果时的年龄,分为=c('age','unit'),sep='')%>%
变异(单位为天=案例)时(单位为周)~7,
单位==“月”~30,
单位==“月”~30,
单位==‘年份’~365))%>%
变异(年龄=数值(年龄)*单位(单位:天)%>%
变异(标度年龄=(年龄-平均(年龄))/sd(年龄))
输出

    age unit   unit_in_days scaled_age
  <dbl> <chr>         <dbl>      <dbl>
1    14 weeks             7     -0.769
2    30 month            30     -0.650
3    90 months           30     -0.202
4   365 year            365      1.85 
5    21 weeks             7     -0.717
6    60 months           30     -0.426
7   240 months           30      0.916
年龄单位(单位:天)按比例计算的年龄
1 14周7-0.769
2 30个月30-0.650
3 90个月30-0.202
4365年365 1.85
5 21周7-0.717
6 60个月30-0.426
7240个月30 0.916
需要(dplyr)
需要(三年)
结果时的年龄百分比分离(结果时的年龄,分为=c('age','unit'),sep='')%>%
变异(单位为天=案例)时(单位为周)~7,
单位==“月”~30,
单位==“月”~30,
单位==‘年份’~365))%>%
变异(年龄=数值(年龄)*单位(单位:天)%>%
变异(标度年龄=(年龄-平均(年龄))/sd(年龄))
输出

    age unit   unit_in_days scaled_age
  <dbl> <chr>         <dbl>      <dbl>
1    14 weeks             7     -0.769
2    30 month            30     -0.650
3    90 months           30     -0.202
4   365 year            365      1.85 
5    21 weeks             7     -0.717
6    60 months           30     -0.426
7   240 months           30      0.916
年龄单位(单位:天)按比例计算的年龄
1 14周7-0.769
2 30个月30-0.650
3 90个月30-0.202
4365年365 1.85
5 21周7-0.717
6 60个月30-0.426
7240个月30 0.916

您能否更清楚地了解age的格式?在进行任何缩放之前,您必须将文本字段转换为数字字段。@a.K.年龄的格式为2周、1个月、3个月、1年。您能更清楚地了解年龄的格式吗?在进行任何缩放之前,您必须将文本字段转换为数字字段。@a.K.年龄的格式为2周、1个月、3个月、1年
    age unit   unit_in_days scaled_age
  <dbl> <chr>         <dbl>      <dbl>
1    14 weeks             7     -0.769
2    30 month            30     -0.650
3    90 months           30     -0.202
4   365 year            365      1.85 
5    21 weeks             7     -0.717
6    60 months           30     -0.426
7   240 months           30      0.916