Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/324.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 与输出不直接成比例的变量的线性回归_C#_Machine Learning_Linear Regression - Fatal编程技术网

C# 与输出不直接成比例的变量的线性回归

C# 与输出不直接成比例的变量的线性回归,c#,machine-learning,linear-regression,C#,Machine Learning,Linear Regression,我一直在努力学习coursera上的机器学习课程。到目前为止,引入的大多数线性回归模型都使用其数值与输出呈正相关的变量 Input: square feet of the house Output: house price. Inputs: -what day is it (Mon,Tues..), -what holiday is it (NewYear,Xmas..), -what month is it(Jan,Feb), -what time is it(0100,1300.

我一直在努力学习coursera上的机器学习课程。到目前为止,引入的大多数线性回归模型都使用其数值与输出呈正相关的变量

Input: square feet of the house 
Output: house price.
Inputs: 
-what day is it (Mon,Tues..), 
-what holiday is it (NewYear,Xmas..), 
-what month is it(Jan,Feb), 
-what time is it(0100,1300..)

Output: 
-Number of visitors.
然而,我试图实现一个多元回归模型,其中的一些变量是数值,与输出不成正比

Input: square feet of the house 
Output: house price.
Inputs: 
-what day is it (Mon,Tues..), 
-what holiday is it (NewYear,Xmas..), 
-what month is it(Jan,Feb), 
-what time is it(0100,1300..)

Output: 
-Number of visitors.
问题:

  • 对于变量:今天是哪一天,今天是哪一个假日,现在是哪一个月,我使用枚举并为每个值指定一个值。(新年=1,圣诞节=2,等等)。这样做更好还是有单独的变量?(新年、圣诞节等)

  • 我知道,通过在变量中应用更高阶的幂,它可以有更好的拟合,这就是我想要的假期变量。有什么方法可以让计算机自己学习最佳顺序吗

  • 我是否可以使用现有的C#库为不同的变量提供不同的幂次?(例如,假日为13,一天中的时间为二次方)

  • 谢谢

    对于变量:今天是哪一天,今天是哪一个假日,现在是哪一个月,我使用枚举并为每个值指定一个值。(新年=1,圣诞节=2,等等)。这样做更好还是有单独的变量?(新年、圣诞节等)

    是的,您永远不应该在不遵循算术的变量中编码任何顺序,因此,新年=1,圣诞节=2,感恩节=3意味着圣诞节=(感恩节+新年)/2。。。现在是你想要的东西。一个热编码(isNewyear等)是有利的,因此您不会对虚假知识进行编码

    我知道,通过在变量中应用更高阶的幂,它可以有更好的拟合,这就是我想要的假期变量。有什么方法可以让计算机自己学习最佳顺序吗

    这就是非线性方法所做的。核方法(核化线性回归、SVR)、神经网络、回归树/森林等

    我是否可以使用现有的C#库为不同的变量提供不同的幂次?(例如,假日为13,一天中的时间为二次方)


    你不应该这样想,你不应该手工拟合powers,你应该给模型一个灵活性,以便自己拟合高阶(见上一点)。

    对于第1点,这是否意味着我需要一个代表每个假期的变量列表,以及表示每个月/星期几的变量列表?那么,我是否必须走到一天中的某个时刻?对于我提到的情景,线性回归是一个好的模型吗?如果不是,你会建议其他的模式吗?每个假期都有自己的变量。编码时间总是很棘手,但最安全的方法是将它们也作为isMonday、isJanuary等处理。我还建议将一天分为几个部分(如isMorning、isMidday等),并使用这些变量。我怀疑实际的数字小时会有多大帮助。在您尝试之前,无法判断任何模型是好是坏。线性回归是一种基本的方法,当且仅当关系非常简单时才有效。