R-解不确定问题

R-解不确定问题,r,R,我觉得这是一个有点复杂的问题,不一定有一个简单的解决方案,可能需要机器学习或其他先进技术来解决 首先,为了解释手头的问题,假设我们有一名跑步者参加了许多户外比赛,这些比赛中的因素(即风)会影响运动员的速度。如果我们知道跑步者的基线速度,就很容易确定各要素在每次比赛中产生的影响百分比,例如: Name Baseline Race1 Race2 Race3 1 Runner 100 102 98 106 赛车1、赛车2和赛车3的促成因素为: [1] 1.02 0.9

我觉得这是一个有点复杂的问题,不一定有一个简单的解决方案,可能需要机器学习或其他先进技术来解决

首先,为了解释手头的问题,假设我们有一名跑步者参加了许多户外比赛,这些比赛中的因素(即风)会影响运动员的速度。如果我们知道跑步者的基线速度,就很容易确定各要素在每次比赛中产生的影响百分比,例如:

    Name Baseline Race1 Race2 Race3
1 Runner      100   102    98   106
赛车1、赛车2和赛车3的促成因素为:

[1] 1.02 0.98 1.06
在这个例子中,我们可以看到第1场比赛中的跑步者有一个尾风,它使他的基线速度增加了2%,以此类推

然而,在现实世界中,我们不一定知道跑步者的基线速度是多少,因为我们只知道他们的比赛结果,我们不一定知道这些因素是如何影响基线的

以以下数据框中列出的竞赛结果为例

df<-data.frame(Name = c("Runner 1","Runner 2","Runner 3","Runner 4","Runner 5"),
Baseline = c("unknown","unknown","unknown","unknown","unknown"),
Race1 = c(101,"NA",80.8,111.1,95.95),
Race2 = c(102,91.8,"NA",112.2,"NA"),
Race3 = c(95,85.5,76,"NA",90.25),
Race4 = c("NA",95.4,74.8,116.6,100.7))

      Name Baseline Race1 Race2 Race3 Race4
1 Runner 1  unknown   101   102    95    NA
2 Runner 2  unknown    NA  91.8  85.5  95.4
3 Runner 3  unknown  80.8    NA    76  74.8
4 Runner 4  unknown 111.1 112.2    NA 116.6
5 Runner 5  unknown 95.95    NA 90.25 100.7

d该表显示了每个跑步者与理论基线不同的比赛速度。基线和元素_因子未知,它们是需要计算的。我们可以从我为这个场景提供的元素_因子向量中看到,一些比赛只有一个大于1.00的正因子,我正在尝试反算(或近似值)仅来自竞赛结果的基线和元素_因子向量听起来您可能只想进行多元线性回归。如果元素因子是乘法的,你可以在速度的对数上做回归。但这更多的是一个统计问题,而不是一个R问题,如果基线是已知的,那么肯定会是我攻击这个问题的方式。但我不确定当基线也需要确定时,这是否可行?
Baseline<-c(100,90,80,100,95)
[1] 100  90  80 100  95

element_factors<-c(1.01,1.02,0.95,1.06)
[1] 1.01 1.02 0.95 1.06