Math 执行线性回归的最佳方法

Math 执行线性回归的最佳方法,math,Math,我有一组来自实验的5个值,E1,…,E5和10000个不同模拟的结果,sim_a_B_C out。从每个模拟中我得到S1,…,S5 我想研究实验值和模拟值之间的相关性。因此,我想在一个脚本中为每个集合执行线性回归,该脚本循环整个10000个结果文件集合 在bash或python中执行线性回归的最佳方式是什么?我曾经用sigmaplot做过,但在python中,它不太适合这么大的数据集,在SciPy包中有一个函数stats.linregresse,您可以使用。我会避免使用bash,而使用pytho

我有一组来自实验的5个值,E1,…,E5和10000个不同模拟的结果,sim_a_B_C out。从每个模拟中我得到S1,…,S5

我想研究实验值和模拟值之间的相关性。因此,我想在一个脚本中为每个集合执行线性回归,该脚本循环整个10000个结果文件集合


在bash或python中执行线性回归的最佳方式是什么?我曾经用sigmaplot做过,但在python中,它不太适合这么大的数据集,在SciPy包中有一个函数stats.linregresse,您可以使用。

我会避免使用bash,而使用python——实际上我会使用Matlab或Mathematica,但两者都不在您的列表中。因此,请安装Numpy,并可能安装Scipy和crack on。

我希望您的每个模拟都有一些不同的输入值,例如,
x
第一个为1,第二个为
2
,然后您有一些函数f(x)运行模拟并为每个模拟生成5个点。从你的例子中,我期望x实际上是三个值,A,B,C

在这种情况下,您想要发现的是生成最佳模拟的x值

在这种情况下,您确实需要找到f(x)与实验结果之间的相关性,而不是模拟结果本身

其原因是,在模拟和实验结果之间找到良好的相关性有太多的变量(如果假设模拟相互独立),可能只是偶然地找到一个合适的

我认为你也应该获得额外的实验值,以增加你的信心



对于这类事情,我最喜欢的语言是,它是免费的,可供使用。我推荐这本书,它提供了许多盆栽示例供您尝试,并让您通过开始统计了解一些非常高级的内容。

如果在python或bash中不太可行,可以使用另一种语言。