Python和lmfit:如何使用共享参数来适应多个数据集?
我想使用该模块将一个函数与数量可变的数据集相匹配,其中包含一些共享参数和一些单独的参数 下面是一个生成高斯数据并分别拟合每个数据集的示例:Python和lmfit:如何使用共享参数来适应多个数据集?,python,parameters,curve-fitting,lmfit,Python,Parameters,Curve Fitting,Lmfit,我想使用该模块将一个函数与数量可变的数据集相匹配,其中包含一些共享参数和一些单独的参数 下面是一个生成高斯数据并分别拟合每个数据集的示例: import numpy as np import matplotlib.pyplot as plt from lmfit import minimize, Parameters, report_fit def func_gauss(params, x, data=[]): A = params['A'].value mu = params
import numpy as np
import matplotlib.pyplot as plt
from lmfit import minimize, Parameters, report_fit
def func_gauss(params, x, data=[]):
A = params['A'].value
mu = params['mu'].value
sigma = params['sigma'].value
model = A*np.exp(-(x-mu)**2/(2.*sigma**2))
if data == []:
return model
return data-model
x = np.linspace( -1, 2, 100 )
data = []
for i in np.arange(5):
params = Parameters()
params.add( 'A' , value=np.random.rand() )
params.add( 'mu' , value=np.random.rand()+0.1 )
params.add( 'sigma', value=0.2+np.random.rand()*0.1 )
data.append(func_gauss(params,x))
plt.figure()
for y in data:
fit_params = Parameters()
fit_params.add( 'A' , value=0.5, min=0, max=1)
fit_params.add( 'mu' , value=0.4, min=0, max=1)
fit_params.add( 'sigma', value=0.4, min=0, max=1)
minimize(func_gauss, fit_params, args=(x, y))
report_fit(fit_params)
y_fit = func_gauss(fit_params,x)
plt.plot(x,y,'o',x,y_fit,'-')
plt.show()
# ideally I would like to write:
#
# fit_params = Parameters()
# fit_params.add( 'A' , value=0.5, min=0, max=1)
# fit_params.add( 'mu' , value=0.4, min=0, max=1)
# fit_params.add( 'sigma', value=0.4, min=0, max=1, shared=True)
# minimize(func_gauss, fit_params, args=(x, data))
#
# or:
#
# fit_params = Parameters()
# fit_params.add( 'A' , value=0.5, min=0, max=1)
# fit_params.add( 'mu' , value=0.4, min=0, max=1)
#
# fit_params_shared = Parameters()
# fit_params_shared.add( 'sigma', value=0.4, min=0, max=1)
# call_function(func_gauss, fit_params, fit_params_shared, args=(x, data))
我想你是最成功的。您需要将数据集放入一个数组或结构中,该数组或结构可以在一个全局目标函数中使用,该函数用于最小化()并使用所有数据集的一组参数拟合所有数据集。您可以根据需要在数据集之间共享此集合。下面的代码对您的示例进行了一点扩展,可以对5个不同的高斯函数进行单一拟合。以跨数据集绑定参数为例,我使用了几乎相同的sigma值,这5个数据集具有相同的值。我创建了5个不同的sigma参数('sig_1'、'sig_2'、…、'sig_5'),但随后使用数学约束强制这些参数具有相同的值。因此,问题中有11个变量,而不是15个
import numpy as np
import matplotlib.pyplot as plt
from lmfit import minimize, Parameters, report_fit
def gauss(x, amp, cen, sigma):
"basic gaussian"
return amp*np.exp(-(x-cen)**2/(2.*sigma**2))
def gauss_dataset(params, i, x):
"""calc gaussian from params for data set i
using simple, hardwired naming convention"""
amp = params['amp_%i' % (i+1)].value
cen = params['cen_%i' % (i+1)].value
sig = params['sig_%i' % (i+1)].value
return gauss(x, amp, cen, sig)
def objective(params, x, data):
""" calculate total residual for fits to several data sets held
in a 2-D array, and modeled by Gaussian functions"""
ndata, nx = data.shape
resid = 0.0*data[:]
# make residual per data set
for i in range(ndata):
resid[i, :] = data[i, :] - gauss_dataset(params, i, x)
# now flatten this to a 1D array, as minimize() needs
return resid.flatten()
# create 5 datasets
x = np.linspace( -1, 2, 151)
data = []
for i in np.arange(5):
params = Parameters()
amp = 0.60 + 9.50*np.random.rand()
cen = -0.20 + 1.20*np.random.rand()
sig = 0.25 + 0.03*np.random.rand()
dat = gauss(x, amp, cen, sig) + np.random.normal(size=len(x), scale=0.1)
data.append(dat)
# data has shape (5, 151)
data = np.array(data)
assert(data.shape) == (5, 151)
# create 5 sets of parameters, one per data set
fit_params = Parameters()
for iy, y in enumerate(data):
fit_params.add( 'amp_%i' % (iy+1), value=0.5, min=0.0, max=200)
fit_params.add( 'cen_%i' % (iy+1), value=0.4, min=-2.0, max=2.0)
fit_params.add( 'sig_%i' % (iy+1), value=0.3, min=0.01, max=3.0)
# but now constrain all values of sigma to have the same value
# by assigning sig_2, sig_3, .. sig_5 to be equal to sig_1
for iy in (2, 3, 4, 5):
fit_params['sig_%i' % iy].expr='sig_1'
# run the global fit to all the data sets
result = minimize(objective, fit_params, args=(x, data))
report_fit(result)
# plot the data sets and fits
plt.figure()
for i in range(5):
y_fit = gauss_dataset(fit_params, i, x)
plt.plot(x, data[i, :], 'o', x, y_fit, '-')
plt.show()
对于它的价值,我会考虑将多个数据集保存在字典或DataSet类列表中,而不是多维数组。无论如何,我希望这有助于您开始真正需要做的事情。
我使用了一种简单的方法:定义一个函数,前面n(=cargsnum)个参数是常见的 对于所有数据集,另一个是单独的 { } 这里假设每个数据集具有相同的权重。 我在这种方法中面临的问题是计算速度慢和不稳定如果有大量拟合参数和数据集。这是一个很好的例子!它确实显示了参数的
expr
参数是多么有用。这里有些东西我不明白。进行全局拟合时,您希望找到最适合多个数据集的最佳公共参数。使用这种方法,你不只是告诉所有其他SIGMA等同于第一个吗?如何找到全局最小值?此外,在lmfit的最新版本0.9中,参数对象没有更改,而是复制。因此,为了使该脚本正常工作,必须在最后几行中进行更改:minimize(objective,fit_参数,args=(x,data))-->result=minimize(objective,fit_参数,args=(x,data)),其中:fit_参数-->result.paramsias:1。最初的问题是如何将所有sigma设置为具有相同的值。有时候这正是你想要的。2.您是对的,该示例适用于版本0.9之前的lmfit。我更改了示例。实际上,我试图编辑原始答案,以更正API在0.8和0.9之间记录和更改的行为,这是在最近的一条评论中指出的。作为该软件的主要作者,我认为这是可以接受的。它被三位SO评审员拒绝,他们宁愿保留一个错误的答案,也不愿更新答案以反映API的变化。有时他们似乎更喜欢虚假信息。。。。
def likelihood_common(var, xlist, ylist, mlist, cargsnum):
cvars = var[:cargsnum]
iargnum = [model.func_code.co_argcount - 1 - cargsnum for model in mlist]
argpos = [cargsnum,] + list(np.cumsum(iargnum[:-1]) + cargsnum)
args = [list(cvars) + list(var[pos:pos+iarg]) for pos, iarg in zip(argpos, iargnum)]
res = [likelihood(*arg) for arg in zip(args, xlist, ylist, mlist)]
return np.sum(res)