Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/313.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python CNTK创建训练器方程_Python_Cntk - Fatal编程技术网

Python CNTK创建训练器方程

Python CNTK创建训练器方程,python,cntk,Python,Cntk,在下面的CNTK create_trainer handler(python)中,我试图理解这两个等式的含义——我相信这是每小批的学习率,但微软没有对其进行评论。有人了解这些lr_per_mb方程及其意义吗 lr_per_mb=[1.0]*80+[0.1]*40+[0.01] lr_per_mb=[0.1]*1+[1.0]*80+[0.1]*40+[0.01] def创建训练器(网络、小批量大小、历元大小、量化位数、块大小、预热、进度打印机): 语法[a1]*b+[a1]*d+a3意味着,学习者

在下面的CNTK create_trainer handler(python)中,我试图理解这两个等式的含义——我相信这是每小批的学习率,但微软没有对其进行评论。有人了解这些lr_per_mb方程及其意义吗

lr_per_mb=[1.0]*80+[0.1]*40+[0.01]

lr_per_mb=[0.1]*1+[1.0]*80+[0.1]*40+[0.01]

def创建训练器(网络、小批量大小、历元大小、量化位数、块大小、预热、进度打印机):


语法
[a1]*b+[a1]*d+a3
意味着,学习者将在第一次
b
迭代中使用
a1
的学习率(时代/样本:取决于培训师的迭代设置),然后将在
d
迭代中使用
a2
的学习率(时代或样本),对于剩余的迭代,学习率应为
a3


通常,你会从高学习率开始,随着培训的进行,学习率会降低。这就是您在上面的代码中看到的。此外,对于这两个网络,学习率是不同的。在寻找正确的学习率参数方面付出了大量的努力。因此,使用示例中的一些数字作为初始起点可能会节省大量时间。

回答得很好!我比你高,但我想我没有足够高的声誉来展示它!
if network['name'] == 'resnet20': 
    lr_per_mb = [1.0]*80+[0.1]*40+[0.01]
elif network['name'] == 'resnet110': 
    lr_per_mb = [0.1]*1+[1.0]*80+[0.1]*40+[0.01]
else: 
    return RuntimeError("Unknown model name!")