Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/tensorflow/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 对于混合专家模型,是先独立培训专家,还是根据其总输出*门权重进行培训?_Machine Learning_Tensorflow_Artificial Intelligence_Deep Learning - Fatal编程技术网

Machine learning 对于混合专家模型,是先独立培训专家,还是根据其总输出*门权重进行培训?

Machine learning 对于混合专家模型,是先独立培训专家,还是根据其总输出*门权重进行培训?,machine-learning,tensorflow,artificial-intelligence,deep-learning,Machine Learning,Tensorflow,Artificial Intelligence,Deep Learning,我已经看到了一些例子,这些例子一次训练了一个混合的专家模型(在整个门控+m.o.e网络上进行一次迭代)。但是,这仅适用于可以通过这种方式进行优化的模型。例如,假设一位专家是knn分类器,另一位是标准mlp 那么,是针对每个专家计算损失,然后对选通网络进行自身优化,还是根据选通权重*专家输出计算总损失?[详细说明@Wontonimo答案] 在混合专家网络中,对于每个输入,每个专家提供自己的输出,然后由选通网络加权 在培训过程中,每位专家都会收到正确的输出和系数(通常为[0,1]),该系数将与其之前

我已经看到了一些例子,这些例子一次训练了一个混合的专家模型(在整个门控+m.o.e网络上进行一次迭代)。但是,这仅适用于可以通过这种方式进行优化的模型。例如,假设一位专家是knn分类器,另一位是标准mlp


那么,是针对每个专家计算损失,然后对选通网络进行自身优化,还是根据选通权重*专家输出计算总损失?

[详细说明@Wontonimo答案]

在混合专家网络中,对于每个输入,每个专家提供自己的输出,然后由选通网络加权

在培训过程中,每位专家都会收到正确的输出和系数(通常为[0,1]),该系数将与其之前提供给该特定输入的输出质量成比例

门控网络将输入空间动态划分为(模糊)子集,以分配给专家

这允许每个专家专门研究可能输入值的子集


专家网络和门控网络最好同时培训,因为它们的更新是相互依存的

我可以想象这两种情况都能奏效。你是在问哪个更好还是后果如何?如果你优化了专家,那么门控网络,那么每个专家都会尝试成为一名多面手。如果您使用门控权重进行优化,那么专家将只接受他们擅长的方面的培训,这将使他们专业化。我只是在猜测,我没有参考资料,但我认为这将导致多面手和专家的m.o.e.之间的差异。