导语:主要分为三个方面来介绍:1、理解SGD、minibatch-SGD和GD;2、large batch与learning rate的调试关系;3、实验 雷锋网 AI科技评论按,本文源自谭旭在知乎问题【如何理解深度学习分布式训练中的large batch size与learning rate的关系?】下的回答,雷锋网 AI科技评论获其 ...