当使用梯度下降法求解损失函数的最小值时,loss可能会从A点到达C点学习率过大可能会导致loss在B点附近来回震荡

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页