最优化方法 (OM) - 梯度下降可视化
探索不同学习率和初始位置如何影响梯度下降算法的收敛过程。
选择目标函数 f(x):
f(x) = (x-2)² + 1
f(x) = x⁴ - 4x² + 4
f(x) = cos(x) + 0.1x²
f(x) = |x| (不可导点演示)
学习率 (Learning Rate, η):
最大迭代次数:
开始迭代
清除 / 重置
当前 x:
-
当前 y (Loss):
-
当前梯度 f'(x):
-
迭代次数:
0
📖 操作说明
在上方选择一个
目标函数
。
设置
学习率
(建议从 0.1 开始尝试)。
关键步骤:
在图表区域
点击鼠标左键
,设置下降的
初始起点
。
算法将自动开始迭代,红色小球会沿着曲线寻找最低点(极小值)。
观察小球的运动轨迹:
如果学习率太小,下降速度会很慢。
如果学习率太大,可能会发生震荡甚至发散。
📊 已访问
次