数据挖掘 part_5
神经网络是一种强大的机器学习模型,模仿生物神经网络的信息处理方式,广泛应用于图像、文本、语音等领域。以下内容将逐步介绍人工神经网络(ANN)、卷积神经网络(CN...
Loss函数是机器学习模型优化的核心,梯度下降算法是优化的主要手段。本章系统介绍常见的Loss函数及其应用、梯度下降算法的变体、线性模型与Loss函数的结合、正则化方法,以及相关的手算例题。
Loss函数(损失函数)用于衡量模型预测值与真实值之间的差异,其值越小表示模型预测越准确。
可以如此简单的理解,将我们想要达到的目标(如常见的预测误差最小)作为运筹优化的目标函数,得到一个线性或非线性的优化问题,那么我们所使用的各种不同算法
都只是在目标函数具体形式和如何寻找满意解上有所不同。通过训练过程中对目标函数的不断优化,我们就会得到我们最终的模型。
特点:
特点:
特点:
梯度下降算法是求解非线性规划常用的一种方法,正如我上文所说,优化目标函数可以看作非线性规划。
通过迭代优化,找到使Loss函数最小的参数。
更新公式:
批量梯度下降 (Batch Gradient Descent):
随机梯度下降 (Stochastic Gradient Descent, SGD):
小批量梯度下降 (Mini-batch Gradient Descent):
Loss函数:
Loss函数:
正则化是在Loss函数后增加一项有关于模型复杂度的正则化项,以达到限制模型复杂度的作用,防止过拟合(如果忘记了过拟合的相关内容请查看part_2
具体正则化方式如下所示:
Previous
Next
Comments
Preview:
勘误:第二题的计算步骤有问题倒数第三部的0log(0.8)应改为1log(0.8),后面的具体算数也应做调整,感谢lyx指正
贴心的包装,宝宝最爱的儿童套餐~