风险函数

时间：2020-09-11 23:21:55 收藏：0 阅读：89

1.风险函数定义

风险函数（risk function）=期望损失（expected loss），可以认为是平均意义下的损失。

例如：下面的对数损失函数中，损失函数的期望，就是理论上模型f(X)关于联合分布P(X,Y)的平均意义下的损失。

风险函数有两种，不考虑正则项的是经验风险（Empirical Risk），考虑过拟合问题，加上正则项的是结构风险（Structural Risk）。

监督学习的两个基本策略：经验风险最小化（ERM）和结构风险最小化（SRM）。

经验风险=经验损失=代价函数

给定一个数据集，模型f(x)关于训练集的平均损失被称为经验风险(empirical risk)或经验损失(empirical loss)。

技术分享图片

这个公式的用意很明显，就是模型关于训练集的平均损失（每个样本的损失加起来，然后平均一下）。在实际中用的时候，我们也就很自然的这么用了。

经验风险最小化（ERM），就是认为经验风险最小的模型是最优的模型，用公式表示：

技术分享图片
这个理论很符合人的直观理解。因为在训练集上面的经验风险最小，也就是平均损失越小，意味着模型得到结果和“真实值”尽可能接近，表明模型越好。

结构风险，就是在经验风险上加上一个正则化项（regularizer）或者叫做罚项（penalty term），即

当样本容量不大的时候，经验风险最小化模型容易产生“过拟合”的问题。为了“减缓”过拟合问题，就提出了结构风险最小的理论。

结构风险最小化（SRM），就是认为，结构风险最小的模型是最优模型，公式表示：

技术分享图片

技术分享图片

原文：https://www.cnblogs.com/sybil-hxl/p/13653932.html