机器学习第一章至第三章

时间:2021-05-04 13:54:04   收藏:0   阅读:33

第一章基本概念

1.什么是模式识别

2.模式识别数字表达

  1. 数学解释:看成一种函数映射f(x),将待识别模式x从输入空间映射到输出空间,f(x)是关于已有知识的表达

  2. 模型:关于已有知识的一种表达方式,即函数f(x)

  3. 判别函数:使用一些特定的非线性函数实现

    判别器:二类分类、多类分类

    判别公式和决策边界

  4. 特征和特征空间

3.特征向量的相关性

4.机器学习基本概念

  1. 可理解为“用一组训练样本(数据)学习模型的参数和结构”

  2. 分为线性模型和非线性模型

  3. 样本量N与模型参数M的关系(参考线性代数-解方程组):

    N=M唯一的解

    N>>M没有准确的解

    N<<M无数个解/无解

  4. 机器学习流程

    目标函数、优化算法
    技术分享图片

  5. 机器学习方式

    监督式学习、无监督式学习、半监督式学习、强化学习

5.模型的泛化能力

6.评估方法与性能指标

  1. 评估方法:留出法、K折交叉法、留一验证法
  2. 性能指标:准确度、精度、召唤率、F-Score、F1-Score、PR曲线、ROC曲线、AUC曲线

第二章基于距离的分类器

问题1:如何计算单个向量到多个向量的距离?

答:按均值或者按最近邻计算

问题2:计算测试样本到类的何种距离?

答:前提:应满足同一性、非负性、对称性、三角不等式

? 欧式距离 sqrt(∑(xi-zi)**2) = sqrt((X-Z).T * (X-Z))

? 曼哈顿距离 ∑|xi-zi| = |X-Z|

? 加权欧式距离 sqrt(∑wi*(xi-zi)**2) = sqrt((X-Z).T * Iw * (X-Z))

1.MED分类器(最小欧式距离分类器)

2.MICD分类器(最小类内部距离分类器)

3.特征白化

  1. 解耦

    即实现协方差矩阵对角化,去除特征之间的相关性

    求解 W1*∑x*W1.T=∧(对角阵)W1 ,经过一系列的推演可得W1=∑x的正交单位化的特征向量组成的矩阵

    转换前后欧式距离保持一致,故说明W1 只是起了旋转的作用

  2. 白化

    即将对角矩阵尺度变化成单位矩阵,使所有特征具有相同的方差

    求解 W2*∧*W2.T=I(单位矩阵)W2,经过一系列的推演可得 W2 = ∧的-1/2次方

  3. 最终求得映射矩阵W=W2*W1

4.补充

第三章贝叶斯决策与学习

3.1贝叶斯决策与MAP分类器

  1. 后验概率(P(Ci|x):类别输出C、输入模式x):用于分类决策,表达给定模式x属于类Ci的可能性

    观测似然概率(P(x|Ci))、先验概率(P(Ci))、边缘概率(P(x))
    P(Ci|x)=(P(x|Ci)*P(Ci))/P(x)

  2. MAP分类器(最大后验概率分类器)

    • 即将测试样本决策分类给后验概率最大的那个类

    • 判别公式、决策边界(二类分类; 单维空间:通常有两条决策边界,高维空间:复杂的非线性边界)

    • 决策误差(概率误差=未选择的类对应所对应的后验概率)

      MAP分类器决策目标即为最小化概率误差,即分类误差最小化

      (给定所有测试样本,MAP分类器选择后验概率最大的类,等于最小化平均概率误差,即最小化决策误差)
      技术分享图片

3.2 MAP分类器:高斯观测概率

3.3 决策风险与贝叶斯分类器

  1. 贝叶斯决策不能排除出现错误判断的情况,由此会带来决策风险。更重要的是,不同的错误决策会产生程度完全不一样的风险;

    损失( λ(αi|Cj)(决策动作αi|Cj、测试样本的真值Cj) )

    决策风险 R(αi|x)
    R(αi|x) = ∑λij*P(Cj|x)

  2. 贝叶斯分类器

    给定一个测试样本??,贝叶斯分类器选择决策风险最小的类;

    贝叶斯分类器=MAP分类器+决策风险因素

    判别公式

    决策损失: 给定单个测试样本,贝叶斯决策的损失就是决策风险R
    对于所有测试样本,期望损失为所有样本决策损失之和

    决策目标:最小化期望损失

  3. 朴素贝叶斯分类器

    特征维度太高,通过即假设特征之间符合独立同分布以达到简化计算的目的

  4. 拒绝选项

3.4最大似然估计

3.5最大似然估计的估计偏差

  1. 无偏估计

    • 如果一个参数的估计量的数学期望是该参数的真值,则该估计量称作无偏估计
    • 无偏估计意味着只要训练样本个数足够多,该估计值就是参数的真实值
    • 均值的最大似然估计是无偏估计
  2. 高斯分布协方差的最大似然估计式有偏估计

  3. 需对协方差估计进行修正

    可以通过将训练样本的协方差乘以??/(?? ? 1)来修正协方差的估计值

3.6贝叶斯估计(1)

3.7贝叶斯估计(2)

3.8KNN估计

3.9直方图与核密度估计

2.直方图估计

? 原理
技术分享图片

? 优缺点
技术分享图片

3.核密度估计

? 原理
技术分享图片

? 优缺点
技术分享图片

原文:https://www.cnblogs.com/hyuqi/p/14728946.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!