机器学习算法的主要数学理论依据包括

网上有关“机器学习算法的主要数学理论依据包括”话题很是火热,小编也是针对机器学习算法的主要数学理论依据包括寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。

机器学习算法的主要数学理论依据包括:

算法或理论?

用到的数学知识点

贝叶斯分类器?

随机变量,贝叶斯公式,随机变量独立性,正态分布,最大似然估计

决策树 概率,嫡,Gini系数

KNN算法 距离函数

主成分分析

协方差矩阵,散布矩阵,拉格朗日乘数法,特征值与特征向量

流形学习

流形,最优化,测地线,测地距离,图,特征值与特征向量

线性判别分析

散度矩阵,逆矩阵,拉格朗日乘数法,特征值与特征向量

支持向量机

点到平面的距离,Slater条件,强对偶,拉格朗日对偶,KKT条件,凸优化,核函数,Mercer条件

logistic

概率,随机变量,最大似然估计,梯度下降法,凸优化,牛顿法

随机森林

抽样,方差

AdaBoost算法

概率,随机变量,极值定理,数学期望,牛顿法

隐马尔科夫模型

概率,离散型随机变量,条件概率,随机变量独立性,拉格朗日乘数法,最大似然估计

条件随机场

条件概率,数学期望,最大似然估计

高斯混合模型

正态分布,最大似然估计,Jensen不等式

人工神经网络

梯度下降法,链式法则

卷积神经网络

梯度下降法,链式法则

循环神经网络

梯度下降法,链式法则

生成对抗网络

梯度下降法,链式法则,极值定理,Kullback-Leibler散度,Jensen-Shannon散度,测地距离,条件分布,互信息

K-means算法

距离函数

贝叶斯网络

条件概率,贝叶斯公式,图

VC维

Hoeffding不等式

文艺青年迪克森HB:门/H5手4

机器学习中的线性代数

线性代数作为数学中的一个重要的分支,广发应用在科学与工程中。掌握好线性代数对于理解和从事机器学习算法相关的工作是很有必要的,尤其是对于深度学习而言。因此,在开始介绍深度学习之前,先集中探讨一些必备的线性代数知识。

2.1 标量,向量,矩阵和张量

标量(scalar):一个标量就是一个单独的数。用斜体表示标量,如s∈R

.

向量(vector):一个向量是一列数,我们用粗体的小写名称表示向量。比如x

,将向量x

写成方括号包含的纵柱:

x=?x1x2?xn?

矩阵(matrix):矩阵是二维数组,我们通常赋予矩阵粗体大写变量名称,比如A。如果一个矩阵高度是m,宽度是n,那么说A∈Rm×n。一个矩阵可以表示如下:

A=[x11x21x12x22]

张量(tensor):某些情况下,我们会讨论不止维坐标的数组。如果一组数组中的元素分布在若干维坐标的规则网络中,就将其称为张量。用A表示,如张量中坐标为(i,j,k)的元素记作Ai,j,k。

转置(transpose):矩阵的转置是以对角线为轴的镜像,这条从左上角到右下角的对角线称为主对角线(main diagonal)。将矩阵A

的转置表示为A?

。定义如下:

(A?)i,j=Aj,i

A=x11x21x31x12x22x32A?=[x11x21x21x22x31x32]

2.2 矩阵和向量相乘

矩阵乘法是矩阵运算中最重要的操作之一。两个矩阵A

和B的矩阵乘积(matrix product)是第三个矩阵C。矩阵乘法中A的列必须和B的行数相同。即如果矩阵A的形状是m×n,矩阵B的形状是n×p,那么矩阵C的形状就是m×p

。即

C=A×B

具体的地,其中的乘法操作定义为

Ci,j=∑kAi,kBk,j

矩阵乘积服从分配律

A(B+C)=AB+AC

矩阵乘积也服从结合律

A(BC)=(AB)C

注意:矩阵乘积没有交换律

点积(dot product)两个相同维数的向量x

和y的点积可看作是矩阵乘积x?y

矩阵乘积的转置

(AB)?=B?A?

利用向量的乘积是标量,标量的转置是自身的事实,我们可以证明(10)式:

x?y=(x?y)?=y?x

线性方程组

Ax=b

2.3 单位矩阵和逆矩阵

线性代数中提供了矩阵逆(matrix inverse)的工具,使得我们能够解析地求解(11)中的A

.

单位矩阵(identity matrix):任意向量与单位矩阵相乘都不会改变。我们将保持n

维向量不变地单位矩阵记作为In,形式上In∈Rn×n

x∈Rn,Inx=x

矩阵A的矩阵逆被记作A?1,被定义为如下形式:

A?1A=AA?1=In

(11)式方程组的求解:

Ax=bA?1Ax=A?1bInx=A?1bx=A?1b

方程组的解取决于能否找到一个逆矩阵A?1。接下来讨论逆矩阵A?1的存在的条件。

2.4 线性相关和生成子空间

如果逆矩阵A?1

存在,那么(11)式肯定对于每一个向量b恰好存在一个解。分析方程有多少个解,我们可以看成是A

的列向量的线性组合(linear combination)。

Ax=∑ixiA:,i

形式上,某个集合中向量的线性组合,是指每个向量乘以对应系数之后的和,即

∑iciv(i)

一组向量的生成空间(span)是原始向量线性组合后所能抵达的点的集合。

线性无关(linearly independent): 如果一组向量中的任意一个向量都不能表示成其他向量的线性组合,那么这组向量被称之为线性无关。

要想使矩阵可逆,首先必须矩阵是一个方阵(square),即m=n

,其次,所有的列向量都是线性无关的。

一个列向量线性相关的方阵被称为奇异的(singular)。

2.5 范数

有时候我们需要衡量一个向量的大小,在机器学习中,我们使用称为范数(norm)的函数来衡量矩阵大小,形式上,Lp

范数如下:

||x||p=(∑i|xi|p)12

其中p∈R,p≥1。

范数是将向量映射到非负值的函数。直观上来说,向量x

的范数就是衡量从原点到x

的举例。更严格来说,范数满足下列性质的函数:

f(x)=0?x=0

f(x+y)≤f(x)+f(y)

α∈R,f(αx)=|α|f(x)

当p=2

时,L2被称作欧几里得范数(Euclidean norm)。它表示从原点出发到向量x确定的点的欧几里得距离。平方L2范数常被用来衡量向量的大小,因为它便于求导计算(如对向量中每个元素的导数只取决于对应的元素,但是它也有缺陷,即它在原点附近增长得十分缓慢),可以简单用点积x?x

来计算。

max 范数(max norm):这个范数表示向量中具有最大幅度得元素的绝对值,用L∞

范数表示,期形式为:

||x||∞=∑(i,j)A2i,j?√

两个向量的点积(dot product)也可以用范数来表示。具体地,

x?y=||x||2||y||2cosθ

2.6 特殊类型的矩阵和向量

对角矩阵(diagonal matrix)只在主对角线上含有非零元素,其它位置都是零。矩阵D

是对角矩阵,当且仅当?i≠j,Di,j=0,用diag(v)表示一个对角元素由向量v

中元素给定的对角矩阵。

对称(symmetric) 矩阵是任意转置和自己相等的矩阵:

A=A?

即在矩阵A中,有Ai,j=Aj,i。

单位向量(unit vector)是具有单位范数(unit norm)的向量:

||x||2=1

如果x?y=0,那么向量x和向量y互相正交(orthogonal)。如果两个向量都有非零范数,那么表示这两个向量之间的夹角是90 度。在Rn中,至多有n个范数非零向量互相正交。如果这些向量不仅互相正交,并且范数都为1,那么我们称它们是标准正交(orthonormal)。

正交矩阵(orthonormal matrix)是指行向量是标准正交的,列向量是标准正交的方阵:

A?A=AA?=I

这意味着

A?1=A?

所以正交矩阵受到关注是因为求逆计算代价小。需要注意正交矩阵的定义。反直觉地,正交矩阵的行向量不仅是正交的,还是标准正交的。对于行向量或列向量互相正交但不是标准正交的矩阵没有对应的专有术语。

2.7 特征分解

许多数学对象可以通过将它们分解成多个组成部分,或者找到它们的一些属性而被更好地理解,这些属性是通用的,而不是由我们选择表示它们的方式引起的。就像我们可以通过分解质因数来发现一些关于整数的真实性质,我们也可以通过分解矩阵来获取一些矩阵表示成数组元素时不明显的函数性质。

特征分解(eigendecomposition)是使用最广的矩阵分解之一,即我们将矩阵分解成一组特征向量和特征值。

方阵A

的特征向量(eigenvector)是指与A相乘后相当于对该向量进行缩放的非零向量v

Av=λv

标量λ被称为这个特征向量对应的特征值(eigenvalue)。

如果v

是A的特征向量,那么任何放缩后的向量sv(s∈R,s≠0)也是A

的特征向量并且其与bf v 有相同的特征值。所以我们通常只考虑单位特征向量。

假设矩阵A

有n个线性无关的特征向量{v(1),v(2),...,v(n)},对应着的特征值{λ1,λ2,...,λn}

,我们将特征向量连成一个矩阵,使得每一列是一个特征向量:

V=[v(1),v(2),...,v(n)]

类似地,特征值连成一个向量:

λ=[λ1,λ2,...,λn]?

因此bf A 的特征分解(eigendecomposition)可以记作:

A=Vdiag(λ)V?1

上面我们构建具体特定的特征值和特征向量,能够使我们在目标方向上延伸空间。我们也常常希望将矩阵分解(decompose)成特征值和特征向量。这样可以帮助我们分析矩阵的特定性质,就像质因数分解有助于我们理解整数。

不是每一个矩阵都可以分解成特征值和特征向量,在某些情况下,特征分解会涉及到复数,而非实数。在本书的机器学习学习中,我们只讨论一类简单分解的矩阵。具体就是,每个实对称矩阵都可以分解为实特征向量和实特征值:

A=QΛQ?

其中Q是A的特征向量组成的正交矩阵,Λ是对角矩阵。特征值Λi,i对应的特征向量是矩阵Q的第i列,记作Q:,i。因为Q是正交矩阵,所以可以将A看作是沿方向v(i)延展λi倍的空间。如下图所示:

2.8 迹运算

迹运算返回的是矩阵对角元素的和:

Tr(A)=∑iAi,i

迹运算因为很多原因而受到关注。若不使用求和符号,有些矩阵运算很难描述,而通过矩阵乘法和迹运算符号,可以进行清楚地表示。例如,迹运算提供了另一种描述矩阵Frobenius 范数的方式:

||A||F=Tr(AA?)√

用迹运算表示式,使我们可以用很多有用的性质来操纵表示式。例如迹运算在转置下是不变的:

Tr(A)=Tr(A?)

多个矩阵乘积的迹还满足链式规律,即:

Tr(ABC)=Tr(BCA)=Tr(CAB)

标量的迹是它本身:a=Tr(a)。

2.9 行列式

行列式,记作det(A)

,是一个将方阵A

映射到实数的函数。行列式等于矩阵特征值的乘积。行列式的绝对值可以被认为是衡量矩阵相乘后空间扩大或者缩小了多少。如果行列式是0, 那么空间至少沿着某一维完全收缩了,使其失去了所有的体积。如果行列式是1, 那么矩阵相乘没有改变空间体积。

总结

以上是在机器学习过程中必须了解和掌握的有关线性代数的知识

关于“机器学习算法的主要数学理论依据包括”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!

本文来自作者[千旋]投稿,不代表里驹号立场,如若转载,请注明出处:https://hnqlj.com/changshi/202509-6401.html

(10)

文章推荐

  • 巴顿(杭州)控制系统有限公司怎么样

    网上有关“巴顿(杭州)控制系统有限公司怎么样”话题很是火热,小编也是针对巴顿(杭州)控制系统有限公司怎么样寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。企知道数据显示,巴顿(杭州)控制系统有限公司成立于2017-06-07,注册资本1000.0万人民币,参保

    2025年09月05日
    17320
  • “的”“地”“得”的区别是什么-

    网上有关““的”“地”“得”的区别是什么?”话题很是火热,小编也是针对“的”“地”“得”的区别是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。的[de]用在词或词组后表明形容词性:美丽~。代替所指的人或物:唱歌~。表示所属的关系的词:他~衣服。助

    2025年09月07日
    14314
  • 实测分析“福建兄弟十三水有挂吗百度知道”(确实是有挂)-知乎

    无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由:1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信:2、自动连接,用户只要开启软件,就会全程后台自动连接程序,无需用户时时盯着软件。3、安全保障,使用这款软件的用户可以非常安心,绝对没有被

    2025年09月07日
    16321
  • 教程分享“新漫游大厅开挂”其实确实有挂

    教程分享“新漫游大厅开挂”其实确实有挂>亲,新漫游大厅开挂这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款

    2025年09月08日
    15318
  • 实测分析“天天跑得快开挂”(详细开挂教程)

    亲,天天跑得快开挂这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的,添加客服QQ群【】安装软件. 微信打麻将是一款非常流行的棋牌游戏,深

    2025年09月09日
    17315
  • 西域男孩和西城男孩的区别?

    网上有关“西域男孩和西城男孩的区别?”话题很是火热,小编也是针对西域男孩和西城男孩的区别?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。西域男孩和西城男孩都是指Westlife组合,没有区别。Westlife(官方译名西城男孩,又译西域男孩)是在1998年成

    2025年09月15日
    22302
  • vivo手机如何设置地震预警权限

    网上有关“vivo手机如何设置地震预警权限”话题很是火热,小编也是针对vivo手机如何设置地震预警权限寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。vivo手机设置地震预警权限的方法如下:工具/原料:vivoy30、FuntouchOS7.127、设置13.

    2025年09月15日
    13319
  • 时风电动汽车价格表

    网上有关“时风电动汽车价格表”话题很是火热,小编也是针对时风电动汽车价格表寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。专业介绍:1.进货价在25000-27000元之间,卖货价在31800-38800不等。2.4千瓦有刷电机,价格在1800元左右3.车架三

    2025年09月23日
    6316
  • 必看教程“微乐广东麻将小程序必赢神器免费安装”(原来确实是有挂)

    亲,微乐广东麻将小程序必赢神器免费安装这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的通过添加客服QQ群:本司针对手游进行匹配,选择我们的四

    2025年09月24日
    3303
  • 教程辅助!“微乐江西麻将小程序怎样免费开挂”分享必要外挂教程

    亲,微乐江西麻将小程序怎样免费开挂这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人的牌一样。所以很多小伙伴就怀疑这款游戏是不是有挂,实际上这款游戏确实是有挂的通过添加客服QQ群:本司针对手游进行匹配,选择我们的四大理

    2025年09月24日
    3304
  • 实测分享“微信小程序微乐麻将怎么控制输赢”(确实是有挂)-知乎

    实测分享“微信小程序微乐麻将怎么控制输赢”(确实是有挂)-知乎>亲,微信小程序微乐麻将怎么控制输赢这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推

    2025年09月24日
    2313
  • 求历史大神帮我总结《44号孩子》《秘密演讲》《6号特工》三本书的时代背景和意义!!

    网上有关“求历史大神帮我总结《44号孩子》《秘密演讲》《6号特工》三本书的时代背景和意义!!”话题很是火热,小编也是针对求历史大神帮我总结《44号孩子》《秘密演讲》《6号特工》三本书的时代背景和意义!!寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。《44号孩

    2025年09月25日
    2300

发表回复

本站作者才能评论

评论列表(3条)

  • 千旋的头像
    千旋 2025年09月20日

    我是里驹号的签约作者“千旋”

  • 千旋
    千旋 2025年09月20日

    本文概览:网上有关“机器学习算法的主要数学理论依据包括”话题很是火热,小编也是针对机器学习算法的主要数学理论依据包括寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,...

  • 千旋
    用户092009 2025年09月20日

    文章不错《机器学习算法的主要数学理论依据包括》内容很有帮助