机器学习笔记之高斯网络(一)基本介绍
创始人
2024-02-12 22:46:06
0

机器学习笔记之高斯网络——基本介绍

  • 引言
    • 回顾:
      • 条件独立性
      • 概率图模型
    • 高斯网络
      • 高斯网络介绍
      • 高斯网络的条件独立性
        • 随机变量之间的边缘独立
        • 随机变量之间的条件独立

引言

本节将介绍高斯网络

回顾:

条件独立性

在概率图模型——背景介绍中介绍了条件独立性,条件独立性的核心思想是:给定某随机变量集合XA\mathcal X_{\mathcal A}XA​的条件下,可能存在随机变量集合XB,XC\mathcal X_{\mathcal B},\mathcal X_{\mathcal C}XB​,XC​内部结点之间存在关联,但XB,XC\mathcal X_{\mathcal B},\mathcal X_{\mathcal C}XB​,XC​之间不存在关联
XB⊥XC∣XA\mathcal X_{\mathcal B} \perp \mathcal X_{\mathcal C} \mid \mathcal X_{\mathcal A}XB​⊥XC​∣XA​
并且XA,XB,XC\mathcal X_{\mathcal A},\mathcal X_{\mathcal B},\mathcal X_{\mathcal C}XA​,XB​,XC​是三个不相交的特征集合。

概率图模型

在概率图模型——背景介绍中介绍了概率图模型(Probabilisitc Graphical Model,PGM)。从图的表示角度观察,它可以分为有向图无向图两种:

  • 基于有向图的概率图模型又称贝叶斯网络(Bayesian Network),也称信念网络(Belief Network)。
    条件独立性的角度观察,贝叶斯网络的条件独立性表达包含三种经典情况:

    • 同父结构(Common Parent),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——同父结构
      上图结构表现的现象是:给定结点i1i_1i1​的取值,结点i2,i3i_2,i_3i2​,i3​条件独立
      i2⊥i3∣i1i_2 \perp i_3 \mid i_1i2​⊥i3​∣i1​
    • 顺序结构(Sequence),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——顺序结构
      上图结构表现的现象是:给定结点i2i_2i2​的取值,结点i1,i3i_1,i_3i1​,i3​相互独立
      i1⊥i3∣i2i_1 \perp i_3 \mid i_2i1​⊥i3​∣i2​
    • V\mathcal VV型结构(V-Structure),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——V型结构
      该结构表现的现象是:给定i3i_3i3​结点的条件下,i1,i2i_1,i_2i1​,i2​必不独立;相反,i3i_3i3​取值未知的条件下,i1,i2i_1,i_2i1​,i2​相互独立
      i3∣i1⊥i2i_3 \mid i_1 \perp i_2i3​∣i1​⊥i2​
  • 基于无向图的概率图模型又称马尔可夫网络(Markov Network),也称马尔可夫随机场(Markov Random Field)。
    相比于贝叶斯网络,马尔可夫随机场中描述变量之间的依赖关系 仅包含一种格式:
    马尔可夫随机场——条件独立性
    该结构表现的现象是:给定i1i_1i1​结点的条件下,结点i2,i3i_2,i_3i2​,i3​相互独立
    i2⊥i3∣i1i_2 \perp i_3 \mid i_1i2​⊥i3​∣i1​

高斯网络

高斯网络介绍

高斯网络(Gaussian Network),又称高斯概率图模型(Gaussian Probabilistic Graphical Model)。它同样也是一种概率图模型
随机变量的类型角度观察,将随机变量分为离散型随机变量核连续型随机变量两种。已经介绍的随机变量是离散型随机变量的有:

  • 高斯混合模型(Gaussian Mixture Model,GMM),其隐变量Z\mathcal ZZ包含离散的∣K∣|\mathcal K|∣K∣个取值,每个取值条件下的观测变量服从高斯分布
    P(X)=∑k=1Kαk⋅N(μk,Σk)∑k=1Kαk=1\mathcal P(\mathcal X) = \sum_{k=1}^{\mathcal K} \alpha_k \cdot \mathcal N(\mu_{k},\Sigma_k) \quad \sum_{k=1}^{\mathcal K} \alpha_k = 1P(X)=k=1∑K​αk​⋅N(μk​,Σk​)k=1∑K​αk​=1
  • 隐马尔可夫模型(Hidden Markov Model,HMM):隐变量I\mathcal II是离散型随机变量,观测变量O\mathcal OO没有要求
  • 条件随机场(Condition Random Field,CRF):隐变量I\mathcal II是离散型随机变量,观测变量O1:T\mathcal O_{1:T}O1:T​常以序列形式出现

而高斯网络是随机变量是连续型随机变量 的一种代表模型,其核心思想是:随机变量都是连续型随机变量,并且随机变量服从高斯分布。同上,根据图的表示,高斯网络同样分为有向图无向图两种表达形式:

  • 高斯贝叶斯网络(Gaussian Beyasian Network,GBN)
  • 高斯马尔可夫网络(Gaussian Markov Network,GMN)

高斯网络的条件独立性

假设一个高斯图模型表示如下:
高斯图模型——示例
这只是一个简单的马尔可夫网络,并且每个结点都是一个一维随机变量。这里的随机变量均是连续型随机变量,并且均服从高斯分布
xi∼N(μi,Σi)x_i \sim \mathcal N(\mu_i,\Sigma_i)xi​∼N(μi​,Σi​)
假设随机变量集合的维数是ppp,整个高斯图模型中所有随机变量对应的概率密度函数P(X)\mathcal P(\mathcal X)P(X)表示为:
X=(x1,x2,⋯,xp)TP(X)=1(2π)p2∣Σ∣12exp⁡[−12(x−μ)TΣ−1(x−μ)]\begin{aligned} \mathcal X & = (x_1,x_2,\cdots,x_p)^T \\ \mathcal P(\mathcal X) & = \frac{1}{(2\pi)^{\frac{p}{2}}|\Sigma|^{\frac{1}{2}}} \exp \left[-\frac{1}{2} (x - \mu)^T \Sigma^{-1}(x - \mu)\right] \end{aligned}XP(X)​=(x1​,x2​,⋯,xp​)T=(2π)2p​∣Σ∣21​1​exp[−21​(x−μ)TΣ−1(x−μ)]​
这明显是一个多元高斯分布一个高斯图模型和一个多元高斯分布存在映射关系。其中μ\muμ表示多元高斯分布的期望,Σ\SigmaΣ表示多元高斯分布的协方差矩阵
其中,期望μ\muμ表示为:
μ=[μi]p×1=(μ1μ2⋮μp)p×1\mu = [\mu_i]_{p \times 1} = \begin{pmatrix} \mu_1 \\ \mu_2 \\ \vdots \\ \mu_p \end{pmatrix}_{p \times 1}μ=[μi​]p×1​=⎝⎜⎜⎜⎛​μ1​μ2​⋮μp​​⎠⎟⎟⎟⎞​p×1​
协方差矩阵Σ\SigmaΣ表示为:
Σ=[σij]p×p=(σ11,σ12,⋯,σ1pσ21,σ22,⋯,σ2p⋮σp1,σp2,⋯,σpp)p×p\Sigma = [\sigma_{ij}]_{p \times p} = \begin{pmatrix} \sigma_{11},\sigma_{12},\cdots,\sigma_{1p} \\ \sigma_{21},\sigma_{22},\cdots,\sigma_{2p} \\ \vdots \\ \sigma_{p1},\sigma_{p2},\cdots,\sigma_{pp} \\ \end{pmatrix}_{p \times p}Σ=[σij​]p×p​=⎝⎜⎜⎜⎛​σ11​,σ12​,⋯,σ1p​σ21​,σ22​,⋯,σ2p​⋮σp1​,σp2​,⋯,σpp​​⎠⎟⎟⎟⎞​p×p​
其中σij\sigma_{ij}σij​表示随机变量xi,xjx_i,x_jxi​,xj​的协方差结果
这里没有写成(xi−μi)(xj−μj)T(x_i - \mu_i)(x_j - \mu_j)^T(xi​−μi​)(xj​−μj​)T因为已经设定的一维随机变量。
σij=Cov(xi,xj)=E[(xi−μi)(xj−μj)]\sigma_{ij} = Cov(x_i,x_j) = \mathbb E\left[(x_i - \mu_i)(x_j - \mu_j)\right]σij​=Cov(xi​,xj​)=E[(xi​−μi​)(xj​−μj​)]

随机变量之间的边缘独立

根据协方差的定义,如果在同一物理量纲(基准)的条件下,Cov(xi,xj)=0Cov(x_i,x_j) = 0Cov(xi​,xj​)=0,那个称随机变量xi,xjx_i,x_jxi​,xj​是不相关的。从独立性的角度观察,即xi,xjx_i,x_jxi​,xj​相互独立
这个相互独立意味着xix_ixi​xjx_jxj​在不观察其他变量的条件下是‘边缘独立/绝对独立’的,这种独立在现实世界的问题中并不常见。
σij=0⇒xi⊥xjσij=0⇒P(xi,xj)=P(xi)P(xj)\begin{aligned} \sigma_{ij} = 0 & \Rightarrow x_i \perp x_j \\ \sigma_{ij} = 0 & \Rightarrow \mathcal P(x_i,x_j) = \mathcal P(x_i)\mathcal P(x_j) \end{aligned}σij​=0σij​=0​⇒xi​⊥xj​⇒P(xi​,xj​)=P(xi​)P(xj​)​
如果两个随机变量之间的基准存在差异,对应的σij\sigma_{ij}σij​也可能存在很大差异。为此可以引入相关系数(Correlation Coefficient):
ρij=Cov(xi,xj)D(xi)D(xj)=σijσiiσjj\begin{aligned} \rho_{ij} & = \frac{Cov(x_i,x_j)}{\sqrt{\mathcal D(x_i)}\sqrt{\mathcal D(x_j)}} \\ & = \frac{\sigma_{ij}}{\sqrt{\sigma_{ii}\sigma_{jj}}} \end{aligned}ρij​​=D(xi​)​D(xj​)​Cov(xi​,xj​)​=σii​σjj​​σij​​​
如果相关系数ρij=0\rho_{ij} = 0ρij​=0称xi,xjx_i,x_jxi​,xj​不相关。

随机变量之间的条件独立

条件独立性本质上是为了简化运算提出的一种假设,从而在概率图模型中得到映射。
关于高斯网络的条件独立性,引入一个概念精度矩阵(Precision Matrix),也称作 信息矩阵(Information Matrix)。它是协方差矩阵的逆矩阵
第一次遇到‘精度矩阵’是在推断任务之边缘概率分布与条件概率分布,记录一下时间点~
Λ=Σ−1=(λ11,λ12,⋯,λ1pλ21,λ22,⋯,λ2p⋮λp1,λp2,⋯,λpp)p×p\Lambda = \Sigma^{-1} = \begin{pmatrix} \lambda_{11},\lambda_{12},\cdots,\lambda_{1p} \\ \lambda_{21},\lambda_{22},\cdots,\lambda_{2p} \\ \vdots \\ \lambda_{p1},\lambda_{p2},\cdots,\lambda_{pp} \\ \end{pmatrix}_{p \times p}Λ=Σ−1=⎝⎜⎜⎜⎛​λ11​,λ12​,⋯,λ1p​λ21​,λ22​,⋯,λ2p​⋮λp1​,λp2​,⋯,λpp​​⎠⎟⎟⎟⎞​p×p​
关于精度矩阵Λ\LambdaΛ与条件独立性的关联关系表示如下:
其中x−i−jx_{-i-j}x−i−j​表示随机变量集合X\mathcal XX中除去xi,xjx_i,x_jxi​,xj​之外的其他随机变量。
λij=0⇔xi⊥xj∣x−i−j\lambda_{ij} = 0 \Leftrightarrow x_i \perp x_j \mid x_{-i-j}λij​=0⇔xi​⊥xj​∣x−i−j​
精度矩阵的核心在于:精度矩阵中的元素与条件独立性(概率图的映射)紧密结合在一起

下一节将介绍高斯贝叶斯网络

相关参考:
高斯图模型、精度矩阵、偏相关系数、贝叶斯估计(利用贝叶斯做数据融合)、Wishart分布和逆Wishart分布
协方差——百度百科
概率图模型(四):经典概率图模型
机器学习-高斯网络(1)-总体介绍

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
客厅放八骏马摆件可以吗(家里摆... 今天给各位分享客厅放八骏马摆件可以吗的知识,其中也会对家里摆八骏马摆件好吗进行解释,如果能碰巧解决你...
美团联名卡审核成功待激活(美团... 今天百科达人给各位分享美团联名卡审核成功待激活的知识,其中也会对美团联名卡审核未通过进行解释,如果能...