Deepwalk详解
创始人
2024-02-24 03:27:40
0

算法思想

源于word2vec ,word2vec通过语料库中的句子序列来描述词与词之间的共现关系。进而学习到词语的向量表示,deepwalk则使用图中的节点与节点的共像现关系来学习节点的向量表示。这种借鉴的前提是点在图中的分布和词在句子中的分布都是幂律分布。

随机游走

在这里插入图片描述
通过构建hierarchicalsoftmaxhierarchical softmaxhierarchicalsoftmax,第三步对每个结点做yyy次随机游走。第四步打乱网络中的节点,可以加快随机梯度下降的速,
第五步:以每个节点为根节点生成长度为ttt的随机游走。
第七步:根据生成的随机游走使用Skip-gran模型利用梯度的方法对参数进行更新。
这里得到的随机游走就相当于自然语言处理的语句,包含了点在图中的分布信息

如何把随机游走中得到的信息用点来表示学习。

在这里插入图片描述
在这里插入图片描述
概率的部分意思是:在一个随机游走中,当给定一个顶点viv_ivi​时,
出现其的www窗口范围内顶点的概率。
同时考虑左边窗口和右边窗口,不考虑顺序。

Softmax

为什么要使用Softmax?
Pr(uk∣ϕ(vj))Pr(u_k|\phi(v_j)) Pr(uk​∣ϕ(vj​))
为了方便计算
基本思想:将词典中的每个词按照词频大小构建出一颗Huffman树,保证词频较大的词处于相对比较钱的层。词频较低的词相应处于Huffma树深层的叶子节点。每一词都处于这颗Huffman树上的某个叶子节点在这里插入图片描述
计算方法:

  • 在二叉树的每一个节点上都存放一个向量,需要通过学习得到,最后的叶子节点上没有向量,显而易见,整棵树共有∣V∣|V|∣V∣个向量,
  • 规定在第kkk层的节点做分类时,节点的左子树为正类别,节点的右子树是负类别,该节点的向量用V(k)V(k)V(k)表示。
  • 那么正负累的分数如公式(2)(3)所示:在预测的时候,需要按照蓝色箭头方向做分类,第0层分类结果为负类,第一层分类结果为正类。第3层分类结果为正类,最后达到叶子节点V(5)V(5)V(5),最后把所有节点的分类的分数累乘起来
    pk(left)=sigmoid(ϕ(v1)×v(k))p_k(left) = sigmoid(\phi(v_1) \times v(k))pk​(left)=sigmoid(ϕ(v1​)×v(k))
    在这里插入图片描述

适用场景

  • 图表示学习,捕捉节点局部的结构信息
  • 适用于无权图,同构网络
  • 在图稀疏的时候也能取得较好的表现。
  • 对大型的图也能够取得较好的表现,也能够并行计算。

不足和改进

  • 无法对图中的边信息(权重和不同的关系)进行处理。
  • 随机游走是对节点选取的概率不够完善,没有区分广度优先和深度优先搜索,node2vec模型对此进行了改进。

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
苏州离哪个飞机场近(苏州离哪个... 本篇文章极速百科小编给大家谈谈苏州离哪个飞机场近,以及苏州离哪个飞机场近点对应的知识点,希望对各位有...
客厅放八骏马摆件可以吗(家里摆... 今天给各位分享客厅放八骏马摆件可以吗的知识,其中也会对家里摆八骏马摆件好吗进行解释,如果能碰巧解决你...