深度学习基础——填充(padding)与步幅(stride)
创始人
2024-05-13 04:46:30
0

填充(padding)

在这里插入图片描述
在上图中,输入图片尺寸为3×33\times33×3,输出图片尺寸为2×22\times22×2,经过一次卷积之后,图片尺寸为2×22\times22×2,经过一次卷积之后,图片尺寸变小。卷积输出特征图的尺寸计算方法如下(卷积核的高和宽分别为kh和kwk_h和k_wkh​和kw​):
Hout=H−kh+1Wout=W−kw+1H_{out}=H-k_h+1\\ W_{out}=W-k_w+1 Hout​=H−kh​+1Wout​=W−kw​+1
如果输入尺寸为4,卷积核大小为3时,输出尺寸为4−3+1=24-3+1=24−3+1=2。读者可以自行检查当输入图片和卷积核为其他尺寸时,上述计算式是否成立。当卷积核尺寸大于1时,输出特征图的尺寸会小于输入图片尺寸。如果经过多次卷积,输出图片尺寸会不断减小。为了避免卷积之后图片尺寸变小,通常会在图片的外围进行填充(padding),如下图所示
在这里插入图片描述

  • 如图(a)所示:填充的大小为1,填充值为0。填充之后,输入图片尺寸从4×44\times44×4变成了6×66\times66×6,使用3×33\times33×3的卷积核,输出图片尺寸为4×44\times44×4。
  • 如图(b)所示:填充的大小为2,填充值为0。填充之后,输入图片尺寸从4×44\times44×4变成了8×88\times88×8,使用3×33\times33×3的卷积核,输出图片尺寸为6×66\times66×6。

如果在图片高度方向,在第一行之前填充ph1p_{h1}ph1​行,在最后一行之后填充ph2p_{h2}ph2​行;在图片的宽度方向,在第1列之前填充pw1p_{w1}pw1​列,在最后1列之后填充pw2p_{w2}pw2​列;则填充之后的图片尺寸为(H+ph1+ph2)×(W+pw1+pw2)(H+p_{h1}+p_{h2})\times (W+p_{w1}+p_{w2})(H+ph1​+ph2​)×(W+pw1​+pw2​)。经过大小为kh×kwk_h\times k_wkh​×kw​的卷积核操作之后,输出图片的尺寸为:
Hout=H+ph1+ph2−kh+1Wout=W+pw1+pw2−kw+1H_{out}=H+p_{h1}+p_{h2}-k_h+1\\ W_{out}=W+p_{w1}+p_{w2}-k_w+1 Hout​=H+ph1​+ph2​−kh​+1Wout​=W+pw1​+pw2​−kw​+1
在卷积计算过程中,通常会在高度或宽度的两侧采取等量填充,即ph1=ph2=ph,pw1=pw2=pwp_{h1}=p_{h2}=p_h,p_{w1}=p_{w2}=p_wph1​=ph2​=ph​,pw1​=pw2​=pw​,所以上面的公式就变为了:
Hout=H+2ph−kh+1Wout=W+2pw−kw+1H_{out}=H+2p_h-k_h+1\\ W_{out}=W+2p_w-k_w+1 Hout​=H+2ph​−kh​+1Wout​=W+2pw​−kw​+1
卷积核大小通常使用1,3,5,7这样的奇数,如果使用的填充大小为ph=(kh−1)/2,pw=(kw−1)/2p_h=(k_h-1)/2,p_w=(k_w-1)/2ph​=(kh​−1)/2,pw​=(kw​−1)/2,则卷积之后图像尺寸不变。
例如当卷积核大小为3时,padding大小为1,卷积之后图像尺寸不变,与图(a)一样;同理,如果卷积核大小为5,padding大小为2,也能保持图像尺寸不变。

步幅(stride)

Alt
上图中卷积核每次滑动一个像素点,这是步幅为1的特殊情况,下面两张图是步幅为2的卷积过程,卷积核在图片上移动时,每次移动大小为2个像素点。
Alt
在这里插入图片描述
以第二张静态图为例子:
当宽和高的步幅分别为sh和sws_h和s_wsh​和sw​时,输出特征图尺寸的计算公式是:
Hout=H+2ph−khsh+1Wout=W+2pw−kwsw+1H_{out}=\frac{H+2p_{h}-k_h}{s_h}+1\\ W_{out}=\frac{W+2p_w-k_w}{s_w}+1 Hout​=sh​H+2ph​−kh​​+1Wout​=sw​W+2pw​−kw​​+1
假设输入图片尺寸时H×W=100×100H\times W=100\times100H×W=100×100,卷积核大小为kh×kw=3×3k_h\times k_w=3\times3kh​×kw​=3×3,填充ph=pw=1p_h=p_w=1ph​=pw​=1,步幅为sh=sw=2s_h=s_w=2sh​=sw​=2,则输出特征图的尺寸为:
Hout=100+2−32+1=50Wout=100+2−32+1=50H_{out}=\frac{100+2-3}{2}+1=50\\ W_{out}=\frac{100+2-3}{2}+1=50 Hout​=2100+2−3​+1=50Wout​=2100+2−3​+1=50

总结:

1。卷积输出特征图的尺寸计算方法如下(卷积核的高和宽分别为kh和kwk_h和k_wkh​和kw​): Hout=H−kh+1Wout=W−kw+1H_{out}=H-k_h+1\\ W_{out}=W-k_w+1 Hout​=H−kh​+1Wout​=W−kw​+1
2。当宽和高的步幅分别为sh和sws_h和s_wsh​和sw​时,输出特征图尺寸的计算公式是:
Hout=H+2ph−khsh+1Wout=W+2pw−kwsw+1H_{out}=\frac{H+2p_{h}-k_h}{s_h}+1\\ W_{out}=\frac{W+2p_w-k_w}{s_w}+1 Hout​=sh​H+2ph​−kh​​+1Wout​=sw​W+2pw​−kw​​+1

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
客厅放八骏马摆件可以吗(家里摆... 今天给各位分享客厅放八骏马摆件可以吗的知识,其中也会对家里摆八骏马摆件好吗进行解释,如果能碰巧解决你...
苏州离哪个飞机场近(苏州离哪个... 本篇文章极速百科小编给大家谈谈苏州离哪个飞机场近,以及苏州离哪个飞机场近点对应的知识点,希望对各位有...