![基于深度学习的目标检测原理与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/956/48376956/b_48376956.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.1.3 卷积
最开始,卷积(Convolution)是一个物理概念,出现在信号与线性系统中,对系统的单位响应与输入信号求卷积,以求得系统的输出信号。后来,卷积被运用在数字图像处理中,与最初的原理相通,只是进一步将一维函数变成二维卷积核(卷积模板),在图像上滑动。每次滑动计算相当于矩阵的点积,直到把整幅图像遍历,如图2-1-2所示。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_1.jpg?sign=1739262840-VW0GIR5VyhWd7SuVzcIuQmE2b6ZLeYzo-0-4d51db90d13b3ccb3e19593535d14179)
图2-1-2 卷积原理示例[1]
高斯卷积(高斯模糊,Gaussian Blur)是常用的卷积应用之一。为了使图像没有突出的特征点,引入了模糊的概念。简易的模糊方法是选取每个像素周边像素的平均值。高斯模糊不是简单选取平均值,而是用高斯分布与图像做卷积,换句话说,就是加权,即将某点的像素用周围点的加权来表示,距离该点距离越近的点权重越大,越远的点权重越小,从而减少“被平均”的偏误,如图2-1-3所示。二维高斯函数表达式为
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_2.jpg?sign=1739262840-3qBdDgHUJGnw9pLdSgvhSWFMJSbyEyCW-0-3f4b9cf680afcfaf5704732cf29c11b3)
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_29_3.jpg?sign=1739262840-57Qb4cnqwKxrgKB4wXBoAA6DhrreEecI-0-1cf49335adff0b107e370d527ffe08b9)
注:彩插页有对应彩色图片。
图2-1-3 高斯函数立体图
不同卷积会造成不同的效果。双边滤波(Bilateral Filter)更接近磨皮的效果,比原始图像更光滑;高斯滤波会模糊原始图像。加入噪声后检测,双边滤波和高斯滤波基本可去除噪声。运用不同滤波的对比如图2-1-4所示。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_30_1.jpg?sign=1739262840-aurA5PGlKVVNal3fGmCDmS3rE9XW9tYv-0-6d27b09715547cdc4c69ec1050b5de42)
资料来源:莱娜·瑟德贝里肖像图。
图2-1-4 运用不同滤波的对比
卷积神经网络(Convolutional Neural Networks,CNN)与高斯卷积不同之处在于,其每层都运用多个卷积核。如图2-1-5所示,一只狗的图像,经过一个卷积层,会输出多幅图像。一般来说,运用3×3的卷积核即可生成多幅不同特征的图像。其好处是可以使用不同的卷积核学习不同的特征。
![](https://epubservercos.yuewen.com/9EAA53/27949874302806606/epubprivate/OEBPS/Images/46031_30_2.jpg?sign=1739262840-wN8jDf2X5dlEPWKy1gWfXKHfBeswoBWU-0-4cb3b2755b8c0d6597e4d849c40bf13b)
资料来源:Andrew Ng Coursera卷积神经网络课程。
图2-1-5 卷积神经网络