编程 Python

TensorFlow深度学习之卷积神经网络CNN

Posted in Python onMarch 09, 2018

一、卷积神经网络的概述

卷积神经网络（ConvolutionalNeural Network，CNN）最初是为解决图像识别等问题设计的，CNN现在的应用已经不限于图像和视频，也可用于时间序列信号，比如音频信号和文本数据等。CNN作为一个深度学习架构被提出的最初诉求是降低对图像数据预处理的要求，避免复杂的特征工程。在卷积神经网络中，第一个卷积层会直接接受图像像素级的输入，每一层卷积（滤波器）都会提取数据中最有效的特征，这种方法可以提取到图像中最基础的特征，而后再进行组合和抽象形成更高阶的特征，因此CNN在理论上具有对图像缩放、平移和旋转的不变性。

卷积神经网络CNN的要点就是局部连接（LocalConnection）、权值共享（Weights Sharing）和池化层（Pooling）中的降采样（Down-Sampling）。其中，局部连接和权值共享降低了参数量，使训练复杂度大大下降并减轻了过拟合。同时权值共享还赋予了卷积网络对平移的容忍性，池化层降采样则进一步降低了输出参数量并赋予模型对轻度形变的容忍性，提高了模型的泛化能力。可以把卷积层卷积操作理解为用少量参数在图像的多个位置上提取相似特征的过程。

卷积层的空间排列：上文讲解了卷积层中每个神经元与输入数据体之间的连接方式，但是尚未讨论输出数据体中神经元的数量，以及它们的排列方式。3个超参数控制着输出数据体的尺寸：深度（depth），步长（stride）和零填充（zero-padding）。首先，输出数据体的深度是一个超参数：它和使用的滤波器的数量一致，而每个滤波器在输入数据中寻找一些不同的东西。其次，在滑动滤波器的时候，必须指定步长。有时候将输入数据体用0在边缘处进行填充是很方便的。这个零填充（zero-padding）的尺寸是一个超参数。零填充有一个良好性质，即可以控制输出数据体的空间尺寸（最常用的是用来保持输入数据体在空间上的尺寸，这样输入和输出的宽高都相等）。输出数据体在空间上的尺寸可以通过输入数据体尺寸（W），卷积层中神经元的感受野尺寸（F），步长（S）和零填充的数量（P）的函数来计算。（这里假设输入数组的空间形状是正方形，即高度和宽度相等）输出数据体的空间尺寸为(W-F +2P)/S+1，在计算上，输入数据体的长和宽按照该公式计算，深度依赖于滤波器的数量。步长的限制：注意这些空间排列的超参数之间是相互限制的。举例说来，当输入尺寸W=10，不使用零填充则P=0，滤波器尺寸F=3，这样步长S=2就行不通，结果4.5不是整数，这就是说神经元不能整齐对称地滑过输入数据体。

汇聚层使用MAX操作，对输入数据体的每一个深度切片独立进行操作，改变它的空间尺寸。最常见的形式是汇聚层使用尺寸2x2的滤波器，以步长为2来对每个深度切片进行降采样，将其中75%的激活信息都丢掉。每个MAX操作是从4个数字中取最大值（也就是在深度切片中某个2x2的区域）。深度保持不变。

二、卷积神经网络的结构

卷积神经网络通常是由三种层构成：卷积层，汇聚层（除非特别说明，一般就是最大值汇聚）和全连接层（fully-connected简称FC）。ReLU激活函数也应该算是是一层，它逐元素地进行激活函数操作。

TensorFlow深度学习之卷积神经网络CNN

卷积神经网络最常见的形式就是将一些卷积层和ReLU层放在一起，其后紧跟汇聚层，然后重复如此直到图像在空间上被缩小到一个足够小的尺寸，在某个地方过渡成成全连接层也较为常见。最后的全连接层得到输出，比如分类评分等。

最常见的卷积神经网络结构如下：

INPUT -> [[CONV -> RELU]*N ->POOL?]*M -> [FC -> RELU]*K -> FC

其中*指的是重复次数，POOL?指的是一个可选的汇聚层。其中N >=0,通常N<=3,M>=0,K>=0,通常K<3。

几个小滤波器卷积层的组合比一个大滤波器卷积层好。直观说来，最好选择带有小滤波器的卷积层组合，而不是用一个带有大的滤波器的卷积层。前者可以表达出输入数据中更多个强力特征，使用的参数也更少。唯一的不足是，在进行反向传播时，中间的卷积层可能会导致占用更多的内存。

输入层（包含图像的）应该能被2整除很多次。常用数字包括32（比如CIFAR-10），64，96（比如STL-10）或224（比如ImageNet卷积神经网络），384和512。

卷积层应该使用小尺寸滤波器（比如3x3或最多5x5），使用步长S=1。还有一点非常重要，就是对输入数据进行零填充，这样卷积层就不会改变输入数据在空间维度上的尺寸。一般对于任意F，当P=(F-1)/2的时候能保持输入尺寸。如果必须使用更大的滤波器尺寸（比如7x7之类），通常只用在第一个面对原始图像的卷积层上。

汇聚层负责对输入数据的空间维度进行降采样，提升了模型的畸变容忍能力。最常用的设置是用用2x2感受野的最大值汇聚，步长为2。注意这一操作将会把输入数据中75%的激活数据丢弃（因为对宽度和高度都进行了2的降采样）。另一个不那么常用的设置是使用3x3的感受野，步长为2。最大值汇聚的感受野尺寸很少有超过3的，因为汇聚操作过于激烈，易造成数据信息丢失，这通常会导致算法性能变差。

TensorFlow深度学习之卷积神经网络CNN

三、CNN最大的特点在于卷积的权值共享（参数共享），可以大幅度减少神经网络的参数数量，防止过拟合的同时又降低了神经网络模型的复杂度。如何理解？

假设输入图像尺寸是1000*1000并且假定是灰度图像，即只有一个颜色通道。那么一张图片就有100万个像素点，输入维度就是100万。如果采用全连接层（Fully Connected Layer，FCL）的话，隐含层与输入层相同大小（100万个隐含层节点），那么将产生100万*100万=1万亿个连接，仅此就有1万亿个参数需要去训练，这是不可想象的。考虑到人的视觉感受野的概念，每一个感受野只接受一小块区域的信号，每一个神经元不需要接收全部像素点的信息，只需要接收局部像素点作为输入，而将所有这些神经元接收的局部信息综合起来就可以得到全局的信息。于是将之前的全连接模式修改为局部连接，假设局部感受野大小是10*10，即每个隐含节点只与10*10个像素点相连，那么现在只需要10*10*100万=1亿个连接了，相比之前的1万亿已经缩小了10000倍。假设我们的局部连接方式是卷积操作，即默认每一个隐含节点的参数都完全一样，那么我们的参数将会是10*10=100个。不论图像尺寸有多大，都是这100个参数，即卷积核的尺寸，这就是卷积对减小参数量的贡献。这也就是所谓的权值共享。我们采取增加卷积核的数量来多提取一些特征，每一个卷积核滤波得到的图像就是一类特征的映射，即一个Feature Map。一般来说，我们使用100个卷积核在第一个卷积层就足够了，这样我们有100*100=10000个参数相比之前的1亿又缩小了10000倍。卷积的好处是，不管图片尺寸如何，需要训练的参数数量只跟卷积核大小和数量有关，并且需要注意的是，尽管参数的数量大大下降了，但是我们的隐含节点的数量并没有下降，隐含节点的数量只跟卷积的步长有关系。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

TensorFlow深度学习之卷积神经网络CNN

- Author -

marsjhao

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

零基础写python爬虫之使用urllib2组件抓取网页内容

Nov 04 Python

Python中基本的日期时间处理的学习教程

Oct 16 Python

在Linux系统上部署Apache+Python+Django+MySQL环境

Dec 24 Python

详解Python3操作Mongodb简明易懂教程

May 25 Python

Python实现删除文件中含“指定内容”的行示例

Jun 09 Python

Python中的集合介绍

Jan 28 Python

使用Python检测文章抄袭及去重算法原理解析

Jun 14 Python

python manage.py runserver流程解析

Nov 08 Python

Python数据可视化:幂律分布实例详解

Dec 07 Python

python图形用户接口实例详解

Dec 16 Python

python爬取微博评论的实例讲解

Jan 15 Python

python geopandas读取、创建shapefile文件的方法

Jun 29 Python

TensorFlow实现卷积神经网络CNN

Mar 09 #Python

新手常见6种的python报错及解决方法

Mar 09 #Python

Python 函数基础知识汇总

Mar 09 #Python

Python 使用with上下文实现计时功能

Mar 09 #Python

TensorFlow搭建神经网络最佳实践

Mar 09 #Python

TensorFlow实现Batch Normalization

Mar 08 #Python

用Django实现一个可运行的区块链应用

Mar 08 #Python

You might like

PHP file_exists问题杂谈

2012/05/07 PHP

教你如何在CI框架中使用 .htaccess 隐藏url中index.php

2014/06/09 PHP

JavaScript的面向对象方法以及差别

2008/03/31 Javascript

基于jQuery的获得各种控件Value的方法

2010/11/19 Javascript

在线一元二次方程计算器实例(方程计算器在线计算)

2013/12/22 Javascript

JavaScript作用域链示例分享

2014/05/27 Javascript

jquery复选框多选赋值给文本框的方法

2015/01/27 Javascript

jquery实现实时改变网页字体大小、字体背景色和颜色的方法

2015/08/05 Javascript

Angularjs实现搜索关键字高亮显示效果

2017/01/17 Javascript

bootstrap响应式表格实例详解

2017/05/15 Javascript

详解vue过滤器在v2.0版本用法

2017/06/01 Javascript

ui-router中使用ocLazyLoad和resolve的具体方法

2017/10/18 Javascript

利用ECharts.js画K线图的方法示例

2018/01/10 Javascript

JS中touchstart事件与click事件冲突的解决方法

2018/03/12 Javascript

JS返回页面时自动回滚到历史浏览位置

2018/09/26 Javascript

深入浅析Vue 中 ref 的使用

2019/04/29 Javascript

微信小程序表单验证WxValidate的使用

2019/11/27 Javascript

[44:41]Fnatic vs Liquid 2018国际邀请赛小组赛BO2 第二场 8.16

2018/08/17 DOTA

Python显示进度条的方法

2014/09/20 Python

Python将xml和xsl转换为html的方法

2015/03/10 Python

在Mac OS系统上安装Python的Pillow库的教程

2015/11/20 Python

Python实现计算圆周率π的值到任意位的方法示例

2018/05/08 Python

Python selenium实现微博自动登录的示例代码

2018/05/16 Python

Python之列表的插入&替换修改方法

2018/06/28 Python

Python多项式回归的实现方法

2019/03/11 Python

python 环境搭建及python-3.4.4的下载和安装过程

2019/07/20 Python

python循环输出三角形图案的例子

2019/11/22 Python

Kipling凯浦林美国官网：世界著名时尚休闲包袋品牌

2016/08/24 全球购物

Origins悦木之源香港官网：雅诗兰黛集团高端植物护肤品牌

2018/03/21 全球购物

Speedo速比涛中国官方网站：全球领先泳装运动品牌

2018/04/24 全球购物

Static Nested Class 和 Inner Class的不同

2013/11/28 面试题

关于读书的演讲稿

2014/05/07 职场文书

体育之星事迹材料

2014/05/11 职场文书

数学教师个人总结

2015/02/06 职场文书

哪类餐饮行业，最适合在高校创业？

2019/08/19 职场文书

OpenCV图像变换之傅里叶变换的一些应用

2021/07/26 Python