编程 Python

TensorFlow keras卷积神经网络添加L2正则化方式

Posted in Python onMay 22, 2020

我就废话不多说了，大家还是直接看代码吧！

model = keras.models.Sequential([
 #卷积层1
 keras.layers.Conv2D(32,kernel_size=5,strides=1,padding="same",data_format="channels_last",activation=tf.nn.relu,kernel_regularizer=keras.regularizers.l2(0.01)),
 #池化层1
 keras.layers.MaxPool2D(pool_size=2,strides=2,padding="same"),
 #卷积层2
 keras.layers.Conv2D(64,kernel_size=5,strides=1,padding="same",data_format="channels_last",activation=tf.nn.relu),
 #池化层2
 keras.layers.MaxPool2D(pool_size=2,strides=2,padding="same"),
 #数据整理
 keras.layers.Flatten(),
 #1024个，全连接层
 keras.layers.Dense(1024,activation=tf.nn.relu),
 #100个，全连接层
 keras.layers.Dense(100,activation=tf.nn.softmax)
 ])

import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
 
from tensorflow.python.keras.datasets import cifar100
from tensorflow.python import keras
import tensorflow as tf
 
class CNNMnist(object):
 
 model = keras.models.Sequential([
 #卷积层1
 keras.layers.Conv2D(32,kernel_size=5,strides=1,padding="same",data_format="channels_last",activation=tf.nn.relu,kernel_regularizer=keras.regularizers.l2(0.01)),
 #池化层1
 keras.layers.MaxPool2D(pool_size=2,strides=2,padding="same"),
 #卷积层2
 keras.layers.Conv2D(64,kernel_size=5,strides=1,padding="same",data_format="channels_last",activation=tf.nn.relu),
 #池化层2
 keras.layers.MaxPool2D(pool_size=2,strides=2,padding="same"),
 #数据整理
 keras.layers.Flatten(),
 #1024个，全连接层
 keras.layers.Dense(1024,activation=tf.nn.relu),
 #100个，全连接层
 keras.layers.Dense(100,activation=tf.nn.softmax)
 ])
 
 def __init__(self):
 (self.x_train,self.y_train),(self.x_test,self.y_test) = cifar100.load_data()
 
 self.x_train = self.x_train/255.0
 self.x_test = self.x_test/255.0
 
 
 def compile(self):
 CNNMnist.model.compile(optimizer=keras.optimizers.Adam(),loss=keras.losses.sparse_categorical_crossentropy,metrics=["accuracy"])
 
 def fit(self):
 CNNMnist.model.fit(self.x_train,self.y_train,epochs=1,batch_size=32)
 
 def evaluate(self):
 test_loss,test_acc = CNNMnist.model.evaluate(self.x_test,self.y_test)
 print(test_loss,test_acc)
 
if __name__ == '__main__':
 cnn = CNNMnist()
 print(CNNMnist.model.summary())
 cnn.compile()
 cnn.fit()

补充知识：初步了解TensorFlow如何实现正则化

为了避免过拟合问题，一个非常常用的方法是正则化（regularization），正则化的思想就是在损失函数中加入刻画模型复杂程度的指标。

假设用于刻画模型在训练数据上表现的损失函数为J(θ)，那么在优化时不是直接优化J(θ)，而是优化J(θ) + λR(w)，其中R(w)刻画的是模型的复杂程度，而λ表示模型复杂损失在总损失中的比例，需要注意的是，这里的θ表示的是一个神经网络中所有的参数，它包括边上的权重w和偏置项b，但一般来说模型复杂度只由权重w决定。

常用的刻画模型复杂度的函数R(w)有两种，一种是L1正则化，计算公式是：

TensorFlow keras卷积神经网络添加L2正则化方式

另一种是L2正则化，计算公式是：

TensorFlow keras卷积神经网络添加L2正则化方式

TensorFlow可以优化任意形式的损失函数，所以TensorFlow自然也可以优化带正则化的损失函数。

L1正则化和L2正则化，在TensorFlow中分别以不同的函数实现它们，以下列代码为示例：

#含有L1正则化的损失函数：
loss = tf.reduce_mean(tf.square(y_ - y)) + tf.contrib.layers.l1_regularizer(λ)(w)

#含有L2正则化的损失函数：
loss = tf.reduce_mean(tf.square(y_ - y)) + tf.contrib.layers.l2_regularizer(λ)(w)

loss为定义的损失函数，它由两个部分组成，第一个部分是均方误差损失函数，它刻画了模型在训练数据上的表现，第二个部分就是正则化，它防止模型过度模拟训练数据中的随机噪音；

λ表示了正则化项的权重，w为需要计算正则化损失的参数。

TensorFlow提供了tf.contrib.layers.l1_regularizer函数和tf.contrib.layers.l2_regularizer函数用来计算L1正则化和L2正则化，通过以下代码给出使用两个函数的样例：

import tensorflow as tf
weights = tf.constant([[1.0, -2.0], [-3.0, 4.0]])
with tf.Session() as sess:
 #计算结果为5.0
 print(sess.run(tf.contrib.layers.l1_regularizer(0.5)(weights)))
 #计算结果为15 * 1/2 = 7.5，L2正则化乘以1/2可以方便求导
 print(sess.run(tf.contrib.layers.l2_regularizer(0.5)(weights)))

在简单的神经网络中，这样的方式就可以很好地计算带正则化的损失函数了，但当神经网络的参数增多之后，这样的方式首先可能导致损失函数loss的定义很长，可读性差且容易出错，更主要的是，当网络结构复杂之后定义网络结构的部分和计算损失函数的部分可能不在同一个函数中，这样通过变量这种方式计算损失函数就不方便了。

为了解决这个问题，可以使用TensorFlow中提供的集合（collection）来维护需要计算的正则化损失，以下列代码为示例给出通过集合计算一个5层神经网络带L2正则化的损失函数的计算方法：

import tensorflow as tf

#获取一层神经网络边上的权重，并将这个权重的L2正则化损失加入名称为losses的集合中
def get_weight(shape, r):
 #生成一个变量
 var = tf.Variable(tf.random_normal(shape, stddev=1, seed=1), dtype=tf.float32)
 '''add_to_collection函数将这个新生成变量的L2正则化损失项加入集合
 这个函数的第一个参数losses是集合的名字，第二个参数是要加入这个集合的内容'''
 tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(r)(var))
 return var

x = tf.placeholder(tf.float32, shape=(None, 2))
y_ = tf.placeholder(tf.float32, shape=(None, 1))

#定义了每一层网络中节点的个数
layer_dimension = [2, 10, 10, 10, 1]
#神经网络的层数
n_layers = len(layer_dimension)

#这个变量维护前向传播时最深层的节点，开始的时候就是输入层
cur_layer = x
#in_dimension为当前层的节点个数
in_dimension = layer_dimension[0]

#通过一个循环来生成5层全连接的神经网络结构
for i in range(1, n_layers):
 #out_dimension为下一层的节点个数
 out_dimension = layer_dimension[i]
 #生成当前层中权重的变量，并将这个变量的L2正则化损失加入losses集合
 weight = get_weight([in_dimension, out_dimension], 0.001)
 bias = tf.Variable(tf.fill([1, out_dimension], 0.1))
 #使用ReLU激活函数
 cur_layer = tf.nn.relu(tf.matmul(cur_layer, weight) + bias)
 #进入下一层之前将下一层的节点个数更新为当前层节点个数
 in_dimension = out_dimension

'''在定义神经网络前向传播的同时已经将所有的L2正则化损失加入了losses集合
这里只需要计算刻画模型在训练数据上表现的损矣函数。'''
mse_loss = tf.reduce_mean(tf.square(y_ - cur_layer))

#将均方误差损失函数加入损失集合
tf.add_to_collection('losses', mse_loss)

'''get_collection返回一个列表，这个列表包含所有这个集合中的元素
在这个样例中这些元素就是损失函数的不同部分，将它们加起来就可以得到最终的损失函数。'''
loss = tf.add_n(tf.get_collection('losses'))

以上这篇TensorFlow keras卷积神经网络添加L2正则化方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

TensorFlow keras卷积神经网络添加L2正则化方式

- Author -

高颜值的杀生丸

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中optparser库用法实例详解

Jan 26 Python

用Python3创建httpServer的简单方法

Jun 04 Python

python使用Matplotlib画饼图

Sep 25 Python

Django-Rest-Framework 权限管理源码浅析(小结)

Nov 12 Python

python画柱状图--不同颜色并显示数值的方法

Dec 13 Python

python中的句柄操作的方法示例

Jun 20 Python

Python插入Elasticsearch操作方法解析

Jan 19 Python

python删除某个目录文件夹的方法

May 26 Python

Python多线程threading创建及使用方法解析

Jun 17 Python

pytorch使用horovod多gpu训练的实现

Sep 09 Python

Python+Appium新手教程

Apr 17 Python

python脚本框架webpy模板控制结构

Nov 20 Python

Django 如何使用日期时间选择器规范用户的时间输入示例代码详解

May 22 #Python

python实现猜单词游戏

May 22 #Python

Django使用rest_framework写出API

May 21 #Python

使用keras根据层名称来初始化网络

May 21 #Python

关于Keras Dense层整理

May 21 #Python

Django如何使用redis作为缓存

May 21 #Python

如何打包Python Web项目实现免安装一键启动的方法

May 21 #Python

You might like

PHP系列学习之日期函数使用介绍

2012/08/18 PHP

php curl 伪造IP来源的实例代码

2012/11/01 PHP

php中unserialize返回false的解决方法

2014/09/22 PHP

php集成环境xampp中apache无法启动问题解决方案

2014/11/18 PHP

php去除数组中重复数据

2014/11/18 PHP

PHP读取mssql json数据中文乱码的解决办法

2016/04/11 PHP

php根据命令行参数生成配置文件详解

2019/03/15 PHP

可缩放Reloaded-一个针对可缩放元素的复用组件

2007/03/10 Javascript

JQuery扩展插件Validate 2通过参数设置验证规则

2011/09/05 Javascript

Javascript中找到子元素在父元素内相对位置的代码

2012/07/21 Javascript

js隐藏与显示回到顶部按钮及window.onscroll事件应用

2013/01/25 Javascript

js调用webservice中的方法实现思路及代码

2013/02/25 Javascript

JavaScript整除运算函数ceil和floor的区别分析

2015/04/14 Javascript

jQuery验证插件validate使用方法详解

2020/09/13 Javascript

bootstrap学习使用（导航条、下拉菜单、轮播、栅格布局等）

2016/12/01 Javascript

解决vue.js在编写过程中出现空格不规范报错的问题

2017/09/20 Javascript

Vue 项目代理设置的优化

2018/04/17 Javascript

vue-cli中安装方法(图文详细步骤)

2018/12/12 Javascript

微信小程序返回上一级页面的实现代码

2020/06/19 Javascript

Vue项目中数据的深度监听或对象属性的监听实例

2020/07/17 Javascript

vue 解决data中定义图片相对路径页面不显示的问题

2020/08/13 Javascript

[01:37]DOTA2超级联赛专访ChuaN 传奇般的电竞之路

2013/06/19 DOTA

Python操作Access数据库基本步骤分析

2016/09/19 Python

深入理解Python对Json的解析

2017/02/14 Python

python 实现数字字符串左侧补零的方法

2018/12/04 Python

Python定时任务工具之APScheduler使用方式

2019/07/24 Python

css3类选择器之结合元素选择器和多类选择器用法

2017/03/09 HTML / CSS

DTD的含义以及作用

2014/01/26 面试题

中专生求职自荐信范文

2013/12/22 职场文书

保密工作实施方案

2014/02/24 职场文书

应用数学专业求职信

2014/03/14 职场文书

企业精细化管理实施方案

2014/03/23 职场文书

竞争上岗演讲稿范文

2014/05/12 职场文书

幼儿教师师德师风演讲稿

2014/08/22 职场文书

公证委托书格式

2014/09/13 职场文书

nginx 反向代理之 proxy_pass的实现

2021/03/31 Servers

TensorFlow keras卷积神经网络 添加L2正则化方式

TensorFlow keras卷积神经网络添加L2正则化方式