编程 Python

Keras使用ImageNet上预训练的模型方式

Posted in Python onMay 23, 2020

我就废话不多说了，大家还是直接看代码吧！

import keras
import numpy as np
from keras.applications import vgg16, inception_v3, resnet50, mobilenet
 
#Load the VGG model
vgg_model = vgg16.VGG16(weights='imagenet')
 
#Load the Inception_V3 model
inception_model = inception_v3.InceptionV3(weights='imagenet')
 
#Load the ResNet50 model
resnet_model = resnet50.ResNet50(weights='imagenet')
 
#Load the MobileNet model
mobilenet_model = mobilenet.MobileNet(weights='imagenet')

在以上代码中，我们首先import各种模型对应的module，然后load模型，并用ImageNet的参数初始化模型的参数。

如果不想使用ImageNet上预训练到的权重初始话模型，可以将各语句的中'imagenet'替换为'None'。

补充知识：keras上使用alexnet模型来高准确度对mnist数据进行分类

纲要

本文有两个特点：一是直接对本地mnist数据进行读取（假设事先已经下载或从别处拷来）二是基于keras框架（网上多是基于tf）使用alexnet对mnist数据进行分类，并获得较高准确度（约为98%）

本地数据读取和分析

很多代码都是一开始简单调用一行代码来从网站上下载mnist数据，虽然只有10来MB，但是现在下载速度非常慢，而且经常中途出错，要费很大的劲才能拿到数据。

(X_train, y_train), (X_test, y_test) = mnist.load_data()

其实可以单独来获得这些数据（一共4个gz包，如下所示），然后调用别的接口来分析它们。

Keras使用ImageNet上预训练的模型方式

mnist = input_data.read_data_sets("./MNIST_data", one_hot = True) #导入已经下载好的数据集,"./MNIST_data"为存放mnist数据的目录

x_train = mnist.train.images
y_train = mnist.train.labels
x_test = mnist.test.images
y_test = mnist.test.labels

这里面要注意的是，两种接口拿到的数据形式是不一样的。从网上直接下载下来的数据其image data值的范围是0~255，且label值为0,1,2,3...9。而第二种接口获取的数据 image值已经除以255（归一化）变成0~1范围，且label值已经是one-hot形式（one_hot=True时），比如label值2的one-hot code为(0 0 1 0 0 0 0 0 0 0)

所以，以第一种方式获取的数据需要做一些预处理（归一和one-hot）才能输入网络模型进行训练而第二种接口拿到的数据则可以直接进行训练。

Alexnet模型的微调

按照公开的模型框架，Alexnet只有第1、2个卷积层才跟着BatchNormalization，后面三个CNN都没有（如有说错，请指正）。如果按照这个来搭建网络模型，很容易导致梯度消失，现象就是 accuracy值一直处在很低的值。如下所示。

Keras使用ImageNet上预训练的模型方式

在每个卷积层后面都加上BN后，准确度才迭代提高。如下所示

Keras使用ImageNet上预训练的模型方式

完整代码

import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.convolutional import Conv2D, MaxPooling2D, ZeroPadding2D
from keras.layers.normalization import BatchNormalization
from keras.callbacks import ModelCheckpoint
import numpy as np
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data #tensorflow已经包含了mnist案例的数据
 
batch_size = 64
num_classes = 10
epochs = 10
img_shape = (28,28,1)
 
# input dimensions
img_rows, img_cols = 28,28
 
# dataset input
#(x_train, y_train), (x_test, y_test) = mnist.load_data()
mnist = input_data.read_data_sets("./MNIST_data", one_hot = True) #导入已经下载好的数据集,"./MNIST_data"为存放mnist数据的目录
print(mnist.train.images.shape, mnist.train.labels.shape)
print(mnist.test.images.shape, mnist.test.labels.shape)
print(mnist.validation.images.shape, mnist.validation.labels.shape)
 
x_train = mnist.train.images
y_train = mnist.train.labels
x_test = mnist.test.images
y_test = mnist.test.labels
 
# data initialization
x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
input_shape = (img_rows, img_cols, 1)
 
# Define the input layer
inputs = keras.Input(shape = [img_rows, img_cols, 1])
 
 #Define the converlutional layer 1
conv1 = keras.layers.Conv2D(filters= 64, kernel_size= [11, 11], strides= [1, 1], activation= keras.activations.relu, use_bias= True, padding= 'same')(inputs)
# Define the pooling layer 1
pooling1 = keras.layers.AveragePooling2D(pool_size= [2, 2], strides= [2, 2], padding= 'valid')(conv1)
# Define the standardization layer 1
stand1 = keras.layers.BatchNormalization(axis= 1)(pooling1)
 
# Define the converlutional layer 2
conv2 = keras.layers.Conv2D(filters= 192, kernel_size= [5, 5], strides= [1, 1], activation= keras.activations.relu, use_bias= True, padding= 'same')(stand1)
# Defien the pooling layer 2
pooling2 = keras.layers.AveragePooling2D(pool_size= [2, 2], strides= [2, 2], padding= 'valid')(conv2)
# Define the standardization layer 2
stand2 = keras.layers.BatchNormalization(axis= 1)(pooling2)
 
# Define the converlutional layer 3
conv3 = keras.layers.Conv2D(filters= 384, kernel_size= [3, 3], strides= [1, 1], activation= keras.activations.relu, use_bias= True, padding= 'same')(stand2)
stand3 = keras.layers.BatchNormalization(axis=1)(conv3)
 
# Define the converlutional layer 4
conv4 = keras.layers.Conv2D(filters= 384, kernel_size= [3, 3], strides= [1, 1], activation= keras.activations.relu, use_bias= True, padding= 'same')(stand3)
stand4 = keras.layers.BatchNormalization(axis=1)(conv4)
 
# Define the converlutional layer 5
conv5 = keras.layers.Conv2D(filters= 256, kernel_size= [3, 3], strides= [1, 1], activation= keras.activations.relu, use_bias= True, padding= 'same')(stand4)
pooling5 = keras.layers.AveragePooling2D(pool_size= [2, 2], strides= [2, 2], padding= 'valid')(conv5)
stand5 = keras.layers.BatchNormalization(axis=1)(pooling5)
 
# Define the fully connected layer
flatten = keras.layers.Flatten()(stand5)
fc1 = keras.layers.Dense(4096, activation= keras.activations.relu, use_bias= True)(flatten)
drop1 = keras.layers.Dropout(0.5)(fc1)
 
fc2 = keras.layers.Dense(4096, activation= keras.activations.relu, use_bias= True)(drop1)
drop2 = keras.layers.Dropout(0.5)(fc2)
 
fc3 = keras.layers.Dense(10, activation= keras.activations.softmax, use_bias= True)(drop2)
 
# 基于Model方法构建模型
model = keras.Model(inputs= inputs, outputs = fc3)
# 编译模型
model.compile(optimizer= tf.train.AdamOptimizer(0.001),
       loss= keras.losses.categorical_crossentropy,
       metrics= ['accuracy'])
# 训练配置，仅供参考
model.fit(x_train, y_train, batch_size= batch_size, epochs= epochs, validation_data=(x_test,y_test))

以上这篇Keras使用ImageNet上预训练的模型方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Keras使用ImageNet上预训练的模型方式

- Author -

breeze5428

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python多线程编程（六）：可重入锁RLock

Apr 05 Python

Python 内置函数complex详解

Oct 23 Python

python requests 使用快速入门

Aug 31 Python

Python数据结构与算法之二叉树结构定义与遍历方法详解

Dec 12 Python

Python3.6安装及引入Requests库的实现方法

Jan 24 Python

利用python修改json文件的value方法

Dec 31 Python

Python3 安装PyQt5及exe打包图文教程

Jan 08 Python

python实现一个简单的ping工具方法

Jan 31 Python

对django views中 request, response的常用操作详解

Jul 17 Python

Python超越函数积分运算以及绘图实现代码

Nov 20 Python

使用遗传算法求二元函数的最小值

Feb 11 Python

为了顺利买到演唱会的票用Python制作了自动抢票的脚本

Oct 16 Python

使用Keras预训练模型ResNet50进行图像分类方式

May 23 #Python

基于Python中random.sample()的替代方案

May 23 #Python

keras 自定义loss损失函数,sample在loss上的加权和metric详解

May 23 #Python

keras中模型训练class_weight,sample_weight区别说明

May 23 #Python

浅谈keras中的Merge层(实现层的相加、相减、相乘实例)

May 23 #Python

Keras实现将两个模型连接到一起

May 23 #Python

keras 获取某层输出获取复用层的多次输出实例

May 23 #Python

You might like

PHP开发中AJAX技术的简单应用

2015/12/11 PHP

javascript IE中的DOM ready应用技巧

2008/07/23 Javascript

js类的静态属性和实例属性的理解

2009/10/01 Javascript

将CKfinder整合进CKEditor3.0的新方法

2010/01/10 Javascript

jQuery创建自己的插件(自定义插件)的方法

2010/06/10 Javascript

jQuery Deferred和Promise创建响应式应用程序详细介绍

2013/03/05 Javascript

jQuery取得select选择的文本与值的示例

2013/12/09 Javascript

js+html5通过canvas指定开始和结束点绘制线条的方法

2015/06/05 Javascript

jQuery UI Bootstrap是什么?

2016/06/17 Javascript

详解JS几种变量交换方式以及性能分析对比

2016/11/25 Javascript

Node.JS中快速扫描端口并发现局域网内的Web服务器地址（80）

2017/09/18 Javascript

微信小程序表单验证功能完整实例

2017/12/01 Javascript

详解webpack3编译兼容IE8的正确姿势

2017/12/21 Javascript

vue.js-div滚动条隐藏但有滚动效果的实现方法

2018/03/03 Javascript

如何在Vue.js中实现标签页组件详解

2019/01/02 Javascript

vue实现随机验证码功能(完整代码)

2019/12/10 Javascript

使用vue引入maptalks地图及聚合效果的实现

2020/08/10 Javascript

[04:54]DOTA2 2017国际邀请赛：上届冠军WINGS采访短片

2017/08/09 DOTA

Django objects.all()、objects.get()与objects.filter()之间的区别介绍

2017/06/12 Python

解决csv.writer写入文件有多余的空行问题

2018/07/06 Python

python 为什么说eval要慎用

2019/03/26 Python

python使用python-pptx删除ppt某页实例

2020/02/14 Python

Softmax函数原理及Python实现过程解析

2020/05/22 Python

ghd澳大利亚官方网站：英国最受欢迎的美发工具品牌

2018/05/21 全球购物

同程旅游英文网站：LY.com

2018/11/13 全球购物

ABOUT YOU匈牙利：500个最受欢迎的时尚品牌

2019/07/19 全球购物

迪士尼西班牙官方网上商店：ShopDisney西班牙

2020/02/02 全球购物

Kickers鞋英国官网：男士、女士和儿童鞋

2021/03/08 全球购物

中科软笔试题和面试题

2014/10/07 面试题

研发工程师岗位职责

2014/04/28 职场文书

公益广告标语

2014/06/19 职场文书

2015年建党94周年演讲稿

2015/03/19 职场文书

2015年班干部工作总结

2015/04/29 职场文书

浅谈如何写好演讲稿？

2019/06/12 职场文书

python生成随机数、随机字符、随机字符串

2021/04/06 Python

使用Canvas绘制一个游戏人物属性图

2022/03/25 Javascript