编程 Python

Keras自定义实现带masking的meanpooling层方式

Posted in Python onJune 16, 2020

Keras确实是一大神器，代码可以写得非常简洁，但是最近在写LSTM和DeepFM的时候，遇到了一个问题：样本的长度不一样。对不定长序列的一种预处理方法是，首先对数据进行padding补0，然后引入keras的Masking层，它能自动对0值进行过滤。

问题在于keras的某些层不支持Masking层处理过的输入数据，例如Flatten、AveragePooling1D等等，而其中meanpooling是我需要的一个运算。例如LSTM对每一个序列的输出长度都等于该序列的长度，那么均值运算就只应该除以序列长度，而不是padding后的最长长度。

例如下面这个 3x4 大小的张量，经过补零padding的。我希望做axis=1的meanpooling，则第一行应该是 (10+20)/2，第二行应该是 (10+20+30)/3，第三行应该是 (10+20+30+40)/4。

Keras如何自定义层

在 Keras2.0 版本中（如果你使用的是旧版本请更新），自定义一个层的方法参考这里。具体地，你只要实现三个方法即可。

build(input_shape) : 这是你定义层参数的地方。这个方法必须设self.built = True，可以通过调用super([Layer], self).build()完成。如果这个层没有需要训练的参数，可以不定义。

call(x) : 这里是编写层的功能逻辑的地方。你只需要关注传入call的第一个参数：输入张量，除非你希望你的层支持masking。

compute_output_shape(input_shape) : 如果你的层更改了输入张量的形状，你应该在这里定义形状变化的逻辑，这让Keras能够自动推断各层的形状。

下面是一个简单的例子：

from keras import backend as K
from keras.engine.topology import Layer
import numpy as np

class MyLayer(Layer):

 def __init__(self, output_dim, **kwargs):
 self.output_dim = output_dim
 super(MyLayer, self).__init__(**kwargs)

 def build(self, input_shape):
 # Create a trainable weight variable for this layer.
 self.kernel = self.add_weight(name='kernel', 
  shape=(input_shape[1], self.output_dim),
  initializer='uniform',
  trainable=True)
 super(MyLayer, self).build(input_shape) # Be sure to call this somewhere!

 def call(self, x):
 return K.dot(x, self.kernel)

 def compute_output_shape(self, input_shape):
 return (input_shape[0], self.output_dim)

Keras自定义层如何允许masking

观察了一些支持masking的层，发现他们对masking的支持体现在两方面。

在 __init__ 方法中设置 supports_masking=True。

实现一个compute_mask方法，用于将mask传到下一层。

部分层会在call中调用传入的mask。

自定义实现带masking的meanpooling

假设输入是3d的。首先，在__init__方法中设置self.supports_masking = True，然后在call中实现相应的计算。

from keras import backend as K
from keras.engine.topology import Layer
import tensorflow as tf

class MyMeanPool(Layer):
 def __init__(self, axis, **kwargs):
 self.supports_masking = True
 self.axis = axis
 super(MyMeanPool, self).__init__(**kwargs)

 def compute_mask(self, input, input_mask=None):
 # need not to pass the mask to next layers
 return None

 def call(self, x, mask=None):
 if mask is not None:
 mask = K.repeat(mask, x.shape[-1])
 mask = tf.transpose(mask, [0,2,1])
 mask = K.cast(mask, K.floatx())
 x = x * mask
 return K.sum(x, axis=self.axis) / K.sum(mask, axis=self.axis)
 else:
 return K.mean(x, axis=self.axis)

 def compute_output_shape(self, input_shape):
 output_shape = []
 for i in range(len(input_shape)):
 if i!=self.axis:
 output_shape.append(input_shape[i])
 return tuple(output_shape)

使用举例：

from keras.layers import Input, Masking
from keras.models import Model
from MyMeanPooling import MyMeanPool

data = [[[10,10],[0, 0 ],[0, 0 ],[0, 0 ]],
 [[10,10],[20,20],[0, 0 ],[0, 0 ]],
 [[10,10],[20,20],[30,30],[0, 0 ]],
 [[10,10],[20,20],[30,30],[40,40]]]

A = Input(shape=[4,2]) # None * 4 * 2
mA = Masking()(A)
out = MyMeanPool(axis=1)(mA)

model = Model(inputs=[A], outputs=[out])

print model.summary()
print model.predict(data)

结果如下，每一行对应一个样本的结果，例如第一个样本只有第一个时刻有值，输出结果是[10. 10. ]，是正确的。

[[10. 10.]
 [15. 15.]
 [20. 20.]
 [25. 25.]]

在DeepFM中，每个样本都是由ID构成的，多值field往往会导致样本长度不一的情况，例如interest这样的field，同一个样本可能在该field中有多项取值，毕竟每个人的兴趣点不止一项。

采取padding的方法将每个field的特征补长到最长的长度，则数据尺寸是 [batch_size, max_timestep]，经过Embedding为每个样本的每个特征ID配一个latent vector，数据尺寸将变为 [batch_size, max_timestep，latent_dim]。

我们希望每一个field的Embedding之后的尺寸为[batch_size, latent_dim]，然后进行concat操作横向拼接，所以这里就可以使用自定义的MeanPool层了。希望能给大家一个参考，也希望大家多多支持三水点靠木。

Keras自定义实现带masking的meanpooling层方式

- Author -

蕉叉熵

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

CentOS 6.5下安装Python 3.5.2（与Python2并存）

Jun 05 Python

解决出现Incorrect integer value: '' for column 'id' at row 1的问题

Oct 29 Python

Python 实现12306登录功能实例代码

Feb 09 Python

一篇文章搞懂Python的类与对象名称空间

Dec 10 Python

Tensorflow累加的实现案例

Feb 05 Python

python第三方库学习笔记

Feb 07 Python

如何配置关联Python 解释器 Anaconda的教程(图解)

Apr 30 Python

Django 如何使用日期时间选择器规范用户的时间输入示例代码详解

May 22 Python

基于Python中random.sample()的替代方案

May 23 Python

python os模块在系统管理中的应用

Jun 22 Python

浅谈keras 模型用于预测时的注意事项

Jun 27 Python

写好Python代码的几条重要技巧

May 21 Python

浅谈keras 的抽象后端(from keras import backend as K)

Jun 16 #Python

记录模型训练时loss值的变化情况

Jun 16 #Python

python实现批量转换图片为黑白

Jun 16 #Python

在keras中实现查看其训练loss值

Jun 16 #Python

安装python3.7编译器后如何正确安装opnecv的方法详解

Jun 16 #Python

Keras在训练期间可视化训练误差和测试误差实例

Jun 16 #Python

如何在Windows中安装多个python解释器

Jun 16 #Python

You might like

destoon整合UCenter图文教程

2014/06/21 PHP

PHP采集静态页面并把页面css,img,js保存的方法

2014/12/23 PHP

php中的依赖注入实例详解

2019/08/14 PHP

JavaScript delete操作符应用实例

2009/01/13 Javascript

用Greasemonkey 脚本收藏网站会员信息到本地

2009/10/26 Javascript

jquery中的$(document).ready()与window.onload的区别

2009/11/18 Javascript

Javascript 自适应高度的Tab选项卡

2011/04/05 Javascript

JS 获取select(多选下拉)中所选值的示例代码

2013/08/02 Javascript

JS代码判断IE6,IE7,IE8,IE9的函数代码

2013/08/02 Javascript

JavaSacript中charCodeAt()方法的使用详解

2015/06/05 Javascript

JavaScript获得url查询参数的方法

2015/07/02 Javascript

纯javascript制作日历控件

2015/07/17 Javascript

js格式化时间的方法

2015/12/18 Javascript

Javascript json object 与string 相互转换的简单实现

2016/09/27 Javascript

Javascript中arguments对象的详解与使用方法

2016/10/04 Javascript

详解webpack 多入口配置

2017/06/16 Javascript

javascript将url解析为json格式的两种方法

2017/08/18 Javascript

vue自定义指令directive的使用方法

2019/04/07 Javascript

JavaScript实现多张图片放大镜效果示例【不限定图片尺寸，rem单位】

2019/05/14 Javascript

nodejs中各种加密算法的实现详解

2019/07/11 NodeJs

关于vue表单提交防双/多击的例子

2019/10/31 Javascript

Python基于csv模块实现读取与写入csv数据的方法

2018/01/18 Python

Python实现简单的用户交互方法详解

2018/09/25 Python

python查看模块安装位置的方法

2018/10/16 Python

浅析Python数字类型和字符串类型的内置方法

2019/12/22 Python

pandas和spark dataframe互相转换实例详解

2020/02/18 Python

python 发送get请求接口详解

2020/11/17 Python

详解CSS3的opacity属性设置透明效果的用法

2016/05/09 HTML / CSS

JD Sports西班牙：英国领先的运动服装公司

2020/01/06 全球购物

澳大利亚家居用品零售商：Harris Scarfe

2020/10/10 全球购物

Can a struct inherit from another struct? (结构体能继承结构体吗)

2016/09/25 面试题

公司授权委托书范文

2014/08/02 职场文书

公务员个人考察材料

2014/12/23 职场文书

2015年高中班级工作总结

2015/07/21 职场文书

会议承办单位欢迎词

2019/07/09 职场文书

如何使用python包中的sched事件调度器

2022/04/30 Python