python 深度学习中的4种激活函数


Posted in Python onSeptember 18, 2020

这篇文章用来整理一下入门深度学习过程中接触到的四种激活函数,下面会从公式、代码以及图像三个方面介绍这几种激活函数,首先来明确一下是哪四种:

  • Sigmoid函数
  • Tahn函数
  • ReLu函数
  • SoftMax函数

激活函数的作用

下面图像A是一个线性可分问题,也就是说对于两类点(蓝点和绿点),你通过一条直线就可以实现完全分类。

python 深度学习中的4种激活函数

当然图像A是最理想、也是最简单的一种二分类问题,但是现实中往往存在一些非常复杂的线性不可分问题,比如图像B,你是找不到任何一条直线可以将图像B中蓝点和绿点完全分开的,你必须圈出一个封闭曲线。

而激活函数就是帮助"绘制"这个封闭曲线的非线性函数,有了激活函数的帮助,很多算法的处理能力会得到加强,也可以处理线性不可分问题。

Sigmoid函数

Sigmoid函数曾在介绍逻辑回归时提起过,它的数学表达式为:

python 深度学习中的4种激活函数

其中 e 为纳皮尔常数,其值为2.7182... 它的图像如下:

python 深度学习中的4种激活函数

可以观察出图像的一些特点:

  • 曲线的值域为(0,1)
  • 当x = 0时,Sigmoid函数值为0.5
  • 随着 x 不断增大,Sigmoid函数值无限趋近于1
  • 随着 x 不断减小,Sigmoid函数值无限趋近于0

对于梯度下降法而言,信息的更新很大程度上都取决于梯度,而Sigmoid函数一个很明显的缺点就是当函数值特别靠近0或1这两端时,因为它的曲线已经近乎平缓,所以此时的梯度几乎为0,这样非常不利于权重的更新,从而就会导致模型不收敛。

Sigmoid函数的代码如下:

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

Tanh函数

Tanh函数是双曲正切函数,它的的数学表达式为:

python 深度学习中的4种激活函数

Tanh函数和Sigmoid函数非常相近,这点从图像上可以很好的体现:

python 深度学习中的4种激活函数

这两个函数相同的是,当输入的 x 值很大或者很小时,对应函数输出的 y 值近乎相等,同样的缺点也是梯度特别小,非常不利于权重的更新;不同的是Tanh函数的值域为(-1,1),并且当 x = 0 时,输出的函数值为0。

Tanh函数的代码如下:

import numpy as np
def tanh(x):
 return (exp(x)-exp(-x))/(exp(x)+exp(-x))

ReLu函数

ReLu是线性整流函数,又称为修正性线性单元,它的函数的数学表达式为

python 深度学习中的4种激活函数

Tanh是一个分段函数,它的图像如下:

python 深度学习中的4种激活函数

图像很容易理解,若输入的 x 值小于0,则输出为也为0;若输入的 x 值大于0,则直接输出 x 值,需要注意的是ReLu函数在x = 0 处不连续(不可导),但同样也可以作为激活函数。

与Sigmoid函数和Tanh函数相比,ReLu函数一个很明显的优点就是在应用梯度下降法是收敛较快,当输入值为整数时,不会出现梯度饱和的问题,因为大于0的部分是一个线性关系,这个优点让ReLu成为目前应用较广的激活函数。

ReLu函数的代码如下:

import numpy as np
def relu(x):
 return np.maximum(0,x)

SoftMax函数

分类问题可以分为二分类问题和多分类问题,Sigmoid函数比较适合二分类问题,而SoftMax函数更加适合多分类问题。
SoftMax函数的数学表达式为:

python 深度学习中的4种激活函数

其中Vi表示分类器的输出,i表示类别索引,总的类别个数为C,Si表示当前元素的指数与所有元素指数和的比值。概括来说,SoftMax函数将多分类的输出值按比例转化为相对概率,使输出更容易理解和比较。

为了防止SoftMax函数计算时出现上溢出或者下溢出的问题,通常会提前对 V 做一些数值处理,即每个 V 减去 V 中的最大值,假设D=max(V),SoftMax函数数学表达式更改为:

python 深度学习中的4种激活函数

因为SoftMax函数计算的是概率,所以无法用图像进行展示,SoftMax函数的代码如下:

import numpy as np
def softmax(x):
 D = np.max(x)
 exp_x = np.exp(x-D)
 return exp_x / np.sum(exp_x)

以上就是python 深度学习中的4种激活函数的详细内容,更多关于python 激活函数的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python httplib,smtplib使用方法
Sep 06 Python
Python跳出循环语句continue与break的区别
Aug 25 Python
python实现得到一个给定类的虚函数
Sep 28 Python
Django框架中处理URLconf中特定的URL的方法
Jul 20 Python
Python中将变量按行写入txt文本中的方法
Apr 03 Python
Python贪心算法实例小结
Apr 22 Python
对python中的乘法dot和对应分量相乘multiply详解
Nov 14 Python
Python3如何对urllib和urllib2进行重构
Nov 25 Python
如何使用python记录室友的抖音在线时间
Jun 29 Python
python 通过exifread读取照片信息
Dec 24 Python
python引入其他文件夹下的py文件具体方法
May 23 Python
python画条形图的具体代码
Apr 20 Python
python闭包与引用以及需要注意的陷阱
Sep 18 #Python
python 代码运行时间获取方式详解
Sep 18 #Python
python判断字符串以什么结尾的实例方法
Sep 18 #Python
python绘制趋势图的示例
Sep 17 #Python
Python绘制组合图的示例
Sep 18 #Python
记一次Django响应超慢的解决过程
Sep 17 #Python
Visual Studio Code搭建django项目的方法步骤
Sep 17 #Python
You might like
追求程序速度,而不是编程的速度
2008/04/23 PHP
php session 预定义数组
2009/03/16 PHP
ThinkPHP利用PHPMailer实现邮件发送实现代码
2013/09/26 PHP
使用PHP静态变量当缓存的方法
2013/11/13 PHP
php简单操作mysql数据库的类
2015/04/16 PHP
php封装的smarty类完整实例
2016/10/19 PHP
Jquery练习之表单验证实现代码
2010/12/14 Javascript
js实现幻灯片播放图片示例代码
2013/11/07 Javascript
jquery.cookie用法详细解析
2013/12/18 Javascript
JS获取地址栏参数的几种方法小结
2014/02/28 Javascript
JS实现两个大数(整数)相乘
2014/04/28 Javascript
浅谈javascript语法和定时函数
2015/05/03 Javascript
jquery自适应布局的简单实例
2016/05/28 Javascript
基于jQuery实现表格的排序
2016/12/02 Javascript
svg动画之动态描边效果
2017/02/22 Javascript
HTML的select控件美化
2017/03/27 Javascript
微信小程序实现列表下拉刷新上拉加载
2020/07/29 Javascript
vue+VeeValidate 校验范围实例详解(部分校验,全部校验)
2018/10/19 Javascript
vue-router 起步步骤详解
2019/03/26 Javascript
js实现弹幕墙效果
2020/12/10 Javascript
[49:02]KG vs Infamous 2019国际邀请赛淘汰赛 败者组BO1 8.20.mp4
2020/07/19 DOTA
Python中optparser库用法实例详解
2018/01/26 Python
celery4+django2定时任务的实现代码
2018/12/23 Python
Python爬虫实战之12306抢票开源
2019/01/24 Python
Django 通过JS实现ajax过程详解
2019/07/30 Python
用Python批量把文件复制到另一个文件夹的实现方法
2019/08/16 Python
利用Python过滤相似文本的简单方法示例
2021/02/03 Python
OnePlus加拿大官网:中国国际化手机品牌
2020/10/13 全球购物
计算机毕业生求职信
2014/06/10 职场文书
党员干部作风建设思想汇报范文
2014/10/25 职场文书
鼋头渚导游词
2015/02/05 职场文书
可可西里观后感
2015/06/08 职场文书
导盲犬小Q观后感
2015/06/11 职场文书
万能密码的SQL注入漏洞其PHP环境搭建及防御手段
2021/09/04 SQL Server
HttpClient实现表单提交上传文件
2022/08/14 Java/Android
CSS使用SVG实现动态分布的圆环发散路径动画
2022/12/24 HTML / CSS