non-saturating neurons非饱和神经元

news/2024/7/3 20:27:39

输出saturating neurons的activation：

sigmoid: input neurons的值会被挤压到[0,1]的区间
tanh：input neurons的值会被挤压到[-1,1]的区间输出

non-saturating neurons 的activation：

relu：input neurons的值，要么变0，要么保持原值（无挤压，无最大最小值限制）l- eaky_relu：input neurons的值，要么按照某比例缩小，要么保持原值（无挤压，无最大最小值限制）

为什么要用relu这样的能生成non-saturating neurons的non-linear activations, 而不用生成saturating neurons的sigmoid或tanh?

规避vanishing, exploding of gradients 带来的gradient值过大过小，导致训练效率低下
使用了RELU后，训练效率大幅提升

最后，回头问一句，什么是saturation? 为什么要叫saturating, non-saturating?

因为有一个数学计算叫做saturation arithmetic
这个算法就是要求将input的值全部变成在某个最大值和最小值之间的值。

在这里插入图片描述

http://www.niftyadmin.cn/n/4230177.html

开源java神经网络组件Joone、Encog和Neuroph

ActiveMQ的应用配置

2019独角兽企业重金招聘Python工程师标准>>> 管理页面输入http://192.168.48.129:8161 点击 “ Manage ActiveMQ broker ”进入管理页面初始默认密码 admin/admin 安全配置（消息安全） ActiveMQ 如果不加入安全机制的话&#xf…

The Cross-evaluation of Machine Learning-based Network Intrusion Detection Systems

本文提出了交叉检验的框架，指的是在不同的数据集进行交叉验证。we endorse the idea of cross-evaluating ML-NIDS by using malicious samples captured in different network datasets.1 By performing such cross-evaluations, it is possible to gauge addition…

图神经网络在反欺诈领域的应用

具体场景为图神经网络在恶意网址检测中的应用。文章目录1. 场景介绍2. 节点刻画3. 恶意网址检测3.1 构建图3.2 模型设计3.3 评估结果1. 场景介绍恶意网址检测中存在的难点有两方面： 一是借助短链接或跳转的方式到恶意网址，链接或跳转的前置页面特征不…

创造选择与选择权

当我发烧时，其实并不是我们发烧，而是被发烧所控制。同理，当我们变富后，也会被富裕所控制。These individuals have riches just as we say that we “have a fever,” when really the fever has us. I also have in mind that s…

用Markdown画流程图

流程图语法： 流程图的语法大体分为两部分：流程图元素定义部分；连接流程图元素部分，该部分用来指明流程图的执行走向。定义元素的语法 tag>type: content:>url 实例： flowchat st>start: 开始 e>end: …

Burp Suite详细教程

文章目录1. Proxy模块2. Send to Intruder3. Repeater1. Proxy模块抓包之前必须配置代理服务器，将代理IP设置为127.0.0.1，Chrome如下图所示在Burp Suite中使intercept is on 打开拦截： 在浏览器中打开页面，就能在软件中查看相…

复盘概念解释

复盘，围棋术语，也称 “复局”，指对局完毕后，复演该盘棋的记录，以检查对局中招法的优劣与得失关键。一般用以自学，或请高手给予指导分析。如按照棋谱排演，类如复盘，称 “ 打谱 ” 或 …

non-saturating neurons非饱和神经元

相关文章