论文笔记 | Large-Margin Softmax Loss for Convolutional Neural Networks

阅读量：

出处：第39届国际机器学习大会（ICML 2016）
论文：https://proceedings.mlr.press/v48/liud16.pdf
代码：https://github.com/luoyetx/mx-lsoftmax

摘要：

1 简介

当前学习发展路径显示，在强化Convolutional Neural Networks（CNN）的过程中需要特别关注信息的质量与鉴别力

2 相关工作

contrastive loss：需要给CNN输入一个样本对，如果是属于同一类别，要求它们直接的特征相近。反之则需要留较大的距离。
triplet loss：输入三元组样本，最小化 anchor 和 positive 样本的距离，最大化 anchor 和 negative 样本的距离
original softmax loss：
$L=\frac{{1}}{{N}}\sum\limits_{i} L{_{i}}=\frac{{1}}{{N}}\sum\limits_{i} {-log\left( {\frac{{e^{f_{y_{i}}}}}{{\sum\nolimits_{j} {e^{f_{j}}}}}} \right)}$
由于 $f_{y_{i}}=W_{y_{i}}^{T}x_{i}=\left\| {W_{j}} \right\|\left\| {x_{i}} \right\|cos\left( {\theta _{j}} \right)$
所以 $L_{i}=-log\left( {\frac{{e^{\left\| {W_{y_{i}}} \right\|\left\| {x_{i}} \right\|cos\left( {\theta _{y_{i}}} \right)}}}{{\sum\nolimits_{j} {e^{W_{y_{i}}^{T}x_{i}=\left\| {W_{j}} \right\|\left\| {x_{i}} \right\|cos\left( {\theta _{j}} \right)}}}}} \right)$

3 方法

3.1 引言

该软最大算法旨在实现对输入数据x的正确分类目标是以确保 $W_{1}^{T}x > W_{2}^{T}x$ 这一条件能够成立即 $\left\| W_{1} \right\|\left\| X \right\|\cos(\theta_1) > \left\| W_{2} \right\|\left\| X \right\|\cos(\theta_2)$ 得以满足为此目的我们需要通过设定一个正整数m来增强分类的严格性并生成决策间隔以提高模型区分不同类别数据的能力其中参数θ₁应满足0 ≤ θ₁ ≤ π/m这一范围约束

该方法计算损失会迫使模型使模型学会类间距离更大的同时使模型学会类内距离更小的特征

3.2 定义

L-Softmax loss 被定义为：

为了简化正向传播与反向传播算法，在构建网络结构时作者提出了一个具体的函数模型

3.3 几何解释

L-softmax loss 是为了鼓励不同类别之间有一个角度间距，例举二分类

比如当 ||W₁|| 等于 ||W₂|| 时, 传统的 Softmax 损失则要求 θ₁ 必须小于 θ₂ 才能正确分类样本 x 为类别 1. 相比之下,L-Softmax 损失只需满足 mθ₁ 小于 θ₂ 即可完成相同的任务.

全部评论 (0)

还没有任何评论哟~

论文笔记 | Large-Margin Softmax Loss for Convolutional Neural Networks

出处：ICML2016 论文：http://proceedings.mlr.press/v48/liud16.pdf 代码：https://github.com/luoyetx/mxlsoftmax ...

(L-Softmax loss)Large-Margin Softmax Loss for Convolutional Neural Networks

论文地址：https://arxiv.org/abs/1612.02295 摘要交叉熵损失和softmax可能是卷积神经网络CNNs中最常用的监控组件之一。尽管该组件简单、常用且性能优异，但它并不显...

阅读小结：Large-Margin Softmax Loss for Convolutional Neural Networks

徐博最近一直在看我博客，肯定是想看我什么时候不更新，然后好嘲笑我。当然，不排除徐博已经爱上我的可能。 What：改进SoftmaxLoss，显式的鼓励类间差异和类内相似，防止过拟合。在minist...

从源码解读Large-Margin Softmax Loss for Convolutional Neural Networks

从源码解读LargeMarginSoftmaxLossforConvolutionalNeuralNetworks 1.论文回顾论文地址：<https://arxiv.org/pdf/1612.02...

Large-Margin Softmax Loss

LargeMarginSoftmaxLoss 前言前言 LargeMarginSoftmaxLoss也是为了提高类内特征的紧凑性，拉大类间特征的间隔（intraclasscompactnessand...

[论文笔记]Convolutional Neural Networks for Sentence Classification

引言这是对经典的TextCNN1论文的阅读笔记。核心思想使用CNN来做句子级分类任务。作者提出了一种将简单的CNN应用在无监督方法word2vec或Glove得到的词向量上，来完成句子分类任务...

论文笔记（NLP）——Convolutional Neural Networks for Sentence Classification

1.abstract 本篇论文报告了一系列用预训练词向量上训练的CNN进行句子级分类任务的实验。展示了有少量参数调整和静态向量的简单的CNN在多个基准上达到了很好的效果。通过微调学习特定任务的向量能够...

论文笔记之Learning Convolutional Neural Networks for Graphs

本篇论文是2016ICML上的一篇论文，对于如何将cnn应用在graph上提供了一种新的思路。架构：总体上讲，就是用w个固定size=（k+1）的子图来表示输入的graph，再将这w个子图正则化后...

【论文阅读笔记】Large-scale Video Classification with Convolutional Neural Networks

论文贡献： 1.采用多种方法扩展CNN到视频识别，并用Sports1M数据集进行验证和测试。 2.提出了将输入处理为低分辨率流和高分辨率流的方法，在不影响精确度的前提下显著减少了CNN的训练时间。 3...

论文笔记-DYNET: DYNAMIC CONVOLUTION FOR ACCELERATING CONVOLUTIONAL NEURAL NETWORKS

DYNET:DYNAMICCONVOLUTIONFORACCELERATINGCONVOLUTIONALNEURALNETWORKS 文章出处 1.作者：YikangZhang,JianZhang,Q...

是否确定退出登录?

论文笔记 | Large-Margin Softmax Loss for Convolutional Neural Networks

1 简介

2 相关工作

3 方法

3.1 引言

3.2 定义

3.3 几何解释

全部评论 (0)

相关文章推荐

论文笔记 | Large-Margin Softmax Loss for Convolutional Neural Networks

(L-Softmax loss)Large-Margin Softmax Loss for Convolutional Neural Networks

阅读小结：Large-Margin Softmax Loss for Convolutional Neural Networks

从源码解读Large-Margin Softmax Loss for Convolutional Neural Networks

Large-Margin Softmax Loss

[论文笔记]Convolutional Neural Networks for Sentence Classification

论文笔记（NLP）——Convolutional Neural Networks for Sentence Classification

论文笔记之Learning Convolutional Neural Networks for Graphs

【论文阅读笔记】Large-scale Video Classification with Convolutional Neural Networks

论文笔记-DYNET: DYNAMIC CONVOLUTION FOR ACCELERATING CONVOLUTIONAL NEURAL NETWORKS