博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【dlbook】数学基础
阅读量:5210 次
发布时间:2019-06-14

本文共 490 字,大约阅读时间需要 1 分钟。

【代数】

Moore-Penrose 伪逆

 

【概率信息论】

自信息,香农熵,衡量两个分布的差异:kl散度 \ 交叉熵

 

【数值】

 溢出:  softmax计算的时候要关注上溢和下溢,如果所有X都相等且为很小的负数的话,有分母为零的风险。

病态条件: 矩阵求逆对输入的误差可能很敏感,这样由于输入的不精确,会导致结果的不精确。

  用条件数来衡量。条件数定义为

Jacobian和Hessian阵:

  Jacobian阵,m维 to n维, nxm矩阵,yi To xj。多维输出的一阶导数

  Hessian阵:m维 to 1维, mxm矩阵,二阶导数,对称阵。将其进行特征值分解,可以得到在哪个方向下降的比较快。正定的时候是局部最小值。

 

梯度下降法无法包含曲率信息,如果Hessian矩阵条件数过大,一阶方法往往会出问题

如何计算Hessian阵?  / 如何评估是否需要二阶优化?二阶优化在鞍点是有害的

深度学习背景下凸优化重要性大大减少。

 

KKT条件,有空自己推一遍。。。

 

转载于:https://www.cnblogs.com/yesuuu/p/8333957.html

你可能感兴趣的文章
疯狂JAVA16课之对象与内存控制
查看>>
[转载]树、森林和二叉树的转换
查看>>
WPF移动Window窗体(鼠标点击左键移动窗体自定义行为)
查看>>
Java核心技术梳理-类加载机制与反射
查看>>
1593: [Usaco2008 Feb]Hotel 旅馆 (线段树)
查看>>
软件测试-----Graph Coverage作业
查看>>
POJO 与 JavaBean 的区别 !
查看>>
php、mysql查询当天,查询本周,查询本月的数据实例(字段是时间戳)
查看>>
Windows Phone 7手势识别左右滑动 非XNA
查看>>
django ORM创建数据库方法
查看>>
Win8下,以管理员身份启动VS项目
查看>>
[bzoj1025][SCOI2009]游戏 (分组背包)
查看>>
BZOJ 1629 [Usaco2005 Nov]Cow Acrobats:贪心【局部证明】
查看>>
创建Oracle synonym 详解
查看>>
【SQL】181. Employees Earning More Than Their Managers
查看>>
uva 1335 Beijing Guards
查看>>
php7 新特性整理
查看>>
Nodejs.Electron(Nodejs的图形界面开发)安装和试用
查看>>
RabbitMQ、Redis、Memcache、SQLAlchemy
查看>>
20190716NOIP模拟赛T2 通讯(tarjan缩点+贪心)
查看>>