Skip to content

Latest commit

 

History

History
120 lines (120 loc) · 4 KB

README.md

File metadata and controls

120 lines (120 loc) · 4 KB

深度思考之机器学习系列

本系列将包含机器学习、深度学习、实战和数学基础等相关知识,所有内容均通过asciidoctor编写;

内容同时更新在pdf文档中,方便大家阅读,此系列将持续更新!

目前已更新完前八章内容,继续加油!

计划的目录结构

第一章:机器学习基本概念

1.1:统计学习
1.2:统计学习三要素
1.2.1:模型
1.2.2:策略
1.2.3:算法
1.3:模型评估
1.3.1:正则化
1.3.2:交叉验证
1.3.3:泛化能力
1.3.4:生成模型和判别模型
1.4:深度思考
1.4.1:贝叶斯理论

第二章:线性回归和逻辑回归

2.1:线形回归
2.1.1:概念
2.1.2:梯度下降
2.1.3:梯度下降的局限性
2.1.4:深度思考
2.2:逻辑回归
2.2.1:揭开面纱
2.2.2:sigmoid函数
2.2.3:参数更新
2.2.4:深度思考

第三章:特征工程

3.1:因子
3.2:特征工程
3.2.1:数据清洗
3.2.2:数据采样
3.2.3:特征处理

第四章:支持向量机

4.1:开门见山
4.2:高维空间
4.2.1:超平面的表示
4.2.2:点到平面距离
4.3:问题优化
4.3.1:理解对偶问题
4.3.2:等价性证明
4.4:对偶问题求解
4.4.1:推导和结论
4.4.2:SMO算法
4.5:软间隔分类器
4.5.1:优化问题
4.5.2:合页损失
4.6:核技巧
4.7:深度思考
4.7.1:深入理解KKT条件
4.7.2:如何理解高斯核将数据映射到无穷维

第五章:主题模型

5.1:解决什么问题
5.2:给问题建模
5.2.1:建模
5.2.2:第一次思考
5.2.3:第二次思考
5.2.4:第三次思考
5.3:文本建模
5.3.1:文档是如何产生的
5.3.2:pLSA模型
5.3.3:LDA模型
5.3.4:变分EM算法求解pLSA
5.4:终篇

第六章:最大熵理论和多分类器

6.1:最大熵原理
6.1.1:最大熵定义
6.1.2:最大熵模型推导
6.1.3:多分类器
6.2:指数分布簇
6.3:广义线性模型
6.4:广义线形模型应用-多项式分布

第七章:EM算法

7.1:前置知识点
7.1.1:Jensen不等式
7.1.2:最大似然估计
7.2:EM算法
7.2.1:直通结论
7.2.2:EM推导

第八章:决策树和集成学习

8.1:决策树模型
8.2:集成学习
8.2.1:Adboost详解
8.2.2:GBDT详解
8.2.3:XGBoost详解
8.2.4:总结
8.2.5:深度思考

第九章:推荐系统

第十章:聚类和近邻算法

10.1:kmeans算法
10.2:kmeans++算法
10.2.1:基本理论
10.2.2:算法核心
10.3:基于层次的聚类
10.4:knn算法
10.5:kd树
10.5.1:构造kd树
10.5.2:搜索kd树

第十一章:贝叶斯理论

11.1:一个公式的故事
11.2:一些常见题目
11.2.1:两信封和美元的问题
11.2.2:三扇门和开奖的问题

第十二章:隐马尔科夫模型

第十三章:条件随机场

第十四章:深度学习概论

第十五章:深度学习中的优化算法

第十六章:深度学习中的正则化

第十七章:深度神经网络

第十八章:卷积神经网络

第十九章:循环神经网络

第二十章:神经网络番外篇

第二十一章:生成对抗网络

第二十二章:迁移学习

第二十三章:强化学习

第二十四章:数学之美

第二十五章:深度学习框架

第二十六章:走进互联网