深度思考之机器学习系列 本系列将包含机器学习、深度学习、实战和数学基础等相关知识,所有内容均通过asciidoctor编写; 内容同时更新在pdf文档中,方便大家阅读,此系列将持续更新! 目前已更新完前八章内容,继续加油! 计划的目录结构 第一章:机器学习基本概念 1.1:统计学习 1.2:统计学习三要素 1.2.1:模型 1.2.2:策略 1.2.3:算法 1.3:模型评估 1.3.1:正则化 1.3.2:交叉验证 1.3.3:泛化能力 1.3.4:生成模型和判别模型 1.4:深度思考 1.4.1:贝叶斯理论 第二章:线性回归和逻辑回归 2.1:线形回归 2.1.1:概念 2.1.2:梯度下降 2.1.3:梯度下降的局限性 2.1.4:深度思考 2.2:逻辑回归 2.2.1:揭开面纱 2.2.2:sigmoid函数 2.2.3:参数更新 2.2.4:深度思考 第三章:特征工程 3.1:因子 3.2:特征工程 3.2.1:数据清洗 3.2.2:数据采样 3.2.3:特征处理 第四章:支持向量机 4.1:开门见山 4.2:高维空间 4.2.1:超平面的表示 4.2.2:点到平面距离 4.3:问题优化 4.3.1:理解对偶问题 4.3.2:等价性证明 4.4:对偶问题求解 4.4.1:推导和结论 4.4.2:SMO算法 4.5:软间隔分类器 4.5.1:优化问题 4.5.2:合页损失 4.6:核技巧 4.7:深度思考 4.7.1:深入理解KKT条件 4.7.2:如何理解高斯核将数据映射到无穷维 第五章:主题模型 5.1:解决什么问题 5.2:给问题建模 5.2.1:建模 5.2.2:第一次思考 5.2.3:第二次思考 5.2.4:第三次思考 5.3:文本建模 5.3.1:文档是如何产生的 5.3.2:pLSA模型 5.3.3:LDA模型 5.3.4:变分EM算法求解pLSA 5.4:终篇 第六章:最大熵理论和多分类器 6.1:最大熵原理 6.1.1:最大熵定义 6.1.2:最大熵模型推导 6.1.3:多分类器 6.2:指数分布簇 6.3:广义线性模型 6.4:广义线形模型应用-多项式分布 第七章:EM算法 7.1:前置知识点 7.1.1:Jensen不等式 7.1.2:最大似然估计 7.2:EM算法 7.2.1:直通结论 7.2.2:EM推导 第八章:决策树和集成学习 8.1:决策树模型 8.2:集成学习 8.2.1:Adboost详解 8.2.2:GBDT详解 8.2.3:XGBoost详解 8.2.4:总结 8.2.5:深度思考 第九章:推荐系统 第十章:聚类和近邻算法 10.1:kmeans算法 10.2:kmeans++算法 10.2.1:基本理论 10.2.2:算法核心 10.3:基于层次的聚类 10.4:knn算法 10.5:kd树 10.5.1:构造kd树 10.5.2:搜索kd树 第十一章:贝叶斯理论 11.1:一个公式的故事 11.2:一些常见题目 11.2.1:两信封和美元的问题 11.2.2:三扇门和开奖的问题 第十二章:隐马尔科夫模型 第十三章:条件随机场 第十四章:深度学习概论 第十五章:深度学习中的优化算法 第十六章:深度学习中的正则化 第十七章:深度神经网络 第十八章:卷积神经网络 第十九章:循环神经网络 第二十章:神经网络番外篇 第二十一章:生成对抗网络 第二十二章:迁移学习 第二十三章:强化学习 第二十四章:数学之美 第二十五章:深度学习框架 第二十六章:走进互联网