##说明 本Repository主要是常见机器学习算法在常见数据集上面的操作,是作者的学习笔记,希望能够帮助到同样的新手,希望能够得到你的Star。 欢迎访问我的博客。
使用Python2.7编写,需要的模块:
- numpy
- matplotlib
##目录
- kNN
- k-NN_on_iris.py, 利用kNN对花的种类进行分类
- linear regression
- linear_regression_standard equation.py, 使用标准方程求解线性回归系数
- decision tree
- decision_tree_ID3_ex.py, ID3决策树的简单实例,根据create_data_set中创建的dataSet数据集创建决策树
- decision_tree_ID3_on_lenses.py, 创建ID3决策树,根据患者状况对隐形眼镜材质进行预测
- naive bayes
- bayes_ex.py, 朴素贝叶斯的简单实例,对留言板的留言进行分类,判断其是否为侮辱性留言
- SVM
- svm_plot_iris.py, 使用不同的SVM对iris数据集进行分类并绘出结果
- AdaBoost
- adaboost_ex.py, AdaBoost算法的简单二分类实例
- K-means
- K-means_ex.py, K均值聚类算法的简单实例
##主要参考资料:
- Peter HARRINGTON.机器学习实战[M].李锐,李鹏,曲亚东,王斌译.北京:人民邮电出版社, 2013.
- 李航.统计学习方法[M].北京:清华大学出版社, 2012