同济大学软件学院统计分析与建模期末项目
- contrast_sampled_dataset.csv 对照采样数据集
- crash_data.csv 原数据
- featured_dataset.csv 最终版的特征工程结果
- traffic_data.csv 原数据
- visualize.py 对应pictures
- visualize_2.py对应pictures_2
- visualize_3.py对应pictures_3
- preprocess_1.py 将is_crash添加到traffic_data, time转秒数
- preprocess_3.py 删除缺失值
- preprocess_2.py 提取特征 (4.5.6做可视化用,最后的建模没有使用这个版本的特征工程)
卡尔曼滤波预处理(测试版)和时序分析
卡尔曼滤波预处理和预测
- split_dataset.py(病例对照采样)
- logistic.py (逻辑回归py版本,并生成r版本需要用的r_dataset.csv)
- common_logistic.rmd(逻辑回归r版本)
- logistic_test1.R为测试版本
- logistic-final.R为最终建模版本
- NaiveBayes0106.py 最终建模版本