Spark上的数据分析简介 总时长 = 2小时 话题数目 = 6个 大约每个话题 20分钟 MLlib最新进展简介 模型表示 --> MLlib的向量模型与矩阵模型 优化并行 --> 同步方式、优化调度、以及模型存储 计算模式 --> MLlib与GraphX 数据承载 --> MLlib与SparkSQL 实例分析 --> MLlib与Scikit-learn