Skip to content

Latest commit

 

History

History
14 lines (10 loc) · 369 Bytes

spark-summit-15.md

File metadata and controls

14 lines (10 loc) · 369 Bytes

Spark上的数据分析简介

总时长 = 2小时

话题数目 = 6个

大约每个话题 20分钟

  1. MLlib最新进展简介
  2. 模型表示 --> MLlib的向量模型与矩阵模型
  3. 优化并行 --> 同步方式、优化调度、以及模型存储
  4. 计算模式 --> MLlib与GraphX
  5. 数据承载 --> MLlib与SparkSQL
  6. 实例分析 --> MLlib与Scikit-learn