LionKing数据科学专栏

购买会员可以解锁网站精华内容

Spark

Spark是目前主流的Map Reduce大数据框架,可以支持scala、Java、Python、R语言。其中scala是Spark的开发语言,有最全的功能,是业界最主流的选择。本文所有内容使用scala语言。

我们通过以下方面介绍Spark框架:

  1. Spark的安装
  2. Map Reduce的原理
  3. Scala基本用法
  4. Spark基本用法
  5. Spark操作数据库
  6. Spark进行机器学习
  7. Spark备忘单
  8. Spark练习题

更多Spark相关问题见本网站论坛Spark练习题Spark版面

       

更多面试问题见面试题汇总