LionKing数据科学专栏

购买普通会员高级会员可以解锁网站精华内容且享受VIP服务的优惠

想要查看更多数据科学相关的内容请关注我们的微信公众号知乎专栏

Spark

Spark是目前主流的Map Reduce大数据框架,可以支持scala、Java、Python、R语言。其中scala是Spark的开发语言,有最全的功能,是业界最主流的选择。本文所有内容使用scala语言。

我们通过以下方面介绍Spark框架:

  1. Spark的安装
  2. Map Reduce的原理
  3. Scala基本用法
  4. Spark基本用法
  5. Spark操作数据库
  6. Spark进行机器学习
  7. Spark备忘单
  8. Spark练习题

更多Spark相关问题见本网站论坛Spark练习题Spark版面

       

更多面试问题见面试真题汇总

想要查看更多数据科学相关的内容请关注我们的微信公众号知乎专栏