【互动问答分享】第3期决胜云计算大数据时代Spark亚太研究院公益大讲堂

时间:2014-09-10 14:19:51   收藏:0   阅读:288

决胜云计算大数据时代”

 

Spark亚太研究院100期公益大讲堂 【第3期互动问答分享】

 

Q1: groupbykey是排好序的吗?分组排序 怎么实现?

spark.textFile(...).groupByKey().map{p =>


      val sortArray = p._2.sortWith(_ << span=""> _)//排序

      (p._1, sortArray)

    }


Q2:spark 会替代Hadoop 吗?

Q3:spark做大规模高性能数值计算可以吗?我是做高性能计算的。

Spark是高性能计算目前最佳的选择大数据计算平台;


Q4:一个worker上会有多个executor?executor个数是一个app一个吗?还是只有一个?


Q5:只有一台机器能学习吗?


本文出自 “Spark亚太研究院” 博客,请务必保留此出处http://rockyspark.blog.51cto.com/2229525/1550520

原文:http://rockyspark.blog.51cto.com/2229525/1550520

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!