深入理解Spark RDD——RDD实现的初次分析

RDD(Resilient Distributed Datasets,弹性分布式数据集)代表可并行操作元素的不可变分区集合。对于Spark的初学者来说,这个概念会十分陌生。即便是对于一些有Spark使用经验的人,要想说清楚什么是RDD,以及为什么需要RDD还是一件比较困难的事情。在《深入理解Spa...

2019-06-21 09:49:19

阅读数 565

评论数 0

深入理解Spark RDD——为什么需要RDD?

RDD(Resilient Distributed Datasets,弹性分布式数据集)代表可并行操作元素的不可变分区集合。对于Spark的初学者来说,这个概念会十分陌生。即便是对于一些有Spark使用经验的人,要想说清楚什么是RDD,以及为什么需要RDD还是一件比较困难的事情。本文首先解释第二个...

2019-06-11 10:00:25

阅读数 570

评论数 0

累计三年,断断续续的管理经验

在写标题的时候,本来要写成《累计三年,断断续续的项目管理经验》。后来想想,以我对管理的认识和感悟,管理好一个项目真的不是只管理项目这么简单。 何为断断续续?是因为这四年的管理经验不是连续的,分为了三段而已。2009年,在一家传统软件公司第一次担任了项目组长,这半年经验是伴随着我的离职而结束...

2019-06-03 10:59:15

阅读数 2733

评论数 15

提示
确定要删除当前文章?
取消 删除