簡易教程

没有描述

函数式编程我们将来使用Spark/Flink的大量业务代码都会使用到函数式编程。下面的这些操作是学习的重点,先来感受下如何进行函数式编程以...
数组scala中数组的概念是和Java类似,可以用数组来存放同类型的一组数据。数组类型分为定长数组和变长数组两种。 定长数组定长数组指的...
下载HBase的压缩包http://archive.cloudera.com/cdh5/cdh/5/ 我们在这个网址下载我们使用的zk版本为hbase-1.2.0-cdh5.14.2.tar.gz 解压H...
zookeeper集群搭建指的是ZooKeeper分布式模式安装。通常由2n+1台servers组成。这是因为为了保证Leader选举(基于Paxos算法的实现)能够...
Hive将表划分为分区(partition)表和分桶(bucket)表。分区可以让数据的部分查询变得更快,也就是说,在加载数据的时候可以指定加载某一部...
元数据概念元数据(Meta Data)狭义的来说,可以理解为描述数据的数据。广义的来看,除了业务逻辑直接读写处理外的业务数据,所有用来维...