1.hive的数据组织
基本概念和关系型数据库类似,如:库,表,列,分区。按照数据组织粒度由大到小说明:
数据库 Databases Database起到命名空间的功能,避免表,视图等定义的混乱,同时也为权限的定义及分配提供良好的隔离。
表 Tables 每个表包含一个主题信息,有多个属性字段组成的二维数据集合,一个数据库可以包含多张表。
分区 Partitions 每个表可以有一个或多个分区键值,是数据的存储单元,可以按分区key划分查询数据范围,有效提高查询效率。比如可以按月和按天设计表分区,查询是指定查某天则不需要扫描整月数据。
桶 Buckets 表分区还可以按照某几列hash进行划分,可以实现数据采样和提高某些场景的查询效率,如mapside join。
2.元数据库中相关表的解释
以下内容回帖刷新可见………………
回复帖子,然后刷新页面即可查看隐藏内容
版权声明:原创作品,允许转载,转载时务必以超链接的形式表明出处和作者信息。否则将追究法律责任。来自海汼部落-青牛,http://hainiubl.com/topics/112