全部教程· 大数据和分析· Hive · Hive 分区

Hive 分区

Hive 将表组织成分区。这是根据日期，城市和部门等分区列的值将表分成相关部分的一种方法。使用分区，很容易查询一部分数据。

表或分区被细分为桶，以向数据提供额外的结构，以用于更高效的查询。Bucketing基于某个表的某列的哈希函数的值进行工作。

例如，名为 Tab1 的表包含员工数据，例如id，姓名，部门和yoj（即加入年份）。假设您需要检索2012年加入的所有员工的详细信息。查询会搜索整个表以获取所需的信息。但是，如果您将员工数据与年份进行分区并将其存储在单独的文件中，则会缩短查询处理时间。以下示例显示如何对文件及其数据进行分区：

以下文件包含employeedata表。

/tab1/employeedata/file1

身份证，姓名，部门，yoj
1，gopal，TP，2012
2，kiran，HR，2012
3，kaleel，SC，2013
4，Prasanth，SC，2013

上述数据使用年份分为两个文件。

/tab1/employeedata/2012/file2

1，gopal，TP，2012
2，kiran，HR，2012

/tab1/employeedata/2013/file3

3，kaleel，SC，2013
4，Prasanth，SC，2013

添加分区

我们可以通过改变表格将分区添加到表格中。让我们假设我们有一个名为员工的表，其中包含Id，Name，Salary，Designation，Dept和yoj等字段。

句法：

ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec
[LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;

partition_spec:
: (p_column = p_col_value, p_column = p_col_value, ...)

以下查询用于将分区添加到employee表。

hive> ALTER TABLE employee
> ADD PARTITION (year=’2013’)
> location '/2012/part2012';

重命名分区

该命令的语法如下。

ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查询用于重命名分区：

hive> ALTER TABLE employee PARTITION (year=’1203’)
   > RENAME TO PARTITION (Yoj=’1203’);

删除分区

以下语法用于删除分区：

ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查询用于删除分区：

hive> ALTER TABLE employee DROP [IF EXISTS]
   > PARTITION (year=’1203’);

下一章：Hive 内置运算符

Hive 中有四种类型的操作符：关系运算符算术运算符逻辑运算符复杂算子关系运算符这些运算符用于比较两个操作数。下表介绍了Hive中可用的关系运算符：操作者操作数描述A = B所有原始类型如果表达式A等同于表 ...

上一章：Hive 删除表

下一章：Hive 内置运算符