欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
全部教程·
大数据和分析·
Pig教程
[目录]
·
Pig SPLIT
Pig 教程
Pig 安装
Pig 运行模式
Pig Latin
Pig 数据类型
Pig 示例
Pig UDF(用户定义函数)
Pig Load
Pig CROSS
Pig DISTINCT
Pig FILTER
Pig FOREACH
Pig Group
Pig LIMIT
Pig ORDER BY
Pig SPLIT
Pig UNION
Pig AVG
Pig CONCAT
Pig COUNT
Pig IN
Pig MAX
Pig MIN
Pig SIZE
Pig SUM
Pig TOKENIZE
Pig ABS
Pig CBRT
Pig CEIL
Pig FLOOR
Pig LOG
Pig LOG10
Pig ROUND
Pig SQRT
Pig 教程
Pig 安装
Pig 运行模式
Pig Latin
Pig 数据类型
Pig 示例
Pig UDF(用户定义函数)
Pig Load
Pig CROSS
Pig DISTINCT
Pig FILTER
Pig FOREACH
Pig Group
Pig LIMIT
Pig ORDER BY
Pig SPLIT
Pig UNION
Pig AVG
Pig CONCAT
Pig COUNT
Pig IN
Pig MAX
Pig MIN
Pig SIZE
Pig SUM
Pig TOKENIZE
Pig ABS
Pig CBRT
Pig CEIL
Pig FLOOR
Pig LOG
Pig LOG10
Pig ROUND
Pig SQRT
Apache Pig SPLIT 运算符
Apache Pig SPLIT 运算符根据提供的表达式将关系分解为两个或多个关系。这里,一个元组可能会或可能不会分配给一个或多个关系。
SPLIT 运算符示例
在这个例子中,我们拆分了提供的关系
执行 SPLIT Operator 的步骤
- 在本地计算机上创建一个文本文件并为其提供一些值。
$ nano psplit.txt

- 检查写入文本文件中的值。
$ cat psplit.txt

- 上传特定目录下 HDFS 上的文本文件。
$ hdfs dfs-put psplit.txt /pigexample
- 开启猪 MapReduce 运行模式。
$ pig
- 加载包含数据的文件。
grunt> A = LOAD '/pigexample/psplit.txt' USING PigStorage(',') AS (a1:int,a2:int) ;
- 现在,执行并验证数据。
grunt> DUMP A;

- 让我们提供拆分关系的表达式。
grunt> SPLIT A INTO X if a1<=2, Y if a1>2;

- 现在,执行并验证第一个关系的数据。
grunt> DUMP X;

- 现在,执行并验证第二个关系的数据。
grunt> DUMP Y;

在这里,我们得到了想要的输出。
下一章:Apache Pig UNION 运算符
Apache Pig UNION 运算符用于计算两个或多个关系的并集。它不维护元组的顺序。它也不会消除重复的元组。 UNION 运算符示例在这个示例中,我们计算两个关系的数据。 ...
AI 中文社