欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
全部教程·
大数据和分析·
Pig教程
[目录]
·
Pig SIZE
Pig 教程
Pig 安装
Pig 运行模式
Pig Latin
Pig 数据类型
Pig 示例
Pig UDF(用户定义函数)
Pig Load
Pig CROSS
Pig DISTINCT
Pig FILTER
Pig FOREACH
Pig Group
Pig LIMIT
Pig ORDER BY
Pig SPLIT
Pig UNION
Pig AVG
Pig CONCAT
Pig COUNT
Pig IN
Pig MAX
Pig MIN
Pig SIZE
Pig SUM
Pig TOKENIZE
Pig ABS
Pig CBRT
Pig CEIL
Pig FLOOR
Pig LOG
Pig LOG10
Pig ROUND
Pig SQRT
Pig 教程
Pig 安装
Pig 运行模式
Pig Latin
Pig 数据类型
Pig 示例
Pig UDF(用户定义函数)
Pig Load
Pig CROSS
Pig DISTINCT
Pig FILTER
Pig FOREACH
Pig Group
Pig LIMIT
Pig ORDER BY
Pig SPLIT
Pig UNION
Pig AVG
Pig CONCAT
Pig COUNT
Pig IN
Pig MAX
Pig MIN
Pig SIZE
Pig SUM
Pig TOKENIZE
Pig ABS
Pig CBRT
Pig CEIL
Pig FLOOR
Pig LOG
Pig LOG10
Pig ROUND
Pig SQRT
Apache Pig SIZE 函数
Apache Pig SIZE 函数用于查找基于任何 Pig 数据类型的元素数量。它在大小计算中包含 NULL 值。这里,大小不是代数的。
SIZE 函数示例
在此示例中,我们计算每个元组的第一个字段中存在的字符数。
执行 SIZE 函数的步骤
- 在本地机器上创建一个文本文件并插入元组列表。
$ nano evalsize.txt

- 检查插入到文本文件中的元组。
$ cat evalsize.txt

- 上传特定目录下 HDFS 上的文本文件。
$ hdfs dfs-put evalsize.txt /pigexample
- 开启猪 MapReduce 运行模式。
$ pig
- 加载包含数据的文件。
grunt> A = LOAD '/pigexample/evalsize.txt' USING PigStorage(',') AS (a1:chararray,a2:chararray) ;
- 现在,执行并验证数据。
grunt> DUMP A;

- 让我们返回每个元组的第一个字段的大小。
grunt> Result = FOREACH A GENERATE SIZE(a1); grunt> DUMP Result;

在这里,我们得到了想要的输出。
下一章:Apache Pig SUM 函数
Apache Pig SUM 函数用于查找单列包中数值的总和。它需要一个用于全局总和的前面的 GROUP ALL 语句和一个用于组总和的 GROUP BY 语句。它忽略空值。 SUM 函数示例在 ...
AI 中文社