欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
Apache Pig AVG 函数
Apache Pig AVG 函数用于查找单列包中给定数值的平均值。它需要一个用于全局平均值的前面的 GROUP ALL 语句和一个用于组平均值的 GROUP BY 语句。但是,它会忽略 NULL 值。
AVG 函数示例
在此示例中,我们将计算给定数值的平均值。
步骤执行 AVG 函数
- 在本地机器上创建一个文本文件并插入元组列表。
$ nano evalavg.txt

- 检查插入到文本文件中的元组。
$ cat evalavg.txt

- 上传特定目录下 HDFS 上的文本文件。
$ hdfs dfs-put evalavg.txt /pigexample
- 开启猪 MapReduce 运行模式。
$ pig
- 加载包含数据的文件。
grunt> A = LOAD '/pigexample/evalavg.txt' USING PigStorage(',') AS (a1:chararray,a2:chararray,a3:float) ;
- 现在,执行并验证数据。
grunt> DUMP A;

- 让我们根据"a1"字段对数据进行分组。
grunt> B = GROUP A BY a1; grunt> DUMP B;

- 让我们返回给定数值的平均值。
grunt> Result = FOREACH B GENERATE A.a1, AVG(A.a3); grunt> DUMP Result;

在这里,我们得到了想要的输出。
下一章:Apache Pig CONCAT 函数
Apache Pig CONCAT 函数用于连接两个或多个表达式。表达式的生成结果必须具有相同的类型。但是,如果任何子表达式为空,则生成的表达式也为空。 CONCAT 函数示例在此示例中, ...
AI 中文社