全部教程· 大数据和分析· Pig教程 · Pig Group

返回

Apache Pig Group Operator

Apache Pig GROUP 运算符用于将数据分组为一个或多个关系。它将包含相似组键的元组分组。如果组键有多个字段，则将其视为元组，否则将与组键的类型相同。结果，它提供了一个每组包含一个元组的关系。

组运算符示例

在此示例中，我们将给定的数据分组姓氏的。

执行Group Operator的步骤

在您的本地机器上创建一个文本文件并在其中写入一些文本。

$ nano piginput2.txt

Apache Pig Group Operator

检查 piginput2.txt 文件中写入的文本。

$ cat piginput2.txt

Apache Pig Group Operator

上传 HDFS 上指定目录下的 piginput2.txt 文件。

 $ hdfs dfs-put /home/codegyani/piginput2.txt /pigexample

Apache Pig Group Operator

开启猪 MapReduce 运行模式。

$ pig

将数据加载到包中。

grunt> A = LOAD '/pigexample/piginput2.txt' USING PigStorage(',') AS (fname:chararray,l_name:chararray,id:int);

现在执行并验证数据。

grunt> DUMP A;

Apache Pig Group Operator

让我们根据 l_name 对数据进行分组。

grunt> groupbylname = group A by l_name ;

现在，执行并验证数据。

grunt> DUMP groupbylname;

Apache Pig Group Operator

在这里，我们得到了想要的输出。

下一章：Apache Pig LIMIT 运算符

Apache Pig LIMIT 运算符用于限制输出元组的数量。但是，如果指定输出元组的限制等于或大于存在的元组数，则返回关系中的所有元组。 LIMIT 运算符示例在这个例子中，我们只返回 ...

上一章：Apache Pig FOREACH运算符

下一章：Apache Pig LIMIT 运算符

小贴士

全部【编程教程】内容源自网络，仅供学习用途，若有遗漏或版权任何问题，请及时【联系我们】，按下 Ctrl+D 或 ⌘+D 收藏本站。

快速标题定位

组运算符示例

他人最近浏览

用户 8分前浏览了 [编程面试题集锦] 的 [Java实习生面试题的重点题集]
用户 1小时前浏览了 [Python3教程] 的 [Python3 SMTP发送邮件]
用户 1小时前浏览了 [美团技术架构] 的 [移动开发：美团外卖Android Lint代码检查实践]
用户 2小时前浏览了 [JDK下载] 的 [JDK8 下载]
用户 3小时前浏览了 [美团技术架构] 的 [即时配送的订单分配策略：从建模和优化]
用户 3小时前浏览了 [Python3教程] 的 [Python3 运算符]
用户 3小时前浏览了 [编程面试题集锦] 的 [Java高级工程师原理面试题分析]
用户 4小时前浏览了 [编程面试题集锦] 的 [Java易错点区分的面试题合集]
用户 5小时前浏览了 [美团技术架构] 的 [大众点评App的短视频耗电量优化实战]
用户 5小时前浏览了 [编程面试题集锦] 的 [Java面试题的基础知识点]

推荐 AI 小工具

^[新]Hi简历

Janitor AI 角色扮演聊天

CapCut剪映专业版

在问

xAI Grok

云雀大模型

抖音Dreamina – 免费

喵呜提示词助手

Midjourney提示词（咒语）生成器

LiblibAI·哩布哩布AI

反谱

TTS Online

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程 / 今日访问885人，当前在线43人，最高同时在线55人

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。