全部教程· 大数据和分析· Pig教程 · Pig FILTER

返回

Apache Pig FILTER 运算符

Apache Pig FILTER 运算符用于删除关系中的重复元组。最初，Pig 对给定的数据进行排序，然后消除重复项。

FILTER 运算符示例

在此示例中，我们消除了重复的元组。

执行 FILTER 运算符的步骤

在本地计算机上创建一个文本文件并为其提供一些值。

$ nano pfilter.txt

Apache Pig FILTER Operator

检查写入文本文件中的值。

$ cat pfilter.txt

Apache Pig FILTER Operator

上传特定目录下 HDFS 上的文本文件。

$ hdfs dfs-put pfilter.txt /pigexample

开启猪 MapReduce 运行模式。

$ pig

加载包含数据的文件。

grunt> A = LOAD '/pigexample/pfilter.txt' USING PigStorage(',') AS (a1:int,a2:int);

现在，执行并验证数据

grunt> DUMP A;

Apache Pig FILTER Operator

让我们执行 FILTER 运算符来消除重复的元组。

grunt> Result = FILTER A BY a2==8;

现在，执行并验证数据。

grunt> DUMP Result;

Apache Pig FILTER Operator

在这里，我们得到了想要的输出。

下一章：Apache Pig FOREACH运算符

Apache Pig FOREACH 运算符根据数据列生成数据转换。建议使用FILTER操作来处理数据元组。 FOREACH运算符示例在这个例子中，我们遍历存在于执行 FOR ...

上一章：Apache Pig DISTINCT 运算符

下一章：Apache Pig FOREACH运算符

小贴士

全部【编程教程】内容源自网络，仅供学习用途，若有遗漏或版权任何问题，请及时【联系我们】，按下 Ctrl+D 或 ⌘+D 收藏本站。

快速标题定位

FILTER 运算符示例

他人最近浏览

用户 7分前浏览了 [编程面试题集锦] 的 [Java实习生面试题的重点题集]
用户 1小时前浏览了 [Python3教程] 的 [Python3 SMTP发送邮件]
用户 1小时前浏览了 [美团技术架构] 的 [移动开发：美团外卖Android Lint代码检查实践]
用户 2小时前浏览了 [JDK下载] 的 [JDK8 下载]
用户 3小时前浏览了 [美团技术架构] 的 [即时配送的订单分配策略：从建模和优化]
用户 3小时前浏览了 [Python3教程] 的 [Python3 运算符]
用户 3小时前浏览了 [编程面试题集锦] 的 [Java高级工程师原理面试题分析]
用户 4小时前浏览了 [编程面试题集锦] 的 [Java易错点区分的面试题合集]
用户 5小时前浏览了 [美团技术架构] 的 [大众点评App的短视频耗电量优化实战]
用户 5小时前浏览了 [编程面试题集锦] 的 [Java面试题的基础知识点]

推荐 AI 小工具

^[新]Hi简历

Janitor AI 角色扮演聊天

CapCut剪映专业版

在问

xAI Grok

云雀大模型

抖音Dreamina – 免费

喵呜提示词助手

Midjourney提示词（咒语）生成器

LiblibAI·哩布哩布AI

反谱

TTS Online

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程 / 今日访问885人，当前在线43人，最高同时在线55人

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。