PySpark

PySpark 简介 PySpark 环境设置 PySpark SparkContext PySpark RDD PySpark 广播与累积器 PySpark SparkConf PySpark SparkFiles PySpark StorageLevel PySpark MLlib PySpark Serializers

Python语言· PySpark·PySpark Serializers

全部教程

PySpark Serializers

序列化用于Apache Spark的性能调优。通过网络发送或写入磁盘或持久存储在内存中的所有数据都应序列化。序列化在昂贵的操作中起着重要作用。

PySpark支持用于性能调优的自定义序列化程序。

PySpark支持以下两个序列化程序。

MarshalSerializer

使用Python的Marshal Serializer序列化对象。此序列化程序比PickleSerializer更快，但支持更少的数据类型。

class pyspark.MarshalSerializer

PickleSerializer

使用Python的Pickle Serializer序列化对象。此序列化程序几乎支持任何Python对象，但可能不如更专业的序列化程序快。

class pyspark.PickleSerializer

让我们看一下PySpark序列化的例子。在这里，我们使用MarshalSerializer序列化数据。

--------------------------------------serializing.py-------------------------------------
from pyspark.context import SparkContext
from pyspark.serializers import MarshalSerializer
sc = SparkContext("local", "serialization app", serializer = MarshalSerializer())
print(sc.parallelize(list(range(1000))).map(lambda x: 2 * x).take(10))
sc.stop()
--------------------------------------serializing.py-------------------------------------

Command - 命令如下：

$SPARK_HOME/bin/spark-submit serializing.py

输出 - 上述命令的输出：

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

小贴士

全部【编程教程】内容源自网络，仅供学习用途，若有遗漏或版权任何问题，请及时【联系我们】，按下 Ctrl+D 或 ⌘+D 收藏本站。

快速标题定位

MarshalSerializer
PickleSerializer

其他人浏览的

用户 8小时前浏览了 [美团技术架构] 的 [每天数百亿用户行为数据，美团点评怎么实现秒级转化分析？]
用户 8小时前浏览了 [Eclipse使用手册] 的 [Eclipse 运行程序]
用户 8小时前浏览了 [Photoshop] 的 [PS 图层的选择方法]
用户 8小时前浏览了 [Hive] 的 [Hive 内置运算符]
用户 8小时前浏览了 [并发编程] 的 [并发编程竞态条件]
用户 8小时前浏览了 [Vue2] 的 [Vue.js 组件自定义事件]
用户 8小时前浏览了 [Go语言高级编程] 的 [2.9 静态库和动态库]
用户 8小时前浏览了 [jQuery] 的 [jQuery 效果动画]
用户 8小时前浏览了 [Solidity] 的 [Solidity 教程]
用户 8小时前浏览了 [jQuery] 的 [获取设置 CSS 类]

推荐 AI 小工具

Janitor AI 角色扮演聊天

在问

抖音Dreamina – 免费

CapCut剪映专业版

Midjourney提示词（咒语）生成器

喵呜提示词助手

【图查查】图片版权查询神器

iThinkScene

TTS Online

新华妙笔AI

Vmake

火山写作

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程

Copyright © 2022-2026 aizws.net · 网站版本: v1.2.6·内部版本: v1.25.5· 页面加载耗时 0.00 毫秒·物理内存 79.0MB ·虚拟内存 1302.9MB

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。