编程那点事 编程那点事编程那点事

最新发布

容错机制以及事务语义详解

容错机制以及事务语义详解

容错机制的背景要理解Spark Streaming提供的容错机制,先回忆一下Spark RDD的基础容错语义:RDD,Ressilient Distributed Dataset,是不可变的、确定的、可重新计算的、分布式的数据集。每个RDD都会记住确定好的计算...

赞(0) Vben 大数据 阅读(2782)
部署、升级和监控应用程序

部署、升级和监控应用程序

部署应用程序有一个集群资源管理器,比如standalone模式下的Spark集群,Yarn模式下的Yarn集群等。打包应用程序为一个jar包,课程中一直都有演示。为executor配置充足的内存,因为Receiver接受到的数据,是要存储在Ex...

赞(0) Vben 大数据 阅读(2738)
Checkpoint机制

Checkpoint机制

概述每一个Spark Streaming应用,正常来说,都是要7 * 24小时运转的,这就是实时计算程序的特点。因为要持续不断的对数据进行计算。因此,对实时计算应用的要求,应该是必须要能够对与应用程序逻辑无关的失败,进行...

赞(0) Vben 大数据 阅读(3444)
缓存、持久化机制

缓存、持久化机制

与RDD类似,Spark Streaming也可以让开发人员手动控制,将数据流中的数据持久化到内存中。对DStream调用persist()方法,就可以让Spark Streaming自动将该数据流中的所有产生的RDD,都持久化到内存中。如果要对一个DS...

赞(0) Vben 大数据 阅读(3238)
DStream的transformation操作概述

DStream的transformation操作概述

TransformationMeaningmap对传入的每个元素,返回一个新的元素flatMap对传入的每个元素,返回一个或多个元素filter对传入的元素返回true或false,返回的false的元素被过滤掉union将两个DStream进行合并count返回元素...

赞(0) Vben 大数据 阅读(2357)

编程那点事 更专业 更方便

登录

找回密码

注册