Transformation | Meaning |
---|---|
map | 对传入的每个元素,返回一个新的元素 |
flatMap | 对传入的每个元素,返回一个或多个元素 |
filter | 对传入的元素返回true或false,返回的false的元素被过滤掉 |
union | 将两个DStream进行合并 |
count | 返回元素的个数 |
reduce | 对所有values进行聚合 |
countByValue | 对元素按照值进行分组,对每个组进行计数,最后返回<K, V>的格式 |
reduceByKey | 对key对应的values进行聚合 |
cogroup | 对两个DStream进行连接操作,一个key连接起来的两个RDD的数据,都会以Iterable<V>的形式,出现在一个Tuple中。 |
join | 对两个DStream进行join操作,每个连接起来的pair,作为新DStream的RDD的一个元素 |
transform | 对数据进行转换操作 |
updateStateByKey | 为每个key维护一份state,并进行更新(这个,我认为,是在普通的实时计算中,最有用的一种操作) |
window | 对滑动窗口数据执行操作(实时计算中最有特色的一种操作) |