阿里大牛4小时讲解,带你深入了解Flink,总计14G视频无偿分享!
前言
作为一个程序员大家都应该知道现在Flink里面是比较吃香的。Flink源的分布式流式处理框架不仅提供准确的结果,甚至在出现无序或者延迟加载的数据的情况下。Flink状态化的容错的,同时在维护一次完整的的应用状态时,能无缝修复错误。在大规模运行,在上千个节点运行时有很好的吞吐量和低延迟。
Flink简介
- Flink是一个针对流数据和批数据的分布式引擎,主要由 java 代码实现
- 运行速度比Spark更快,计算量越大,性能优势更明显
- 真正的流计算,就像Storm一样,同时也支持批处理
- 比Spark更轻量级的容错
- 支持 scala和 Java API
相比Flink、Spark、Storm
Flink生态圈
看到这张图可以看出
- 支持Java和Scala API
- 支持Table(SQL)
- 支持图操作(Flink Gelly)
- 支持机器学习(Flink ML)
- 支持将Flink程序部署到YARN
怎么学习Flink大纲
有很多的小白不知道怎么去学习Flink,走了不少的盲区,下面是小编整理的大纲,希望对大家有用!
Flink基本概念和编程模型
Flink程序的基础构建模块是流(streams)与转换(transformations),每一个数据流都起始于一个或多个source,并且终止于一个或多个sink。
时间窗口:
流上的聚合需要由窗口来划定范围,比如"计算过去的5分钟"或者"后的100个元素的和"。窗口通常被区分为不同的类型,比如滚动窗口(没有重叠),滑动窗口(有重叠),以及会话窗口(由不活动的间隙所打断)
如图:
Flink知识点
下面是小编整理的一些关于Flink的知识点,希望大家能够喜欢。
想要获取的小伙伴可以私信小编【学习】即可获取哦~~~
适合小白的入门新一代大数据计算引擎 Flink从入门到实战
相关文章