实时

您的位置:首页>企业 >

环球热议:大数据Flink进阶(三):Flink核心特性

Flink核心特性

Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:

一、批流一体化

Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上,Flink在设计理念上没有刻意强调批处理和流处理,而更多的强调数据的有界和无界,这就意味着Flink能够满足企业业务需求,无需用两种甚至多种框架分别实现批处理和流处理,这大大降低了架构设计、开发、运维的复杂度,可以节省大量的人力成本。


(资料图片仅供参考)

二、同时支持高吞吐、低延迟、高性能

Flink是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。像Apache Spark也只能兼顾高吞吐和高性能特性,主要因为在SparkStreaming流式计算中无

法做到低延迟保障;而流式计算框架Apache Storm只能支持低延迟和高性能特性,但是无法满足高吞吐的要求。而满足高吞吐、低延迟、高性能这三个目标对分布式流式计算框架来说是非常重要的。

三、支持事件时间(Event Time)概念

在流式计算领域中,窗口计算的地位举足轻重,但目前大多数框架窗口计算采用的都是系统时间(Process Time),也是事件传输到计算框架处理时,系统主机的当前时间。Flink能够支持基于事件时间(Event Time)语义进行窗口计算,也就是使用事件产生的时间,这种基于事件驱动的机制使得事件即使乱序到达,流系统也能够计算出精确的结果,保持了事件原本产生时的时序性,尽可能避免网络传输或硬件系统的影响。

四、支持有状态计算

Flink在1.4版本中实现了状态管理,所谓状态就是在流式计算过程中将算子的中间结果数据保存在内存或者文件系统中,等下一个事件进入算子后可以从之前的状态中获取中间结果中计算当前的结果, 从而无须每次都基于全部的原始数据来统计结果,这种方式极大地提升了系统的性能,并降低了数据计算过程的资源消耗。对于数据量大且运算逻辑非常复杂的流式计算场景,有状态计算发挥了非常重要的作用。

五、支持高度灵活的窗口(Window)操作

在流处理应用中,数据是连续不断的,需要通过窗口的方式对流数据进行一定范围的聚合计算,例如统计在过去的1分钟内有多少用户点击某一网页,在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行再计算。Flink将窗口划分为基于Time、Count、Session,以及Data-driven等类型的窗口操作,窗口可以用灵活的触发条件定制化来达到对复杂的流传输模式的支持,用户可以定义不同的窗口触发机制来满足不同的需求。

六、基于轻量级分布式快照(Snapshot)实现的容错

Flink能够分布式运行在上千个节点上,将一个大型计算任务的流程拆解成小的计算过程,然后将task分布到并行节点上进行处理。在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的Checkpoints,将执行过程中的状态信息进行持久化存储,一旦任务出现异常停止,Flink就能够从Checkpoints中进行任务的自动恢复,以确保数据在处理过程中的一致性(Exactly-Once)。

七、基于JVM实现独立的内存管理

内存管理是所有计算框架需要重点考虑的部分,尤其对于计算量比较大的计算场景,数据在内存中该如何进行管理显得至关重要。针对内存管理,Flink实现了自身管理内存的机制,尽可能减少JVM GC 对系统的影响。另外,Flink通过序列化/反序列化方法将所有的数据对象转换成二进制在内存中存储,降低数据存储的大小的同时,能够更加有效地对内存空间进行利用,降低GC带来的性能下降或任务异常的风险,因此Flink较其他分布式处理的框架会显得更加稳定,不会因为JVM GC等问题而影响整个应用的运行。

八、Save Points (保存点)

对于7*24小时运行的流式应用,数据源源不断地接入,在一段时间内应用的终止有可能导致数据的丢失或者计算结果的不准确,例如进行集群版本的升级、停机运维操作等操作。值得一提的是, Flink通过Save Points技术将任务执行的快照保存在存储介质上,当任务重启的时候可以直接从事先保存的Save Points恢复原有的计算状态,使得任务继续按照停机之前的状态运行,Save Points技术可以让用户更好地管理和运维实时流式应用。

九、多层级API

Flink为用户提供了多个层级API,用户可以根据自身对于表达力和易用性的需求来选择,不同的API 层级可以混用以实现复杂的业务逻辑。

关键词:

推荐阅读
Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:

2023-03-19 07:11:15

1、黑翼之巢是一个40人高级RAID副本,位于黑石塔上层的顶端,是死亡之翼的长子,黑龙MM奥妮克希娅的兄长---奈法利安

2023-03-19 01:45:11

本文内容是由小编为大家搜集关于停牌股票一览,以及的资料,整理后发布的内容,让我们赶快一起来看一下吧!本文目录一览:1、2015年7月9日停牌

2023-03-18 21:09:36

1、这种方法是近两年常见的例子。这种诈骗方式的地点不限,可以在郊区,也可以在闹市区。传销人员会用他们给你的袋子(袋子里有

2023-03-18 17:54:27

本报青岛3月17日讯(记者刘成)近日,山东青岛市软件和信息服务产业链推介会在深圳举行,两地百余家企业机构相关负责人交流对接。主动“走出去

2023-03-18 14:02:19

1、其实干眼症最好的治疗方法就是治疗病因。2、干眼症可分为泪液不足型干眼症、泪膜不稳定型干眼症和睑板腺功能障碍型干眼症。

2023-03-18 11:03:05

想必这几天梅西缺席了大巴黎的训练大家也都知道了,大巴黎方面对外的表态相当模糊。也没有说梅西为什么缺席了训练以及梅西到底去了哪里。只能

2023-03-18 08:05:30

1、冰箱外部空气中的水蒸气凝结成的小水滴。2、夏天,空气温度较高,打开冰箱门,冰箱内外部温差较大使水蒸气凝结成小水滴,即看到的一股“白

2023-03-18 03:18:55

1、,你是我的巧克力,我是你的巧克力。见到你是多么美好,想你的时候感觉很无力。你说你不是我的唯一,但我想说,你其实是我的全世界。你必须

2023-03-17 22:53:26

1、忘了怎么爱你原唱:MP魔幻力量歌词:忘了亲吻拥抱就像忘了心跳忘了你的美好我才能忘了煎熬心碎忘了哭闹遗憾忘了计较

2023-03-17 19:59:44

1、地球同步转移轨道(GTO)是指近地点在1000公里以下、远地点为地球同步轨道高度(约36000公里)的椭圆轨道。2、

2023-03-17 17:57:05

1、  中耳炎属于一种耳部炎症,以下是小编整理的中耳炎的治疗方法有哪些?欢迎参考阅读!2、  中耳炎怎么办3、  中耳炎

2023-03-17 16:00:57

阿莱德(301419)03月17日在投资者关系平台上答复了投资者关心的问题。

2023-03-17 13:00:54

到2025年人均体育场地面积达2 8平方米(副题)人民日报石家庄3月16日电(记者马晨、邵玉姿)记者从河北省体育局获悉:今年河北省将加快推进更

2023-03-17 11:13:12

NBA常规赛,掘金客场119-100轻取活塞。本场比赛,前三节双方一直胶着,末节掘金持续发力,波普站出来连续两记三分帮助掘金锁定胜局。他全场15

2023-03-17 08:56:27

1、“羊羔跪乳”语出古训《增广贤文》,原文是“羊有跪乳之恩,鸦有反之义。2、”很早以前,一只母羊生了一只

2023-03-17 06:49:52

1、5公里,进出站轨道线路18条,总占地面积约4平方公里,东邻罗村大道,计划设计为10站台、北靠兴业路、3175万人,隶属广州铁路(集团)公司广

2023-03-17 01:53:53

澎湃新闻记者南博一  当地时间3月16日,韩国总统尹锡悦与日本首相岸田文雄在东京举行会谈,双方同意恢复“穿梭外交”,将加强两国间政治、经

2023-03-16 21:52:04

根据我国民事诉讼法规定,起诉状应当记明下列事项:(一)原告的姓名、性别、年龄、民族、职业、工作单位、住所、联系方式,法人

2023-03-16 19:12:19

证券代码:001896证券简称:豫能控股公告编号:临2023-16河南豫能控股股份有限公司关于2022年度第二期超短期

2023-03-16 17:06:51