网站首页 > 技术文章 正文
软考架构师大数据知识点继续学习如下:
之前已经讲过Lambda架构,今天来说说Kappa架构
数据系统=数据+查询
Kappa不同于Lambda同时计算流计算和批计算并合视图,它只会通过流计算一条的数据链路计算并产生视图。本质上是通过改进Lambda架构中的Speed Layer,使它既能够进行实时数据处理,同时也有能力在业务逻辑更新的情况下重新处理以前处理过的历史数据。教程687页
Kappa架构原理:在Lambda的基础上进行了优化,删除了Batch Layer的架构,将数据通道以消息队列进行替代。Kappa架构分为实时层、服务层。
(1)实时层:核心功能是处理输入数据,生成实时视图。
具体是使用流式处理引擎逐条处理输入数据,生成实时视图。
架构实现方式是采用Apache Kafka回访数据,然后采用Flink或Spark Streaming进行处理。
(2)服务层:核心功能是使用实时视图中的结果数据集响应用户请求。
具体是使用数据湖中的存储作为服务层。
Kappa优点:教程688页
Kappa架构的优点在于将实时和离线代码统一起来,方便维护而且统一了数据口径的问题,避免了Lambda架构中与离线数据合并的问题,查询历史数据的时候只需要重放存储的历史数据即可。
Kappa缺点:教程688页
(1)消息中间件缓存的数据量和回溯数据有性能瓶颈。通常算法需要过去180天的数据,如果都存在消息中间件,无疑有非常大的压力。同时,一次性回溯订正180天级别的数据,对实时计算的资源消耗也非常大。
(2)在实时数据处理时,遇到大量不同的实时流进行关联时,非常依赖实时计算系统的能力,很可能因为数据流先后顺序问题,导致数据丢失。
(3)Kappa在抛弃了离线数据处理模块的时候,同时抛弃了离线计算更加稳定可靠的特点。
Lambda虽然保证了离线计算的稳定性,但双系统的维护成本高且两套代码带来后期运维困难。教程688页
考生一定要要掌握Kapp工作原理、架构图、实现技术、优缺点。
下次内容将对Lambda架构和Kappa架构多维度进行对比。
更多学习内容,可以关注软考课堂,欢迎交流
猜你喜欢
- 2025-06-15 文件格式及功能汇总(文件格式的作用)
- 2025-06-15 商品中心—1.B端建品和C端缓存的技术文档二
- 2025-06-15 普京:俄主张建立平等和安全不可分割的架构
- 2025-06-15 不愧是年薪八十万的总经理做的“企业组织架构”太实用了!
- 2025-06-15 我的概要设计模板(以图书管理系统为例)
- 2025-06-15 分销生态商城后台系统架构设计要点
- 2025-06-15 提升思维能力,从认识大脑的主观架构开始
- 2025-06-15 这套“组织架构与岗位说明书”方案!简直太牛了!企业都急需
- 2025-06-15 秒杀系统—1.架构设计和方案简介(秒杀架构图)
- 2025-06-15 公司股权架构设计与管理(公司股权架构基本理论)
- 最近发表
- 标签列表
-
- cmd/c (64)
- c++中::是什么意思 (83)
- 标签用于 (65)
- 主键只能有一个吗 (66)
- c#console.writeline不显示 (75)
- pythoncase语句 (81)
- es6includes (73)
- sqlset (64)
- windowsscripthost (67)
- apt-getinstall-y (86)
- node_modules怎么生成 (76)
- chromepost (65)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- & (66)
- java (73)
- js数组插入 (83)
- linux删除一个文件夹 (65)
- mac安装java (72)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)