网站首页 > 技术文章 正文
软考架构师大数据知识点继续学习如下:
之前已经讲过Lambda架构,今天来说说Kappa架构
数据系统=数据+查询
Kappa不同于Lambda同时计算流计算和批计算并合视图,它只会通过流计算一条的数据链路计算并产生视图。本质上是通过改进Lambda架构中的Speed Layer,使它既能够进行实时数据处理,同时也有能力在业务逻辑更新的情况下重新处理以前处理过的历史数据。教程687页
Kappa架构原理:在Lambda的基础上进行了优化,删除了Batch Layer的架构,将数据通道以消息队列进行替代。Kappa架构分为实时层、服务层。
(1)实时层:核心功能是处理输入数据,生成实时视图。
具体是使用流式处理引擎逐条处理输入数据,生成实时视图。
架构实现方式是采用Apache Kafka回访数据,然后采用Flink或Spark Streaming进行处理。
(2)服务层:核心功能是使用实时视图中的结果数据集响应用户请求。
具体是使用数据湖中的存储作为服务层。
Kappa优点:教程688页
Kappa架构的优点在于将实时和离线代码统一起来,方便维护而且统一了数据口径的问题,避免了Lambda架构中与离线数据合并的问题,查询历史数据的时候只需要重放存储的历史数据即可。
Kappa缺点:教程688页
(1)消息中间件缓存的数据量和回溯数据有性能瓶颈。通常算法需要过去180天的数据,如果都存在消息中间件,无疑有非常大的压力。同时,一次性回溯订正180天级别的数据,对实时计算的资源消耗也非常大。
(2)在实时数据处理时,遇到大量不同的实时流进行关联时,非常依赖实时计算系统的能力,很可能因为数据流先后顺序问题,导致数据丢失。
(3)Kappa在抛弃了离线数据处理模块的时候,同时抛弃了离线计算更加稳定可靠的特点。
Lambda虽然保证了离线计算的稳定性,但双系统的维护成本高且两套代码带来后期运维困难。教程688页
考生一定要要掌握Kapp工作原理、架构图、实现技术、优缺点。
下次内容将对Lambda架构和Kappa架构多维度进行对比。
更多学习内容,可以关注软考课堂,欢迎交流
猜你喜欢
- 2025-09-04 单体架构回潮:企业为何不再纠结技术焦虑
- 2025-09-04 Spring Boot 3 中 Jar 的运行原理及解压后文件含义
- 2025-09-04 互联网运维必知!最新技术架构全解析
- 2025-09-04 Injob in产品实践:Agent 效果差?先别怪模型——可能是你的“上下文”被污染了
- 2025-09-04 从微服务到单体:究竟是什么让架构走“回头路”?
- 2025-09-04 股份有限公司的分权与制衡_股份有限公司怎么分股权
- 2025-09-04 拆解Power'by必经之路:安托规划-治理-开发-服务四层架构全揭秘
- 2025-09-04 中小型企业适合实现微服务架构吗?
- 2025-09-04 30年架构师谈25时代IT行业入行:选择适合你的技术路径与职业规划
- 2025-09-04 Agent杂谈:Agent的能力上下限及「Agent构建」核心技术栈调研分享~
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (77)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)