网站首页 > 技术文章 正文
场景假设
比如你有一个kafka集群,在同一个vpc(私有网络)里面也即是在一个内网环境里,该kafka集群有3个broker,broker1、broker2和broker3。
kafka集群信息如下:
- broker1 IP: 192.168.xxx.1
- broker2 IP: 192.168.xxx.2
- broker3 IP: 192.168.xxx.3
kafka集群各个节点 server.properties配置
config/server-1.properties:
broker.id=1
listeners=PLAINTEXT://192.168.xxx.1:19092
config/server-2.properties:
broker.id=2
listeners=PLAINTEXT://192.168.xxx.2:19092
config/server-3.properties:
broker.id=3
listeners=PLAINTEXT://192.168.xxx.3:19092
- 现在希望通过配置vpc公网ip做端口转发(也可以通过nginx做端口转发),就可以通过外网访问了(但是实际用kafka客户端连接会报超时)
想通过vpc外的机器来访问kafka集群,也就想访问192.168.xxx.1:19092,192.168.xxx.2:19092,192.168.xxx.3:19092
在vpc上做端口转发,vpc公网ip为192.168.xxx.xx,并在相应防火墙打开对应端口(19092、19093、19093),比如:
192.168.xxx.xx:19092 -> 192.168.xxx.1:19092
192.168.xxx.xx:19093 -> 192.168.xxx.2:19092
192.168.xxx.xx:19094 -> 192.168.xxx.2:19092
测试
这时,如果你通过vpc的公网ip和对应端口连接私有网络(内网)内的kafka集群,192.168.xxx.xx:19092、192.168.xxx.xx:19093、192.168.xxx.xx:19094端口都是通的,但是访问kafka发送或消费消息时,会报网络超时,这是为什么呢?
kafka producer端(客户端)和server之间有个类似协商的阶段, server会把lkafka配置文件里listeners这里的地址直接返给producer,producer再发数据给这个listeners地址。
因为kafka客户端是主动发现集群地址的,当你通过192.168.xxx.xx:19092、192.168.xxx.xx:19093、192.168.xxx.xx:19094确实是连接到kafka集群了,kafka集群返回给你的ip列表是你listeners配置的,也就是
192.168.xxx.1:19092
192.168.xxx.2:19092
192.168.xxx.3:19092
客户端producer 在vpc这个私有网络以外,producer 端通过ip转发和端口都没有用,producer 和vpc对应的公网ip是通的,但是与vpc内私有网络不通,这就是访问kafka发送或消费消息时会报网络超时等等的本质原因。
解决
一种解决方式是客户端通过域名映射的方式。
1.kafka配置:
修改kafka集群服务端各个节点的server.properties配置,注意listeners之后的ip和端口配置
config/server-1.properties:
broker.id=1
listeners=PLAINTEXT://kafka-1:19092
config/server-2.properties:
broker.id=2
listeners=PLAINTEXT://kafka-2:19093
config/server-3.properties:
broker.id=3
listeners=PLAINTEXT://kafka-3:19094
kafka集群的各个节点在服务端配置hosts
cat /etc/hosts
192.168.xxx.1 kafka-1
192.168.xxx.2 kafka-2
192.168.xxx.3 kafka-3
2.vpc做端口映射
kafka-1 映射至 192.168.xxx.1:19092
kafka-2 映射至 192.168.xxx.2:19093
kafka-3 映射至 192.168.xxx.3:19094
3.客户端配置:
客户端在host文件中把kafka01、kafka02、kafka03都映射到公网地址。这个很关键,上面提到过客户端会获取到kafka配置的元数据 ,客户端会获取到 kafka-1、kafka-2、kafka-3 这3个hostname,之后生产或消费数据会直接通过这个地址访问。如果不把这三个hostname重新映射到公网IP,就不能成功生产或者消费数据。
#/etc/hosts
192.168.xxx.xx kafka01 kafka02 kafka03
客户端访问kafka集群时,获取的是kafka-1:19092,kafka-2:19093,kafka-3:19094,通过客户端配置的hosts映射,都转成了对应的外网的ip,因此就可以访问了。
注意:端口要一致,hosts映射只转ip。
猜你喜欢
- 2024-12-12 Kafka监控与指标解析-UnderReplicatedPartitions
- 2024-12-12 聊聊 Kafka: Consumer 源码解析之 ConsumerNetworkClient
- 2024-12-12 为什么Kafka依赖ZooKeeper?
- 2024-12-12 一款Kafka可视化Web界面管理工具:CMAK
- 2024-12-12 MongoDB 数据同步kafka
- 2024-12-12 kafka快速入门到精通
- 2024-12-12 SpringBoot集成Kafka+Kafka优化问题
- 2024-12-12 kafka consumer 配置详解
- 2024-12-12 kafka生产者配置详解
- 2024-12-12 Kafka两种集群详解和搭建教程
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (76)
- js判断是否是json字符串 (75)
- c语言min函数头文件 (77)
- asynccallback (87)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 无效的列索引 (74)