网站首页 > 技术文章 正文
今天想和大家分享一下,华三6800、6860、12500系列交换机的版本升级过程,如何降低对业务的影响,耗时最短,又应该从哪些方面做准备。
接下来分别从升级前、升级中、升级后进行描述。
升级时需要用到的相关命令
下列命令讲述的均是华三交换机的操作命令
//上传镜像
采用XSHELL的文件传输进行的,同时打开两个窗口,一个窗口是本地镜像文件所在目录,另一个是设备flash卡,然后进行拖拽即可。
//加载镜像
在<>模式下:boot-loader file flash:/文件名 all main
//打补丁
install activate patch flash:/文件名 all
//打完补丁,还有一步提交
install commit
//查看版本和补丁的命令
display install activate
display boot-loader
display irf
升级前
- 保存配置并收集详细设备配置信息。事前做好对应文件夹,文件夹名称可以以设备的管理地址去命名,或者是自己认为比较有效的方法去记录都可以,这样方便接下来的的配置对比,对设备的运行配置进行保存,然后再收集设备的相关配置基线,包括:设备版本、当前配置、设备序列号、风扇状态、电源状态、接口状态、接口IP地址、路由表、时钟、NTP、CPU和内存等相关信息进行收集。
- 制定升级计划和操作设备清单。包括制定出本次升级的设备列表、所在机房的物理位置、以及在操作中使用的命令、升级中验证时所要进行的对象目标检测地址信息等。要反复确认升级方案的可操作性。
- 上传版本镜像和补丁包。提前上传版本镜像和补丁包到设备flash卡中,上传方法可以选择FTP方式进行,也可以选择自己认为合适的方式进行传输,版本镜像和补丁通过本方法上传到flash卡中,为接下来的升级打好基础,节省时间。
- 加载新版本为下次重启后的版本。把上传后的镜像设置为下次重启后要启动的对象。
- 临时取消网管监控。如果有网管监控,要提前取消,如果不取消,在重启过程中会产生大量的告警日志,可在重启完成后再恢复网管监控。
- NSR协议启用。对启用了OSPF协议的设备,要在重启前配置NSR协议,NSR协议是不间断路由。
- 机房物理位置勘察。对计划要升级的设备所在机房物理位置进行实地查看,记录设备的物理位置、所在U位。
- IRF堆叠线和MAD检测线物理接口确认。在重启时需要拔插IRF线缆,所以要确认好线的物理接口,防止拔插错误引起生产事故。
升级中
- 单台独立设备的升级方法。可通过远程登录对设备版本引导新版本后,直接进行重启,重启过程中记录从开始重启到重启完成所消耗的时间,方便日后形成记录文档,便于以后参考使用。
- IRF堆叠设备的升级方法。IRF指的是2台物理设备通过相关配置后虚拟成逻辑一台设备的技术。IRF成员分别是slot 1和slot 2。
接下来是IRF堆叠设备的具体升级步骤
- shutdown slot 1设备的上下连端口(其中,不包括IRF和MAD接口),此时业务流量会切换至slot 2设备,保证业务不受影响。
- 重启slot 1设备,执行命令:reboot slot 1,特别注意的是,在重启时一定要有 slot 1,否则的话将会重启整机,这样会对业务造成中断。发出重启命令后,无需保存配置。
- 重启slot 1的过程中,拔掉IRF堆叠线。
- 在slot 1重启完成后,由于之前shutdown端口后没有保存,端口会重新启动恢复工作,此时由于MAD的检测机制,会使得成员id编号较小的设备端口置于active状态,相反,成员id编号较大的设备端口置于recover状态,也就是slot 1重新接管业务,slot 2主动成为recover状态。
- 重启slot 2设备,执行命令:reboot slot 2,在重启过程中,插入之前拔掉的IRF堆叠线。
- 待slot 2重启完成后,链路均恢复正常,此时的2台交换机版本也均一致,在通过短暂的恢复后,IRF会重新形成。
- 2台设备都升级完成后然后再进行打补丁。
在升级过程中,尤为注意的就是在执行重启命令时,一定要有成员编号,否则的话,2台设备会同时重启,此时将会影响正常业务。
如果升级的设备数量较多,可同时操作2对设备,并随时进行记录重启的设备时间,以便区分。
升级后
- 业务验证。在所有设备升级完成后,需要通知业务进行验证,以防没有及时验证影响到正常业务运行。
- 复盘升级过程。从头到尾梳理一下整个升级过程是否存在问题,是否可以得到改进。
- 及时形成记录文档。将整个升级过程及时形成记录,详细记录一下升级设备从上传镜像、补丁、加载镜像、设备重启、重启完成,这一系列操作所使用的时间。
- 团队沟通交流经验。可与团队人员进行沟通交流自己的升级步骤、升级中遇到的问题等。
升级时遇到的问题
- 在重启完一对IRF交换机做配置比对时发现,这2台设备的2个端口同时处于shutdown的状态,检查发现是连接某业务的服务器,随后检查交换机配置与重启前无误、然后又检查了光模块也是正常的,但是在检查光纤时,发现从服务器过来的线没有光,分析是触发服务器某些机制导致服务器重启,随后将这一问题反馈给相关团队进行跟踪排查。
- 也要做好应急预案。防止在升级时遇到无法启动的设备,做好备件支持。
总结
以上就是整个升级的过程分享,如果有说得不对的地方,欢迎留言讨论。
猜你喜欢
- 2025-06-04 虚拟平台ESXI主机的命令行操作指令
- 2025-06-04 小白必看!30 分钟精通 Linux 基础操作,从此告别命令行恐惧!
- 2025-06-04 利用阿里云99元服务器自建VPN网络实现RDP远控家里电脑
- 2025-06-04 基于Ubuntu16.04使用KVM实现Linux环境虚拟机化
- 2025-06-04 我只是关闭了远程连接,为什么服务也被杀掉了?
- 2025-06-04 Windows下常用的远程Linux连接工具
- 2025-06-04 「项目部署」使用Jenkins一键打包部署SpringBoot应用
- 2025-06-04 ubuntu安装nvm管理node(ubuntu安装nmcli)
- 2025-06-04 【OEC Turbo榨干计划】让 RK3566 起死回生!CasaOS 退退退!
- 2025-06-04 搭建自己的前端服务器环境—Node、MySQL、Git和Nginx等一网打尽
- 最近发表
-
- 使用这个新的 ECMAScript 运算符告别 Try/Catch!
- 抛弃 try-catch,错误处理的新方案
- 深圳尚学堂Java培训:总结java编程常用的快捷键(二)
- Try-catch speeding up my code?(speeding up)
- 能代替try catch处理异常的优雅方式
- Linux系统stress压力测试工具(linux自带的压力测试)
- ESL-通过事件控制FreeSWITCH(es事务控制)
- 谈JVM xmx, xms等内存相关参数合理性设置
- 嵌入式工程师竟然看不懂这些专业语句,那真别怪人说你菜
- 不会前端也能写官网?没问题,Devbox+Cursor 带你起飞
- 标签列表
-
- cmd/c (64)
- c++中::是什么意思 (83)
- 标签用于 (65)
- 主键只能有一个吗 (66)
- c#console.writeline不显示 (75)
- pythoncase语句 (81)
- es6includes (73)
- sqlset (64)
- windowsscripthost (67)
- apt-getinstall-y (86)
- node_modules怎么生成 (76)
- chromepost (65)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- & (66)
- java (73)
- js数组插入 (83)
- linux删除一个文件夹 (65)
- mac安装java (72)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)