吾本轻狂|误删节点或集群怎么办?这里有一颗后悔药

作者介绍
王海龙 , Rancher中国社区技术经理 , 负责Rancher中国技术社区的维护和运营 。 拥有6年的云计算领域经验 , 经历了OpenStack到Kubernetes的技术变革 , 无论底层操作系统Linux , 还是虚拟化KVM或是Docker容器技术都有丰富的运维和实践经验 。
在实际使用Rancher过程中 , 偶尔会因为误操作删除了SystemWorkload、节点或集群,导致集群状态异常而无法访问 。 如果用户不了解恢复方法 , 通常会重新添加节或重新搭建集群 。
本文将根据以下几个场景来介绍如何恢复由于误操作引起的Rancher集群故障:
如何恢复SystemProjectWorkload如何恢复从RancherUI或kubectl误删的节点如何恢复执行过清理节点脚本的节点如何恢复被删除的custom集群
通常情况下 , 通过RKE创建的custom集群应包括以下workload:
恢复cattle-cluster-agent和cattle-node-agent
模拟故障
从SystemProject下删除cattle-cluster-agent和cattle-node-agent
1.在RancherUI上创建APItoken(用户->API&Keys)并保存BearerToken
dockerrun--rm--net=host-v$(dockerinspectkubelet--format'{{range.Mounts}}{{ifeq.Destination"/etc/kubernetes