kubernetes redis pod CrashLoopBackOff修复心得

精选原创

喵来个鱼 2019-01-18 22:12:32 博主文章分类：kubernetes ©著作权

文章标签 kubernetes k8s redis CrashLoopBackOff 文章分类 运维

©著作权归作者所有：来自51CTO博客作者喵来个鱼的原创作品，请联系作者获取转载授权，否则将追究法律责任

前言

实验环境的kubernetes服务器物理机突然断电，重启后helm 部署的harbor出现了启动故障，首先查看harbor 相关容器运行状态：

解决方法

前面两个CrashLoopBackOff的容器，可以的使用命令删除容器，就可以解决，关键的是redis 容器，删除是解决不了的。使用命令查看容器的日志。

[root@master ~]# kubectl logs hub-redis-master-0 Bad file format reading the append only file: make a backup of your AOF file, then use ./redis-check-aof --fix <filename>

简单理解：文件格式损坏，做个备份，使用命令修复。

** 关键问题是pod启动不起来，不能直接进去修复，所以关键问题还是让redis的容器启动起来，想让pod起来就必须不让容器加载之前的appendonly.aof文件，找到appendonly.aof重命名，让redis容器重新生成appendonly.aof。**

查找appendonly.aof

接着查看容器的描述：

# kubectl describe po hub-redis-master-0

可以获取到需要的信息：

/bitnami/redis/data #aof在容器上的路径 Volumes: #redis pod的pvc信息 redis-data: Type: PersistentVolumeClaim (a reference to a PersistentVolumeClaim in the same namespace) ClaimName: redis-data-hub-redis-master-0

确认redis 容器使用的 pv，获取pv的创建信息:

[root@master ~]# kubectl get pv | grep redis pv006 100Gi RWO Recycle Bound default/redis-data-hub-redis-master-0 [root@master ~]# kubectl describe pv pv006 Name: pv006 Labels: <none> Annotations: kubectl.kubernetes.io/last-applied-cOnfiguration={"apiVersion":"v1","kind":"PersistentVolume","metadata":{"annotations":{},"name":"pv006","namespace":""},"spec":{"accessModes":["ReadWriteOnce"],"capac... pv.kubernetes.io/bound-by-cOntroller=yes Finalizers: [kubernetes.io/pv-protection] StorageClass: Status: Bound Claim: default/redis-data-hub-redis-master-0 Reclaim Policy: Recycle Access Modes: RWO Capacity: 100Gi Node Affinity: <none> Message: Source: Type: NFS (an NFS mount that lasts the lifetime of a pod) Server: 192.168.2.4 Path: /volume1/harbor/nfs6 ReadOnly: false Events: <none>

这里可以找到nfs对应的路径，直接进入nfs服务器对应路径下重命名appendonly.aof，redis的pod就立即启动状态为running了，接下来就是修复appendonly.aof。

修复appendonly.aof

进入到容器：

[root@master ~]# kubectl exec -it hub-redis-master-0 bash I have no name!@hub-redis-master-0:/$ ls /bitnami/redis/data/ appendonly.aof appendonly.bak.aof dump.rdb

修复

redis-check-aof --fix /bitnami/redis/data/appendonly.bak.aof 0x 10f69: Expected prefix '*', got: ' AOF analyzed: size=10316900, ok_up_to=69481, diff=10247419 This will shrink the AOF from 10316900 bytes, with 10247419 bytes, to 69481 bytes Continue? [y/N]: y Successfully truncated AOF

现在就可以把正在使用的appendonly.aof 重命名，把修复后的aof命名为appendonly.aof ，删除容器，kubernetes自动重新创建redis容器，如果其它容器还是CrashLoopBackOff，这可能是redis没有启动导致的，redis修复好后，删除CrashLoopBackOff的容器，kubernetes自动重新建立就可以了。

上一篇：kubernetes之helm部署harbor

下一篇：kubernetes 部署 lnmp+discuz

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯