我碰到一个业务场景,在tx云上几台轻量级服务器做k8s,然后statefulset跑mysql,
Scaling and Upgrade Policy设为ondelete。结果一台机器负载过高失去响应了,被踢出
集群,mysql切换到另一个节点。但实际上那台失去响应的服务器上pod还在工作,然后
mysql两个节点都访问同一个pvc,挂了。
而在之前物理机的ha场景里,是需要配置stonith的,也就是一个节点脱离集群,是需要
给他自动掉电或重启的,这样保证两个节点上的mysql不会同时访问共享存储,避免这种
同时读写带来的数据破坏。
k8s现在还没有stonith的机制,所以有共享数据的数据库服务其实很危险
--
FROM 120.229.207.*