总结在大规模 K8s 集群中踩过的坑和解决方案