TAG:SRE原则
下面是标题中包含该 TAG 关键词的相关文章。
-
SRE原则中文版:远程协作中的稳定性指南
在远程办公越来越普遍的今天,团队成员分散在不同城市甚至不同时区,系统的稳定性成了协作效率的关键。这时候,SRE(Site Reliability Engineering,站点可靠性工程)的原则开...
-
SRE原则中文版:让系统稳定运行的实战心法
你有没有遇到过这样的场景?半夜三点,手机突然疯狂震动,运维群里跳出一条消息:‘服务挂了!’大家手忙脚乱地爬起来查日志、重启服务,像极了厨房着火后拿水泼油锅。这种救火式运维,在很多团队里是家常便饭...
-
SRE原则书籍推荐:提升网络优化能力的实战指南
从运维到SRE:为什么需要读书很多做网络优化的同学,一开始都是从排查问题入手。比如凌晨被叫起来处理服务卡顿、接口超时、CDN加载慢。时间久了就会发现,光靠“救火”解决不了根本问...
-
SRE原则书籍推荐:运维进阶必读的几本好书
从救火到预防:SRE如何改变运维思维 刚接手公司官网那会儿,服务器一崩就手忙脚乱。凌晨三点爬起来重启服务成了家常便饭,直到有位老哥提醒我:你这不是在做运维,是在当消防员。后来才...
-
SRE原则书籍推荐:从入门到实战的必读书单
Google SRE工作模式的启蒙之作提到SRE(Site Reliability Engineering),很多人第一反应是谷歌那本《Site Reliability Eng...