SRE承担的职责:可用性改进,延迟优化,性能优化,效率优化,变更管理,监控,紧急事务处理,容量规划与管理
工作内容:开发监控系统,规划容量,处理紧急事件,确保事故根源被跟踪修复
核心方法论:
确保长期关注研发工作
将运维工作限制在50%以内
2021-05-01