封面
版权信息
内容简介
推荐序1
推荐序2
推荐序3
推荐序4
赞誉
前言
第1章 互联网软件可靠性概论
1.1 为什么要研究互联网软件可靠性工程
1.2 什么是可靠性工程
1.3 软件可靠性工程
1.4 互联网软件的可靠性
1.5 互联网软件可靠性工程的工作思路
1.6 本章小结
第2章 互联网软件可靠性工程及可靠性度量
2.1 软件生命周期的可靠性工作
2.2 故障生命周期的可靠性工作
2.3 可靠性工程6种能力综述
2.4 互联网软件可靠性度量与评价
2.5 本章小结
第3章 互联网软件可靠性设计与分析
3.1 为什么要进行可靠性设计
3.2 可靠性设计原则与通用方法
3.3 软件可靠性架构模型
3.4 可靠性分析与架构风险
3.5 可靠性分配
3.6 架构分层设计及其可靠性方法
3.7 架构可靠性评审
3.8 可靠性预计
3.9 本章小结
第4章 可靠性观测能力建设与实践
4.1 建设观测能力的目的
4.2 排查、监控、观测技术的发展
4.3 监控观测的感知场景与感知方式
4.4 观测能力设计
4.5 观测能力要求与度量
4.6 观测能力建设实践
4.7 本章小结
第5章 故障修复、综合保障能力建设与实践
5.1 软件故障修复能力概述
5.2 软件故障修复能力设计与建设
5.3 运维保障能力
5.4 修复能力的度量和要求
5.5 修复能力及保障能力建设实践
5.6 本章小结
第6章 可靠性试验与反脆弱能力建设与实践
6.1 互联网软件可靠性试验与反脆弱能力概述
6.2 软件系统的脆弱性因素分析
6.3 反脆弱能力建设与分析
6.4 可靠性试验与反脆弱能力的要求
6.5 实践案例
6.6 本章小结
第7章 可靠性管理能力
7.1 可靠性管理工作概述
7.2 软件可靠性工作规划及目标管理
7.3 故障治理
7.4 人员与团队管理
7.5 以SRE方式运维业务
7.6 本章小结
作者简介
封底
更新时间:2023-02-23 16:25:44