1、运维工作是比较繁琐的,尤其是新系统上线的场景,一切都是从零开始。包括虚机的创建,主机名的修改,系统的初始化等等。

2、在机器不多的情况下人工还能应付的过来,如果有上百台机器呢?最初也是用堆人的方法来做的。但这样的方式出错率高,而且有时还会有遗漏。

3、只能通过相互检查的方式来验证,但这样就会花费更多的时间,相应的时间/人工成本也会上升。人工的方式因个人部署习惯千差万别,导致一些项目难以维护。

4、运维自动化的演进,初始阶段,没有专门的工具为我们做这些繁琐重复的事情,主要使用脚本语言(Python)。

5、逐渐有了运维自动化的一些工具,比如Fabric 、Puppet、Chef、SaltStack、Ansible等,可以提供更高效的支撑。

6、在此基础上,开始逐步建设和完善自动化运维平台,通过将脚本、工具、经验整合到统一的平台上,让运维变得更加自动化。

7、运维自动化的目标:某某组件坏了可以不用管继续睡觉;出现异常时点击一下就可立即恢复;与监控配合,系统挂了可以自动恢复。
