课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
运维管理是每一个企业软件运维程序员都需要重点掌握的一个职业能力,而本文我们就通过案例分析来了解一下,软件应用运维管理都有哪些方法。
权限管理
权限管理的主要思路是进行应用分组,应用分组以角色进行权限区分,给予人相应的应用上的角色。我们给予应用Owner、开发、运维和安全等角色,对不同的角色予以不同的权限。这里所有的云资源都是通过标签挂载到相应的应用上,通过这样的一个权限管理,管理员不仅可以在人的维度上可以看到有权限的应用,也可以应用维度上看到有权限的人。
资源分组
基于阿里云的标签系统,运维系统支持资源按很多个维度分类,比如按部门、环境、Region等,运维系统给创建的资源打上相应的标签来方便业务方运进行资源的查找、管理和运维,通过标签管理的模式可以很好地对无序化的资源进行运维和监控、甚至是资源分账。
资源交付
对于资源交付来说,大的挑战是云上资源是多区域、多类型部署的。运维系统将常用场景抽象成本资源编排模板,通过模板一键按照一键按场景交付资源,通过模板这样的方式大幅提升了我们资源交付的效率,同时也降低了新资源的接入门槛。
运维管理
从运维工作类型来看,运维也是分层的。系统层面的补丁管理、安全扫描、安全防护等能力是一个平台的能力,是不需要业务方来关心,运维系统将这些能力抽象出来后提供统一的机制来管理。
监控告警
从信息源的角度分类,告警和监控可以分为资源监控、应用监控以及业务监控。运维系统实现了多种告警处理方式,通过与监控系统的集成将告警按分组联系人分发,比如短信、钉钉等信息;对于自动化的场景,对接了弹性伸缩和运维编排来触发自动操作,实现自动化运维工作,完成自动化闭环。
诊断和修复
随着使用的资源和业务越来越多,内部业务方关于ECS实例、网络等问题的咨询量逐渐增多,为了提升问题的解决效率。于是,我们利用历史数据形成了案例库、知识库,再加上专家经验,我们沉淀了诊断和修复的能力,通过一键诊断帮业务方快速定位具体问题。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。