通信世界网消息(CWW)近年来,低碳发展已上升为我国的国家战略,2022年党的二十大报告中再次强调了碳达峰、碳中和的重要性,各领域需持续拓展低能耗绿色发展之路。云计算作为促进能源效率提升和结构优化的关键技术,帮助企业实现“减排不减产、增收不增耗”的可持续发展目标,在企业“双碳”节能工作中起到重要作用。
作为IT资源的新型服务形式,云计算正加速成为各行业企业数字化转型与低碳发展的新引擎,不仅提高计算、存储、网络等资源利用率以及社会整体的算力利用率,而且大幅度降低二氧化碳排放量,推动社会资源效能全面提升,为传统企业软件架构变革、管理模式创新、业务生产增效带来新动力,加速企业业务数字化发展。
随着企业上云广度、深度持续拓展,业务云计算的成本投入与用云复杂程度不断增加,成本过高、效益不及预期等问题开始显现。如何节省上云和用云成本、提高使用效益,成为当前企业关注重点,企业工作中心逐渐从如何迁移上云转变为如何优化用云。
云资源浪费普遍存在,云成本优化成为必然
云计算使企业IT消费模型产生巨大变化,原有的成本管控模式不再适用于云计算环境,各类业务陆续上云导致企业成本管理难度不断提高,云资源浪费愈发严重。企业如何应对日益复杂的云环境,提升自身成本优化能力成为关键课题。
企业用云效果不佳,云计算价值释放不足
近年来,企业选择成本更低、更绿色的云计算代替传统IT基础设备,让生产效率、运维效率、能源效率最大化。虽然企业云计算采用率不断攀升,但是高采用率并没有对应高成功率,云计算使用成本和复杂程度均超出企业预期。企业上云用云成本过高、价值释放不足、管控难度大等问题日益显现。《中国云使用优化报告》数据显示,企业上云后成本不可控制是企业用云面临的最大挑战,且九成以上用云企业面临成本浪费问题。过高的成本导致云资源投入与产出收益不匹配,其中较为典型的是以工业为代表的传统行业。麦肯锡调查数据显示,74%的企业云转型未能获取预期价值,受访者认为,云技术比他们最初预期的更复杂。40%的受访者认为云资源成本超出了企业的预算,而云转型所带来的IT价值与预期价值却存在较大差距。
资源效益备受关注,成本优化进入新阶段
Flexera 《2023 年云现状调查报告》显示,云成本的管理取代了安全性话题,成为当下云使用者面临的首要问题。82% 的受访者面临的首个挑战是管理云计算支出,其中有71%的重度云用户将优先考虑优化云的现有使用情况(节省成本),79%的受访者要解决安全性问题,上云用云企业仍然面临平均约30%的成本浪费。面对远超预期的成本浪费;过去企业对于成本优化的需求主要集中在如何降低云计算成本开支与减少成本浪费。然而随着企业对于云计算的理解不断深入,他们逐渐意识到,应关注使用云资源后能为业务带来多少效益,而非单纯节省成本。
云资源效益是衡量企业上云用云成效的关键因素,即企业使用各种云资源为业务发展所带来的贡献度,或云资源投入与收益比。在企业用云过程中,云资源为上层业务提供支撑,云资源的使用与运营关乎着云平台整体效能水平以及云业务的敏捷性、创新性和安全性等。优化提升云资源效益,可以使云资源为业务提供更加优质的支持,是企业云计算价值充分释放的重要标志。企业成本优化也随之进入新阶段,从一味地追求降低业务云计算成本,转为在成本可控的保障下全方位提升云资源效益。
云改变企业IT成本模型,组织建设是云成本优化的关键保障
云计算重塑企业 IT 消费模型。云成本与传统 IT 固定成本不同,企业 IT 基础设施采购方式从原来的集中式重塑为分布式,且采购决策模式从原来的短期决策重塑为长期运营。企业 IT 成本管理由原来的前置评估重塑为后置监控,且成本类型由原来的固定成本CapEX重塑为“CapEX+OpEX”可变成本,这些变化需要企业优化调整组织结构以应对云成本的管控。一方面,企业需要建立云成本优化的长效运营机制,从原来的采购阶段延伸至战略、采购、上云、用云、持续运营等阶段,并循序渐进形成闭环;另一方面,云成本管理也从原先的IT预算制变为运营制。相应的,企业需要从人员组织、工具平台、流程制度等方面建立可持续的云成本优化体系。
企业云成本优化能力建设应贯穿用云全周期
成本优化贯穿业务上云用云全周期,各阶段采取对应策略实现闭环优化。从企业上云用云历程看,大致可以划分为战略、采购、上云、用云、持续运营等阶段。围绕成本问题,每个阶段的工作关注点不同,在各阶段实施对应的技术和管理手段能够帮助企业实现成本优化管理。战略阶段是决策云部署及技术选型的关键期,选择不同的云计算模式意味着不同的云成本构成,架构的选型也会很大程度影响成本优化管理方式方法。采购阶段解决如何采购云资源。云资源类型和计费方式种类繁多,根据业务特性选择合适的资源和付费方式,避免成本浪费是成本优化最直接的手段。上云阶段结合业务实际情况规划云上IT治理结构,提前设计并建设权限、审计、成本等方面管理体系,全面制定成本优化治理模型。用云阶段对云资源进行全面监控管理,对闲置、低效率情况进行及时处理,采取针对性优化措施。持续运行阶段建设成本长效运作机制,对各环节成本优化工作进行复盘,定期汇总分析历史数据,形成更加有效的优化策略并应用于各环节中,进行持续闭环的成本优化。
企业云成本优化能力建设须协同人员、工具和流程
企业需要从人员角色、工具平台、流程制度3方面建立可持续的云成本优化体系。
人员角色是云成本优化工作的关键抓手,成本优化需要企业业务、财务、技术等方面多个角色共同参与,打破原有“各管一段、各自为战”的传统IT管理方式,形成FinOps成本优化团队,各角色长期协同共同努力达到成本长期治理的目标。工具平台是云成本优化工作的重要手段,成本优化是个复杂且耗时的工作,例如账单的拆分、计费的管理,仅靠人工是无法使成本优化工作效率提升至较高水平的,需要将各项能力沉淀到工具中。流程机制是云成本优化工作的前提保障,面对云计算特殊的消费模式和运营模式,成本优化工作需要组织内部与流程机制进行对应。权限管控体系、资源申请流程、奖罚机制等优化流程机制能够确保在闭环环境下,优化策略可以在企业内部精确、高效运转。
云改变企业IT运行模式,资源提效是云成本优化的核心
当前,企业对自身云资源使用情况不够了解,相关人员通常关注云资源采购较多,对于上云后的如何用云、资源运营情况关注程度较低,造成资源使用效率低下、资源闲置、资源低效率运行,甚至大量计费资源未使用等现象普遍。在此背景下,提升云资源效益尤为重要,企业可从资源的规划、监控和使用3方面优化云资源,并通过云资源效益度量了解自身效益情况。
合理规划资源容量,配置弹性资源补给
根据业务特性选择合适的付费方式是成本优化最直接的方式。从付费层面来看,按照业务场景长期使用的稳定业务资源需求,通过选择成本较低的包年包月等方式来支撑负载。可以先使用低配置资源,观察评估运行资源负载后再升级配置,还可以将使用率低的资源降低配置或释放。如果业务有使用周期且有不同状态下的资源需求可以选择成本相对较高但使用时长更灵活的按量付费方式,如临时测试、弹性伸缩选择按量付费资源。按量付费资源采用停机不收费的模式,以保留数据并能快速启用。如需长期运行,可以更换预付费模式。可容错的业务可以通过成本非常低廉的“抢占式”来支撑。
此外,付费方式并不是一成不变的,企业应根据业务资源历史运行数据,及时调整资源类型。例如,针对CPU利用率一直较高的后付费类(按量计费)云服务器,如果其连续两个月使用时长产生的费用超过同规格预付费类(包年包月计费)费用,可以将计费模式更改为预付费。
企业可以通过组合使用多种类型资源节省成本。针对云成本的管理与优化,企业需要关注实例的收费模式。其中,云服务商实例定价模式通常有以下3种。
(1)按需:随用随启,根据运行的实例以按小时或按秒的方式计算容量并付费。
(2)预留:有一定的使用承诺(如1年或3年的使用承诺),与按需实例的定价相比,预留实例可提供大幅折扣(通常为按需实例的60%)。
(3)竞价:提供极端弹性和廉价的计算资源。其价格根据供需关系而变化,与按量付费实例的相比具有非常明显的价格优势(通常为按需实例的10%~20%)。
根据业务特性采用资源组合方式是重要的成本优化方式,组合付费是指企业利用云端弹性的优势配置自动伸缩功能,以实现按需购买实例和预留实例的组合使用,以应对业务变化引起的资源需求变化,从而获得最佳的成本效益。
构建资源监控体系,有效识别低效资源
在实际运行中,生产系统的底层资源运行情况才是资源利用率的真实反映。通过构建云资源监控体系,持续监控系统与资源对应的各项指标。一方面,需要监控各类云资源的使用情况,如监控云主机CPU使用率、内存使用率等指标,通过时间等维度配置策略。另一方面,需要有效划分闲置资源、低负载资源,如某类云主机从创建后,一直处于关机状态,此类云主机可判定为闲置资源,运维管理员可将云主机进行回收,释放对应的CPU、内存等资源,避免云资源浪费。
根据监控数据分析出存在优化空间的资源单元。根据持续周期的监控数据,平台可以评估可优化的费用空间,同时对于存在忙时及闲时流量特性的场景,可灵活组合多种计费方式资源以节省成本。例如,监控各业务使用云资源配额的情况,若出现配额闲置,管理员应当减少该租户部门的容量配额,将配额优先分配给处于瓶颈的业务,减少云平台配额的浪费。此外,在监控的基础上,企业可分析以往数据,有效预测云平台容量未来变化,提前预警提醒企业运维人员。
闲时资源自动缩容,闲置资源合理关停
负载访问有明显的周期规律类业务,闲时可以进行资源降配。很多业务的流量具备周期性规律,若是使用常备服务器支撑日常峰值流量,在非峰值时段服务器的利用率显然是不足的。对于此类业务,可以根据业务的实际流量定时扩缩容,以此大幅降低云上成本。
业务访问有明显闲时周期的业务通常可分为4类,一是开发、测试类系统,这类系统所用的按量付费资源,非工作时间自动启停。二是社交类业务系统,如微博、抖音等峰值流量出现在中午1点和晚上10点左右,可能达到日常流量的1.5倍甚至更多,可设置阈值自动调配资源。三是证券类业务系统,工作时间内有稳定的访问需求,工作时间外(例如晚间或者节假日)可对资源进行适度降配。四是运行在企业内部的软件系统,例如企业级套装软件ERP、客户关系管理系统CRM等,办公类系统节假日可以适度降低资源配置。
企业在云上的闲置资源关停通常有两种情况,一是过剩资源关停,当大部分资源的使用率或配额低于原本规划的范围,且合理使用时被定义为预留过剩,应降低预算配额,合理优化成本。二是遗留资源关停,通常是依赖关系不存在时的遗留资源,例如快照资源,依赖于其他资源生成数据,当其他资源不存在时,快照也无需存在,针对该类资源建议及时停止或删除。
企业云成本优化能力建设指导标准体系
标准规范和评价体系让企业云能力建设“有规可依”
当前企业云成本优化能力体系建设正处于初级阶段,尚无大规模落地经验,企业缺少相关环节的标准规范引领。企业云成本优化能力体系建设以及云成本优化相关的标准、成效评价体系成为新的关注方向。当前,中国信通院已经形成了覆盖云成本优化能力建设、云资源效益水平度量等全方位、多角度的标准和评估模型,并将持续研究企业云能力优化课题,完善企业在云成本、性能、安全、数据等领域的优化和治理标准体系,面向央国企等场景展开深入研究,形成多维度、完整的评估体系。
云成本优化能力建设标准规范和评价体系
云成本优化能力建设标准规范助力企业构建高质量、高效率的成本优化体系,标准既涵盖企业云成本优化领域能力建设、工具水平、服务质量,同时还提出企业事后云资源效益情况度量的一套方法,为企业云成本优化前期规划、中期执行、后期复盘全流程提供专业指导。
在能力建设方面,中国信息通信研究院研究发布了成本优化服务商、优化工具、成本优化能力成熟度等领域多项标准。成本优化服务商标准包括考察服务方成本优化咨询能力、工具服务能力、实施能力、培训赋能能力4方面,对服务方成本优化流程和质量进行规范性要求。成本优化工具标准针对原生成本优化工具和混合多云成本优化工具提出了场景化的能力要求,为企业选择成本优化工具提供重要依据。成本优化能力成熟度标准考察企业自身成本优化能力是否完备,从技术、流程、组织维度评价企业成本优化能力成熟度,引导企业正确规划未来成本优化建设方案。
在评价体系方面,中国信息通信研究院提出了企业云资源效益度量模型(Cloud CAPEX Efficiency Model ),依据《企业云资源效益度量模型》帮助企业分层次、分模块地评估衡量云计算使用成效,评估价值结果分为基础级、增强级、优秀级、卓越级和引领级5个级别,企业可选择IaaS模块、PaaS模块、业务应用模块等部分分别评估云计算价值成效,并获取相应水平等级证书。《企业云资源效益度量模型》通过定因、定则、定权、定级4个步骤,对企业业务云资源效益进行专业度量。资源效益定因是确定云资源效益涉及的所有因子,并按照通用行业因子与业务专属因子对其进行分类,根据因子之间关系,从成本、业务、安全3个方面出发,自上而下逐级细化效益因子。资源效益定则是确定各效益因子的量化规则,针对所有效益因子设定分级要求,将各类因子进行统一量化,从低到高根据业务云资源相关能力的深度、广度与相关产出的高低,设置量化规则。资源效益定权是确定效益因子在度量模型中的权重,通过AHP层次分析法,对资源效益因子进行权重赋值,结合通用权重与业务适应性权重生成的业务专属权重进行资源效益度量。资源效益定级是确定云资源效益度量最终等级,对业务效益因子进行统一评估、量化后,将结果与因子权重进行计算,最终得到资源效益等级。在整个效益度量过程中,企业可全方位诊断业务资源使用、效益、能力等情况,并了解分析自身资源使用问题或能力短板,为业务云资源优化策略的规划和更新提供数据支撑。
企业云优化发展展望
随着企业上云范围不断扩大、用云程度逐渐加深,企业上云用云进入了新周期,环境的变革引发了云优化领域发展新态势。一是云计算部署模式推陈出新,带动上云用云新需求。混合云、专有云等云计算部署模式逐渐成为主流,代替传统的单一部署模式,随之而来的是更加复杂的消费模型和运营体系,环境的变化为企业上云用云带来更多挑战,优化的需求也随之增加。二是企业用云行业属性显著,云优化治理应因地制宜。云计算在各个行业中的应用不断深化,上云用云的场景更加丰富多样,云优化治理需要根据场景需求进一步细化指标和要求。三是云优化产业合作持续加强,产品工具将日益完善。在产业政策的推动下,云计算技术在近年来得到快速发展,微服务、容器、资源运维等云计算技术将在未来继续升级,为企业上云用云优化提供更先进的手段,帮助企业进一步释放云计算价值。四是云优化标准体系逐步完善,规范并指导企业上云用云。随着越来越多的企业认识到云优化的重要性,优化标准体系也将逐步建设完善。标准为企业优化效果和优化服务质量提供基础保障,为优化能力建设和服务选择提供更加专业的指导。