超融合虚拟化办公桌面测试实践
发布时间:2021-07-23 人浏览
摘要:随着超融合技术的发展,越来越多的企业开始采用超融合桌面云方案来提升办公效率。因此,为了加强管理,对超融合桌面系统的测试变得尤为重要。本文在某超融合设备的基础上,对该超融合桌面系统进行了较为全面的测试,从多个维度评估超融合桌面系统是否能够满足办公以及开发需求。
关键词:超融合桌面云;办公;测试;
1 背景
企业办公经历了PC到虚拟化的转变,且虚拟机技术在不断的发展进步,对于不同的应用场景,两者对比如表1所示[1],DaaS(桌面即服务)桌面云服务受互联网接入和带宽影响较大,同时考虑到虚拟化桌面的自主可控需要,所以DaaS不纳入本文讨论范围。
表1 PC和虚拟化应用场景对比
通过表1可知,PC机和虚拟化可满足不同场景的应用需求。但是,随着公司规模的增加,对安全、高可用、集中管理运维的要求越来越高。随着云计算及其应用研究的日益成熟,虚拟化技术也得到了迅猛发展[2],逐渐能够满足现代企业的办公需求,所以越来越多的企业选择了虚拟化作为办公桌面解决方案。
为了适应当前办公场景需求,桌面云已在各大企业广泛使用,具有安全、灵活以及可随时随地办公、方便运维管理等优点。目前,应用较多的桌面云系统一般采用服务器集群搭配集中式存储的传统架构。传统架构一方面扩展性较差,大规模扩容困难,另一方面系统复杂度较高,涉及多种设备兼容使用等问题,运维成本较高。另外,集中式存储价格较高,性能差异较大,安全风险也相对集中,因此传统架构桌面云普遍存在部署复杂度高、系统迁移困难、维护成本高、用户体验差等问题。为了解决传统桌面云的各种问题,降低建设和维护成本,提升性能和用户体验,超融合基础架构应运而生。超融合基础架构指在一套单元设备集成了多种资源和技术,包括计算、存储、网络等技术中的部分或全部资源整合集成为融合的统一的资源池。相对于传统的计算与存储分离架构有很多优势,以下将两种架构进行了对比,如表2所示。
表2 计算存储分离架构与超融合架构对比
从原有桌面云迁移到超融合桌面云会涉及到大量用户,而且涉及到公司安全生产等各个方面,这就需要对超融合系统进行测试,及早发现问题,为后续采购、部署、管理运维提供参考依据。
2 方案介绍
参考国家标准GBT 2500.10-2016《系统与软件工程-系统与软件质量要求和评价(SQuaRE)第10部分:系统与软件质量模型》[3],本文从功能性、性能效率、可靠性、易用性、维护性五个方面对超融合设备进行了评估测试,如表3所示。
表3 超融合系统测试模型
3 方案实施
3.1 测试环境
本文所有测试均在某国产超融合桌面系统中进行,测试环境网络架构图如图1所示,本次测试所用超融合系统由三台主机构成,每台主机以及虚拟桌面的主要配置如表4所示,内存分配如表5所以。
表4 主机、桌面CPU和内存配置
表5 主机内存分配
图1 超融合系统网络拓扑图
3.2 加压方案
对于超融合系统来说,用户是无法直接登录服务器进行操作的,只能在自己的桌面上进行操作,所以为了模拟正常工作中的情况,加压时不直接对服务器加压,而是对主机上的多台桌面同时进行加压,间接提高服务器的压力。
对于Windows而言,大批量机器加压有两个主要问题,一是同时操作多台Windows运行加压工具,二是能否控制加压时压力的大小。
对于第一个问题,经过调研实践,本文采用Jmeter5.1版本同时操作多台Windows机器,加压过程示意如图2所示。
图2 加压示意图
整个加压过程的步骤如下:
1、选一台虚拟桌面作为Controller控制节点,其余作为Agent加压节点,并建立Controller与Agent的通信。
2、在Controller节点启动Jmeter,并远程运行所有Agent上的加压脚本,通过脚本启动加压工具对每个虚拟桌面进行加压;每台虚拟桌面压力上升之后会间接提升服务器压力,达到对服务器加压效果。
3、根据不同压力大小,批量修改加压脚本,重复步骤1-2。
3.3 加压工具
3.3.1 CPU、内存加压
Windows中可以使用AIDA64 Extreme或者BurnIn Test对CPU或者内存加压。
AIDA64适用于单台机器加压,具有加压速度快、可持续加压的优点,但是有两个缺点:一是不方便控制压力大小,只能加压到100%;二是不方便通过脚本启动。
BurnIn Test加压速度比AIDA64要慢,但是有两个优点,一是可以通过脚本启动;二是可以通过配置文件设置压力大小、加压时间、加压循环次数,所以本文采用 BurnIntest(非专业版)进行内存和CPU加压。在Controller节点中通过Jmeter调用对应的加压脚本,便可以启动Agent中BurnIn Test对CPU或内存进行加压。
3.3.2 IO加压
为了方便控制IO压力的大小,在进行IO加压时采用多台桌面同时循环拷贝大文件的方法,文件大小固定,主要通过调节加压桌面的个数来调节主机IO压力的大小。所有桌面的拷贝工作也是通过Jmeter调用拷贝脚本完成。
4 测试结果分析
本节主要关注三个要点:一是超融合桌面的性能以及主机压力对桌面性能的影响;二是运维操作对桌面影响。
4.1 超融合桌面性能
4.1.1 正常压力下测试结果
图3表示每个测试项,超融合桌面比传统集中式桌面云性能提升的百分比。通过图3可知,超融合桌面云比传统集中式桌面云性能提升较大,有超过65%测试项性能提升超过50%。
图3 超融合桌面与传统集中式桌面云对比结果
4.1.2 CPU压力下测试结果
图4表示在不同CPU压力下,与正常压力相比,各项测试指标性能下降的百分比。
由图4可知,CPU压力对桌面性能影响较大。CPU压力在16-65%区间内,桌面性能下降较平缓,各测试项指标性能下降10-50%;当压力超过70%时,桌面性能急剧下降,各项指标性能下降70-992%,对用户体验产生严重影响。
图4 不同CPU压力下超融合桌面性能变化结果
本次用于测试的主机CPU性能较低,与市场主流CPU相差较大,后续对CPU为E5-2680v4的主机进行了相同的测试,发现当主机CPU压力超过90%时,桌面性能才会出现一定程度的下降,且最高降幅不超过250%;而本文所用主机,在CPU压力超过70%时,性能最高降幅超过了990%。
4.1.3 内存压力下测试结果
图5 不同内存压力下超融合桌面性能变化结果
图5表示在不同内存压力下,与正常压力相比,各项测试指标性能下降的百分比。由图5可知,内存压力对桌面性能影响较小,即使内存压力达到95%,各项指标性能下降也不超过20%。
4.2 运维操作对桌面的影响
本次测试主要针对高可用(HA)故障切换、启动风暴以及管理域预留内存修改。
通过测试发现,在这三种场景下,系统的IO性能会下降, HA故障切换以及启动风暴时间较短,之后系统IO会恢复正常,但是修改管理域预留内存对IO的影响是持续性的,管理域预留内存越低,系统IO性能下降越多,且当管理域预留内存设置为系统允许最低值时(本文为12.61G),出现一次持续50分钟左右的系统故障,严重影响使用。
5 测试实践总结
5.1 测试、使用总结
通过以上分析,可以总结出以下几点:
1、超融合桌面云性能要优于传统集中式存储桌面云性能,可以满足日常办公需求。
2、内存压力对桌面性能影响较小,这是因为每台桌面的内存是独占的,并不是动态分配的,所以主机内存压力对桌面使用影响较小。且超融合相关专家也建议不要使用内存复用策略,会降低桌面性能。可见,与传统PC相比,超融合系统在内存复用方面并没有优势。
3、超融合主机的CPU压力对桌面性能影响较大,所以在使用时要密切关注主机CPU压力,为了保证系统的性能,CPU复用比不宜过高。因此,CPU是限制集群桌面数量的主要因素。
4、本次主机可用于分配桌面的内存为370.7G,可分配内存占比为64%,可分配内存占比较低。如果按照满配内存购买,那么三台主机可分配内存占比将会达到82%左右,随着主机数量增加,可分配内存占比还会增加,因为管理组件消耗内存与主机数量不是线性关系。所以超融合集群主机数量越多,主机内存配置较大,内存利用率越高,性价比也就越高。
5、超融合虚拟桌面的单台成本较高。按照满足150台桌面估算,考虑到故障切换、单节点密度等因素,每台桌面的成本可控制在1万元左右,如果按照满足1500台桌面估算,每台桌面的成本可控制在8000元左右;随着桌面数的增加,单台桌面成本降低主要是因为一方面管理组件占用资源相对固定,另一方面单节点密度适当增加。如果要降低成本,可以考虑提高单节点密度,降低系统预留资源,但会影响系统性能。所以在选择时要均衡考虑成本、安全以及性能等因素。
5.2 实践总结
经过本次测试,在进行自主可控设备的测试时,有以下几点可供读者参考:
1、对设备、系统等的相关原理进行深入研究,了解哪些功能会对系统性能有影响、修改哪些参数会提高或者降低系统性能、哪些功能对业务影响较大等,在测试时应该重点关注。
2、对当前设备使用情况进行摸底,包括业务场景、使用人数、压力情况等,在测试新设备时尽量模拟当前使用场景,以测试新设备是否可以满足需求。
5.3 后续工作
由于时间以及条件的限制,有些工作本文没有涉及,主要包括:
1、本文用于测试的主机只有3台,实际情况主机集群的数量要多得多,所以对于大规模集群的情况本文没有涉及,希望以后能在正式部署之后重新进行测试,获取更加真实的测试结果,但是本文所提方案具有一定的普适性。
2、超融合系统不具备自动调整桌面资源的功能,为了提高资源的利用率,后续需要研究设计高效的云管平台,允许弹性基础设施根据监控阀值条件或者一些自定义事件触发自动调整资源配置等操作。
参考文献
[1] Michael Silver, Nathan Hill. Physical, Virtual and Cloud Desktops: Is a Hybird Approach Inevitable. Gartner, 27 September 2018 ID: G00357601.
[2] 刘永, 吴杰, 宁玉富. 高校虚拟化桌面实施研究[J]. 计算机技术与发展, 2016, 2:140-143.
[3] GBT 2500.10-2016系统与软件工程-系统与软件质量要求和评价(SQuaRE)第10部分:系统与软件质量模型.