找回密码
 立即注册
在数字化转型中,企业对存储系统的高效稳定性要求日益提高。然而,分布式存储在复杂硬件环境下面临的硬盘亚健康问题,成为影响业务连续性和稳定性的“隐形杀手”。
深信服推出的aSAN硬盘软隔离技术,通过创新的软隔离框架,有效解决了这一难题,为存储系统的稳定性带来了革命性突破。
硬盘亚健康业务稳定的“隐形杀手”
分布式存储系统通常采用多副本数据写入的强一致性算法,所有副本写入完成后才会返回应用。然而,当硬盘、主机等组件出现亚健康状态(如磁盘IO响应从10ms增至100ms以上),会导致写IO卡顿,严重影响业务性能,甚至引发大规模业务中断。尤其在信创背景下,硬件故障率上升,亚健康问题更加突出。
当前,传统解决方案通过带外检测将亚健康硬盘转换为故障状态,虽然能维持业务连续性,但存在两大缺陷:一是亚健康状态可能恢复正常,二是将亚健康等同于故障处理会加速硬件损耗,增加维护成本。
为有效解决上述问题,业界提出了一种改进思路 —— 业务联动的软隔离框架。该框架首先会定时监测硬盘状态的时延、IOPS等指标。当硬盘状态达到特定阈值时,认定其出现卡慢,随即启动一系列处置动作。
这一改进方案虽有进步,但仍存在有待优化之处:
时效性差:副本一致性检测需要列出硬盘上所有分片,从出现卡盘现象到最终完成硬盘隔离,至少需要数分钟时间,可能已经严重影响业务连续性。
影响范围大:卡慢盘上少数几个分片不一致就会导致整个盘无法隔离,业务持续中断。
无法精准识别:该框架仅对硬盘侧进行检测,容易漏判、误判。
aSAN 硬盘软隔离重塑存储故障应对新范式
深信服推出的aSAN 硬盘软隔离方案,具备业务联动故障感知、启发式故障诊断、失效组件精准静默等强大功能,有效避免单点问题对业务连续性的影响。
软隔离框架架构,双管齐下保障存储稳定
aSAN软隔离框架以物理虚拟存储卷为管理单元,分为两部分:
存储客户端数据面:通过数据副本亚健康感知技术,保障数据副本可用,秒级时间内临时隔离亚健康副本,并快速上报故障信息,确保业务不受影响。
软隔离框架控制面:以故障处置中心(DFC)为核心,收集各故障处置节点进程(DFN)插件上报的故障信息。综合分析上报数据,精准诊断,避免误报。对于短时可恢复的故障,恢复后重新启用亚健康副本,避免数据长时间少副本运行;对于长时不恢复的故障,则彻底隔离并重建故障数据副本,保障数据可靠性。

ChMkLWiRtzuIAFEeAAD_NM26rsIAACGKQOMIS8AAP9M363.jpg

ChMkLWiRtzuIAFEeAAD_NM26rsIAACGKQOMIS8AAP9M363.jpg


aSAN 硬盘软隔离框架架构
应用层软件隔离新突破,摒弃硬件拔盘传统操作
相比业界主流的硬件拔盘和业务联动软隔离方案,深信服aSAN 软隔离框架全面采用纯软件隔离机制,摒弃硬件拔盘操作,规避了不同品牌硬件兼容性问题,提升了方案的通用性和稳定性。
同时,DFN提供故障插件接口,集成了数据面客户端插件和卡慢盘检测插件,扩展故障处理能力,实现精准处置。
总之,深信服 aSAN 硬盘软隔离方案在架构设计和应用层面都展现出了创新性和实用性,为分布式存储系统的故障处理提供了创新思路。那么实际效果如何?我们将通过两组对比数据来看看!
实测见真章aSAN性能全面领先
1.与VMware卡慢盘测试对比
我们将从磁盘卡IO检测、磁盘慢IO检测、RAID卡慢故障检测、磁盘卡慢故障重建、磁盘卡慢故障业务IO的五个方面,与VMware进行严格测试对比和实际应用验证。

ChMkLWiRtzuIO8FBAAOYzdsOMloAACGKQONIHsAA5jl050.jpg

ChMkLWiRtzuIO8FBAAOYzdsOMloAACGKQONIHsAA5jl050.jpg


与VMware卡慢盘测试对比
在与VMware vSAN处理磁盘卡慢盘的测试对比中,我们发现深信服aSAN硬盘软隔离方案性能更卓越,监测机制更完善。
2.与某厂商的软隔离方案对比

ChMkLWiRtzuIb1VDAAFBaaPT6zgAACGKQOK364AAUGB081.jpg

ChMkLWiRtzuIb1VDAAFBaaPT6zgAACGKQOK364AAUGB081.jpg


与某厂商软隔离整体方案效果对比
通过与某厂商软隔离整体方案对比发现:
在处置方案上,深信服aSAN硬盘软隔离方案基于智能IO分析的多级隔离策略,隔离粒度更细,处置效果更精准。某厂商则只能进行硬盘级隔离。
在检测点上,深信服aSAN硬盘软隔离方案采用嵌入式监测,针对存储客户每个 IO 进行监测,颗粒度更细,指标维度更多,误判风险更低;而某厂商则采用带外监测,通过 iostat 监测硬盘,虽然工作量小,但效果不佳。
总之,深信服 aSAN 硬盘软隔离方案凭借精准高效的检测、智能灵活的策略以及全场景的应对能力,为业务的稳定运行提供了强有力的保障,是企业存储系统的可靠选择。
实践落地aSAN 赋能 MES稳定性飞跃,运维成本降低
“以我们公司的MES(Manufacturing Execution System,制造执行系统)为例。以前常常因为硬盘亚健康问题导致MES 系统响应速度急剧下降。生产调度、物料管理、质量监控各环节均受到影响,每月经济损失数十万元,运维还耗时耗力,严重影响了我们公司的正常生产运营。”——某制造业企业高管
在引入深信服aSAN 硬盘软隔离方案后,MES系统稳定性得到显著提升:
1. 快速响应:15秒完成HDD 硬盘低频卡顿状况,快速恢复业务正常。
2. 持续稳定:半年内多次应对亚健康问题,均将业务中断时间控制在极短范围内。
3.提升效率:MES系统运行稳定高效,生产调度更及时准确,物料管理效率大幅提高,质量监控实时有效,产品次品率显著降。
当然,IT 运维团队也能从繁琐的硬件故障排查中解脱出来,将更多精力专注于内部IT系统功能优化和用户体验提升,为企业的数字化转型和生产效率提升注入了新活力。
深信服aSAN 硬盘软隔离方案的创新,源于研发团队在存储领域多年自研技术的沉淀和持续创新。未来,深信服将继续秉持技术领先的理念,为用户提供更优质可靠的存储方案,助力企业在数字化浪潮中稳健前行。
分享至 : QQ空间
收藏

21 个回复

倒序浏览
路过
回复 使用道具 举报
顶了
回复 使用道具 举报
楼上的回复很有深度,让我对这个话题有了更深入的了解。
回复 使用道具 举报
这个话题很有深度,值得进一步探讨。
回复 使用道具 举报
观点明确,支持一下。
回复 使用道具 举报
感谢楼主,干货不断。
回复 使用道具 举报
看了这个帖子,感觉自己的知识储备又增加了。
回复 使用道具 举报
这个观点我之前没有想到过,感谢楼主提供了新的视角。
回复 使用道具 举报
感谢楼主,受益匪浅。
回复 使用道具 举报
123下一页
您需要登录后才可以回帖 登录 | 立即注册