业界首个《分布式融合存储研究报告》发布,打造智算时代新存储底座
创始人
2025-07-07 22:11:40
0

2023年11月30日,中国电子技术标准化研究院、存储产业技术创新战略联盟联合华中科技大学、中山大学、之江实验室、浪潮信息、天翼云等20多家学研机构、企业和用户代表,共同撰写的业界首个《分布式融合存储研究报告》(以下简称:《报告》)正式发布。《报告》首次系统梳理并深入分析了分布式融合存储的概念、技术架构和应用场景,为融合存储产业发展提供参考和指引。

中国电子技术标准化研究院领导表示,“数据成为重要的生产要素,数据存储和数据管理在信息技术变革中的作用更加显著。分布式融合存储作为存储新技术,在数据存储领域将会发挥更大作用。”

中国计算机行业协会信息存储与安全专委会会长、华中科技大学教授谢长生表示,“存储作为数字技术底座之一,既得到空前发展也面临巨大挑战,分布式融合存储就是迎接这种挑战的关键技术,该报告汇聚了学术界、产业界和用户的集体智慧和经验,描述了一副全景视图。”

《分布式融合存储研究报告》

分布式融合存储将成为智算时代的数据基石

中国工程院院士、清华大学教授郑纬民指出,“数字化和智能化催生数据量爆炸式增长,分布式融合存储技术的出现,不仅可以提供数据存储的效率和安全性,还可以实现数据的动态管理和智能优化,为各种应用场景提供更加全面和可靠的数据支持。”

《报告》指出,相较于传统的分布式存储技术,分布式融合存储是在传统的分布式存储架构的基础上,实现了同一存储集群同时提供多种存储服务,并且在非结构化数据协议间实现了协议融合、数据融合互通的存储技术,其能够提供跨模式/格式数据共享互通的能力,并支持块、文件、对象、大数据多协议接入以及多协议关联统一管理,满足多应用跨不同协议实现高效的数据互通访问。

该报告明确了分布式融合存储的四大关键技术:统一存储池,保证数据能够均衡地分布在各个存储节点中,支持存储池的横向扩展,以及数据自动修复能力;存储服务融合,在一套存储系统中同时提供文件、对象、大数据和块存储服务,同时具备丰富的多协议支持能力;数据管理融合,采用统一的非结构化数据和元数据管理架构,保证各协议的原生访问;存储协议融合,支持NFS、CIFS、HDFS、S3等非结构化数据协议的融合互通,保证了各种协议共享同一份数据和元数据。分布式融合存储通过对底层硬件资源进行高通用性且细粒度的管理,可极大地缓解智算时代数据急剧增长所导致的存储资源紧张问题。

分布式融合存储架构

为五大典型场景提供强大存力支撑

分布式融合存储在海量多源异构数据处理和“通信、感知、计算”一体化的边缘场景方面提供了强有力的存力支撑,使其能够满足不同场景对于存储的需求,为当前的数字化转型时代提供了高效、多维、贯通和定制化的生产要素,让数据驱动向全场景渗透。

《报告》总结了分布式融合存储的五大典型应用场景:

● 以自动驾驶为代表的深度学习场景:自动驾驶场景中数据量比较大,并且数据类型复杂。在整个数据生命周期中,根据不同阶段的应用,需要使用不同的协议。而分布式融合存储则实现多协议互访互通,并具备极致聚合性能,能够满足数据采集、数据标注、模型训练对于存储带宽、小文件处理、存储 IO 等方面的要求,使业务流程更加简洁高效;

● 以 AI/AIGC 为代表的大模型应用场景:模型的训练是AI开发的核心,这要求存储系统提供高带宽和高并发性能。分布式融合存储可避免因访问协议不同造成的数据拷贝,并提供海量多源数据、高性能、低延迟的存储基础设施,为AI应用的训练和推理提供强大存储能力的支撑;

● 以湖仓一体为代表的数据智能应用场景:湖仓一体的架构,数据来源多种多样,面向的服务和存储协议多种多样,所以融合存储是必然趋势。分布式融合存储为该场景提供了更高的计算扩展性,可为各类计算引擎同时提供存储需求,并实现协同合作和数据共享;

● 金融风控场景:金融风控场景的特殊性意味着,其对于存储系统的可用性、数据一致性、可扩展性、数据安全性、性能都提出了很高的要求。分布式融合存储通过高可用、高安全、高扩展、高性能设计,能够支撑系统实时数据访问和灵活扩容,满足大规模数据存储与分析的需求;

● HPC高性能计算场景:在高性能计算领域,分布式融合存储技术的应用作用愈发重要,它通过将多种存储业务资源集成为一个整体,以满足对文件、对象、块功能的需求,以及性能和容量的要求,并提供高可靠性和可扩展性,为科学计算和数据分析提供了可信赖的数据基础。

分布式融合存储正成为用户首选的存储底座

《报告》预测,分布式融合存储这一新兴技术目前正处于发展早期阶段,仍面临多服务融合的高性能挑战,新存储形态的标准化挑战和智能化的运维管理挑战。

同时,分布式融合存储拥有广阔前景,首先分布式融合存储有助于“存力”构建,符合政策方向;其次,分布式融合存储在一套存储架构有效组织管理不同存储介质、存储协议和存储服务,使得“一套存储架构支持一个数据中心”成为可能;以AI大模型为基础技术,未来涌现的各类新应用需要更强大的数据基础设施和数据平台能力,带来不可估量的市场空间,注定分布式融合存储未来大为可期。

存储产业技术创新战略联盟秘书长李仁刚提出,“云计算、大数据和人工智能等技术的快速发展,将推动分布式融合存储的进一步应用、推广,成为越来越多行业用户的首选存储底座。”

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
全面诠释网络负载均衡 负载均衡的出现大大缓解了服务器的压力,更是有效的利用了资源,提高了效率。那么我们现在来说一下网络负载...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...