打印本文 关闭窗口 | |
技术解读:网络存储如何虚拟化 | |
作者:陈鹏 文章来源:eNet 点击数 更新时间:2009/9/9 20:55:41 文章录入:陈鹏 责任编辑:陈鹏 | |
|
|
一段时间以来,存储虚拟化又成为了网络存储领域的一个热门话题,但同网络存储领域所存在的许多其他问题一样,众说纷纭,没有较为统一的看法,其中也不乏概念上的混淆。从另一个侧面来看,也表明了网络存储尚处在快速发展时期,有很多问题还值得人们在实践中进一步去探讨。本文所提及的存储虚拟化,仅涉及与网络存储相关的范畴。 “存储虚拟化”并不是近期才提出的一个新概念,它是伴随着大型计算机的产生、发展而出现的一个较为经典的概念,但随着网络存储的兴起,在新的领域中,存储虚拟化又被赋予了全新的解读,不过从存储的核心功能来看,其本质是具有延续性的。 存储虚拟化的概念 从广义的角度看,存储具有两大特性: 其一,它是具有存取数据功能的载体; 其二,它具有可管理性。 存储虚拟化是物理存储的逻辑表示方法,是在服务器与存储之间设置的一个抽象层,服务器被绑定到逻辑抽象层上。于是,无论何时如果需要都可以改变所连接的物理存储,典型的如阵列的替换、层次化存储等,而不会影响应用对这个存储的访问。存储虚拟化也正是紧紧围绕着这两个主要方面展开的。 从狭义的角度看,存储是具有两个访问通道的实体,数据通道和管理通道就是对此的简单描述。二者在物理上可以是聚合的,也可以是分离的,而存储虚拟化就相应地发生在这两个通道上。 在理论上可以认为,相对于原存储实体,新的存储实体在数据和管理通道上所进行的任何非恒等的转换,都是一种存储虚拟化方法。概括地讲,所谓存储虚拟化可以简单地描述为: 新存储实体对原存储实体的存储资源(如存储的读写方式、连接方式、存储的规格或结构等)和存储管理(如统一、分散管理)进行变化和转换的过程称为存储虚拟化。 存储虚拟化的技术分类 一般认为存储虚拟化是有所特指的,大致可以从以下两大类来划分: 存储资源的虚拟化 ● 存储的规格或结构 从早期的磁盘分区到现在具有复杂结构的磁盘阵列,对存储规格或结构的虚拟化始终作为一种最基本的虚拟化形式而不断发展,这是存储虚拟化的一个最为基本的特性之一——可分性。 属于这一类的存储虚拟化产物有: RAID、虚拟网络磁盘等,在可以预见的未来,这类存储虚拟化方式将伴随着人们对块存储的需求,以及对存储安全性与性能的不懈追求仍将长期存在,并且适度发展。 在结构虚拟化方面,设备冗余和资源空洞是两个完全不同的类型,设备冗余可以实现同步、异步镜像等,而资源空洞主要采用写时分配的技术,在提高资源利用率方面表现更为突出,它能够使得呈现给主机的逻辑卷远大于实际的物理存储; 而快照技术更是实现了源和快照依赖于相同的存储资源,形成一种典型的一个虚拟多个的方式。 ● 读写方式 到目前为止,存储的读写方式可以归纳为四种主要形式: 块读写方式、文件读写方式、对象读写方式和键值搜索读写方式,四种形式依次递进(如图示意),对存储的抽象层次不断提高,使得应用(程序等)对存储的依赖程度逐渐降低,存储的智能性不断提升,进而也就不同程度地实现存储与应用的分离。在本质上,也就逐步实现了在计算机系统中,处于不活跃地位的存储与处于活跃地位的计算之间的分离,而归根结底,其源动力来自于人们对数据共享效率不断提高的需求。 可以看出,存储读写方式的演进,在客观上也对存储规格和结构的发展提出了要求,但存储读写方式的演进并不依存于存储规格和结构的发展。 在相当长的一段时间内,块读写方式和文件读写方式都将继续占据主流的地位,而其他两种方式由于受到应用模式和存储发展等某些关键技术的制约,仍将处于产品的缓慢发展和研究的相对快速发展的矛盾过程中。可以预见,随着对象文件系统、对象操作系统、存储网格以及搜索引擎和数据安全等技术的不断发展,基于对象读写方式和键值搜索读写方式的存储设备、存储系统、存储服务将成长为主流方式。 ● 连接方式 网络存储的连接方式主要有Fibre Channel(FC)、InfiniBand(IB)、IP三种。三种方式各具特色,但总的来说,FC设备在高端存储系统采用较多; IB设备的高带宽和高吞吐率在高性能计算领域有相当的优势,但经历了Intel、微软放弃支持和戴尔、IBM与Sun宣布支持的一落一起之后,IB的发展还不明朗; 在性能和标准的制约下,IP网络存储长时间在中低端市场徘徊,但由于无处不在的IP网络和其极具诱惑力的价格,近乎无限的延伸扩展能力,以及传输标准和正在快速提升的硬件性能,可以预见IP存储的市场将会作为企业存储解决方案的主要选择之一。 不同的存储连接方式,也对应着不同的存储特性,存储虚拟化技术可以以融合多种连接方式(包括上述三种方式)的优势,更好地满足应用的需求。 存储管理的虚拟化 ● 集中管理 网络存储发展到今天,出现了很强的旨在体现集中管理的聚合趋势,大型存储系统和超大型的存储系统不断出现,高性能、高可用、高数据安全性和大容量成为其主要的发展目标。但伴随而来的是存储管理的复杂性也一升再升,不同的存储系统之间无法实现有效地级联(管理方面),甚至这一现象也出现在同一厂商的系列产品中,进而也使得存储资源无法实现有效地管理和使用,复杂的管理和相应的高管理成本都阻碍了网络存储的发展。 面对这一现实问题,统一存储管理标准问题愈显突出,这也是制约存储虚拟化、乃至于网络存储工业发展的关键症结所在。 ● 分散管理 在使用存储的某些特定场合,所虚拟出的资源应具有一定的独立管理特性。 ● 性能的动态调整 在共享网络带宽的情况下,虚拟出的多个设备其间的性能可动态调节或可动态配置。 存储虚拟化系统的结构分类 在网络存储领域,实行存储虚拟化的手段大致可以从两方面考虑: 一方面,按虚拟化模块在网络存储中的位置划分为三类: 基于主机、基于网络和基于存储设备节点,基于网络的虚拟化是发展的潮流,这一点,IBM与EMC的观点是相同的; 另一方面,按虚拟化管理模块相对于数据通道的位置,划分为带内(In-Band)和带外(out-of-band)管理。 In-Band虚拟化模块(引擎)位于主机和存储节点之间的数据通道上,因为位于数据读写的关键路径上,所以既有安全性高、实现容易、对主机要求低等优点,又有扩展性差、易形成单点故障等明显的结构缺点,这通常利用Cache技术来优化性能。 与In-Band不同的是,Out-of-Band虚拟化模块位于主机和存储节点之间的数据通道之外,通过其它的网络连接方式与主机系统通信。于是,在每个主机服务器上,都需要安装客户端软件或者特殊的主机适配卡驱动,相比In-Band方式,这种方式的系统可扩展性很强,虚拟化模块不会在数据通道上成为单故障点,但其实施难度比较大。 技术现状和问题分析 由于数据量的激增,使得在存储领域里各种问题愈显突出: 1. 存储系统间的互操作性差 新增存储设备与原有存储设备之间互操作性差,相近的管理功能需要独立管理,从而带来了重复投入和人力成本,这也是很多用户寄希望于存储虚拟化的主要原因。企业购买的存储设备越来越多,管理成本投入也在等比增加。而由于不同厂商的存储产品有不同的特性,所以,为了适应企业自身的业务发展需要,通常都需要多种类型的存储设备。有些在存储介质、存储管理等方面的差异非常大,也经常出现购买多厂商存储设备的现象,从而造成企业的存储环境愈发复杂。由于管理标准不兼容的问题,这些设备的管理系统也很难整合,给企业存储管理带来昂贵的成本。 存储虚拟化目标是整合高、中、低端存储设备,磁盘、磁带、光盘设备,以及FC、IB、Ethernet(IP)等不同连接方式的设备,在统一管理的标准下,实现存储系统之间良好的互操作性。 2. 存储资源利用率不高 随着企业的发展,数据量大幅增长,使得很多企业出现存储预算超支现象,存储设备的投入在生产投入中的比重逐渐加大,而50%到60%左右的存储利用率对存储资源又造成了巨大的浪费。相反地,存储投入所带来的收益却并不高,因此,如何提高存储资源利用率的问题,已成为很多企业的现实需求。从技术手段上讲,存储虚拟化在结构虚拟化方面的技术,可以很好地解决这一问题。它利用虚拟的逻辑卷来满足应用的需求,利用虚拟化层将前端的逻辑卷映射到后端物理存储介质上,而物理存储介质的配备,则可根据实际需求量动态增长,从而实现较高的存储利用率,至少可以提高到80%至90%以上。 3. 缺乏管理多介质的存储系统 考虑到信息也有其产生、发展、变化和活跃到不活跃或消亡的发展规律,在不同时期,配以具有不同性能和安全性等特性的存储,是完全符合信息拥有者利益的自然选择。这需要在存储系统的设计和管理上有统一的解决方案和技术支持,比如在同一存储设备的管理范围内,可以对不同特性的存储加以管理,提供对用户数据的活跃程度(或热度)等特性的监控信息,并给出适当的调整方案建议。在技术上,支持数据的有效流动(提供本地或远程镜像、快照、支持增量备份,以及数据由高性能存储向低性能存储的迁移等等)。 4. 利益冲突和技术难度 各存储厂商之间,由于对存储虚拟化概念的不同理解,以及实现方法的不同,增加了用户的选择难度,这也在一定程度上制约着整个存储市场的发展。 在对存储虚拟化的理解方面,即便是主流的厂商也存在着较大的分歧: HDS与HP的观点和方法比较相似,而IBM与EMC更为接近; 再如,不同厂商对信息生命周期管理(ILM)有不同的理解,有的厂商将其解读为只涉及到数据的存储, 有的厂商将其具体划为管理软件等等。这些技术在认知上的分歧,使得厂商之间在标准的制定和实施方面需要更长的磨合过程,在这一过程中,势必会出现产品或管理上的不兼容,而最终给用户的选择和使用带来困惑。 对于存储厂商来说,支持网络存储标准所带来的长远利益和维护现有产品市场的现实利益之间,目前的首选是后者。而厂商也急于进行标准化,因为标准的制定和实施的过程也意味着市场占有率等利益问题。从而可以预见,存储标准得到普遍推行的时候就是存储虚拟化最理想的发展时期。而在现有条件下的存储虚拟化难度很大,要实现不同厂商之间产品的统一管理,只有在与厂商间建立战略合作关系的情况下,才能更好地实现。 虽然网络存储行业的标准化还需要一段时间,但从主流厂商在新产品中,开始采用SMI规范所定义的管理协议这一情况来看,标准化过程势在必行,从参与SNIA制定和实践网络存储标准的厂商和研究机构的规模来看,一场具有决定性意义的变革正在悄然兴起。 多样化的发展态势 从存储的发生、发展过程来看,存储虚拟化的过程始终伴随其间,而不断发展变化的是存储虚拟化的层次和分布。从长远来看,随着存储市场的不断发展,存储虚拟化将呈现层次不断提高,随应用需求等因素,其种类将呈现多样化的发展态势。 以存储虚拟化技术为核心的企业解决方案 目前,EMC、IBM和SUN等公司都把目标瞄准了企业数据中心市场,纷纷推出了新的存储虚拟化产品,帮助企业IT管理者计划向虚拟化数据中心转移,并承诺帮助企业降低成本和简化业务流程,提供全方位的解决方案。 由于数据已经成为企业核心价值的载体,数据的保存和维护是企业投资、预算,以及成本核算的关键部分之一,承担着维系企业命脉的作用,因此必须以相对完整的、可持续发展的,在投资回报率方面最优的方式来构建存储系统,而企业的这些需求是一个多目标优化问题。在此前提下,存储虚拟化是迄今为止的一个最佳选择。 SMI-S标准化进程稳步推进 虽然标准化的结果势必将使得网络存储市场的竞争更趋激烈,但标准化的进程却丝毫没有趋缓。在标准的制定过程中,技术和利益的较量始终在进行,同时IBM、EMC、HP等大型公司也分别在适当的时候推出了符合SMI-S规范或通过SNIA认证(SNIA-CTP测试)的产品,这些产品多数都集中在高端市场,而如Adaptec等公司也试验性地推出了符合SMI-S规范的产品,但这更多地是着眼于未来的市场。 存储管理软件独立发展 随着存储系统管理的标准化,为存储系统管理软件的独立发展提供了可能。目前,所有大型存储及相关存储厂商的高端产品中,都集成了基于开源项目(Pegasus项目、OpenWBEM项目,以及由IBM支持的Sblim开源项目等)开发的、通过SNIA认证的存储管理软件,其中主要包括: EMC、HP、IBM、HDS、AppIQ、ADIC、StorageTek(SUN控股子公司)、Dell、Symantec、Cisco和NetApp等存储及相关厂商,另外,MicroSoft也进入了存储管理软件市场,与多家存储管理软件厂商的产品实现集成。 IP存储异军突起 由于历史等因素,IP存储一直没有成为网络存储市场的主流,但近几年的一系列重要事件为IP存储的发展奠定了坚实的基础,其中之一就是iSCSI标准的确立,另外千兆网卡、万兆网卡的普及等为构建可用的IP存储提供了技术上的保障。IP存储在系统造价和环境兼容性方面的优势始终是开拓市场的关键,加之并不逊色的性能表现也吸引了不少用户的注意力,同时,相对简单的系统开发技术也大大降低了技术门槛,使得许多看好网络存储市场的企业有进入这一行业的机遇。目前,IP存储的市场定位仍以中低端市场为主,近些年,随着许多大型存储厂商,如IBM、EMC等开始开发中低端市场,IP存储的优势将会显现,这一点在国内市场表现会比较明显。 链接一:存储虚拟化市场分析 角逐中端市场 高端存储市场被少数大型企业如EMC、IBM、HDS、HP等所垄断的局面很难动摇,而广阔的中端市场,已成为众多存储厂商相互角逐的新赛场。目前,中端市场的发展远未饱和,每个存储企业都在谋求进入中端市场。而存储用户在众多的存储厂商中,也谋求寻找适合自身需求的存储产品和解决方案,在这一市场中,相比传统的存储更省钱,并且更具灵活性的存储产品和解决方案将最受欢迎。 低端市场有待开发 相比于中高端市场,传统存储(DAS等)仍占据大部分的低端市场,这与低端市场的多数企业对网络存储的认知度有关。另外,高成本投入的产品和解决方案,也是低端市场企业对存储产品谨慎投资的主要原因之一,而作为以软件和硬件的灵活配置见长的存储虚拟化技术,开发低端存储市场的价格优势是其它网络存储技术无可企及的。 强强联合,优势互补 由于存储管理的行业标准没有普遍推行,因此,存储厂商之间的合作是实现异构系统虚拟化的必由之路。也正因为如此,很多大型公司之间进行了不同领域、不同形式的合作,例如IBM最近推出的SAN卷控制器,通过扩展支持管理EMC磁盘存储系统; HDS也推出TagmaStore平台,可以实现对EMC生产的近乎全线产品实现虚拟化。 存储服务市场更加广阔 自从网络普及之初,存储服务就成为一种网络环境中的存储提供方式,目前很多网站提供的免费和收费邮箱就是一种最基本的与邮件服务相结合的存储服务,而作为存储服务的支撑技术——存储虚拟化技术几乎是必不可少的。 随着存储虚拟化技术的发展,存储服务的质量将会不断提高,而且随着市场信用度的提高、服务市场的规范以及相关保障机制的不断完善,人们对存储服务的信赖程度将会越来越高,企业关键数据的委托管理等存储服务业务将会成为一种重要的服务被人们普遍接受,就如同今天的人们信赖银行一样。 链接二:存储虚拟化与ILM的关系 由于数据和存储直接密不可分的关系,分析数据的发展变化特性非常必要,从某种程度上说,数据是存储存在的根据。 存储虚拟化是信息生命周期(ILM)的内在需求。数据产生后首先处于比较活跃的时期,处于这一时期的数据对企业而言具有很大的价值,而最活跃的时期通常会在随后出现,这主要取决于数据的类型等因素。在数据的生命周期中,可能会出现几个活跃期,伴随数据活跃期的出现会产生大量相关数据,而数据历经几次活跃期后,会出现不同程度的衰减甚至被销毁。IDC曾建议把数据分为5层,即: 重要数据、关键业务数据、可访问的在线数据、近线数据和离线数据。对于数据拥有者而言,在数据所处的不同时期配以不同性能和特性的存储是一种最为经济的选择。为了方便地实现数据的管理和迁移,存储虚拟化技术便成为当之无愧的首选。 目前,SNIA正在为信息生命周期管理寻求一个标准,可以认为,在信息生命周期管理的助力下,存储虚拟化技术和产品市场可以得到更大的发展。 |
|
打印本文 关闭窗口 |