DMF软件介绍
企业的业务信息数据有其生命周期,从产生那一刻起,就进入了一个循环,从收集、复制、访问、迁移到删除,周而复始。处在生命周期的不同阶段,信息数据的价值是不一样的。
数据迁移是指依据用户制订的策略将不经常访问和使用的数据由价格及性能较高的存储设备迁入价格及性能相对较低的存储设备,而且当用户需要访问和使用这些数据时,存储管理系统能够使用户很快获得这些数据。数据迁移的目的是提高价格及性能较高的存储设备的使用效率。
SGI DMF软件是基于Kernel并符合DMAPI标准的数据迁移软件,利用DMF帮助客户灵活、经济地管理和访问价值不断变化的数据。DMF根据用户定义的策略,如文件最后一次被访问时间,将文件从在线存储透明地迁移到近线存储。利用DMF,用户可以在一个高效的存储空间内维护和管理数据,而不会牺牲数据的可访问性。DMF是一个成熟的、经过时间考验的解决方案,在SGI许多客户中得到应用。
DMF具有以下特性:
• 通过降低容量和管理成本降低客户TCO总体拥有成本
• 通过提高数据访问和生产力提高客户ROI 投资回报率
• 优化数据管理和控制
• 降低数据拷贝和恢复的风险
• 通过扩展能力保护用户投资
• 与系统整合和数据保护无缝集成
下图是数据迁移的过程示意图:
数据迁移主要经过以下四个层次,其中数据分类的重点在文件的服务性能, 不是文件系统本身,要保证常访问文件的服务质量就要保证文件系统的高性能、高带宽。策略制订后,操作系统将依据策略自动的、透明的对文件系统进行迁移。
数据迁移操作由后台进程(如SGI DMF软件的核心进程dmfdaemon)完成,迁移的目标设备由Media specific process进行控制,Media specific process (MSPs) 允许所选文件迁移到不同类型的介质,dmdskmsp 将数据迁移到磁盘, dmatls 将数据迁移到磁带,dmftpmsp 通过TCP/IP将数据FTP到另外一台服务器上,SGI DMF软件及其主要的模块关系如下图所示:
数据迁移依照一定的策略进行,相应的策略一般有:存储空间上限策略、访问时间策略、以及用户ID、组ID等。剩余空间门限由系统管理员确定,当超过设定门限时,系统利用后台作业进行数据拷贝,执行迁移策略。访问时间是指文件被修改的最新时间或文件被访问的最新时间,以最近的为准。
数据迁移保证对于新的文件和常用的文件有充足的存储空间,并保证了重要的常用文件系统的访问性能。
DMF软件竞争分析
目前有多个厂家都有分级存储管理软件,主要思路大致相同,但是SGI DMF分级存储管理软件的主要优势体现在:
1、DMF数据迁移软件运行在SGI Orign服务器或SGI Altix服务器,它采用扩展文件inode信息加入DMF属性的XFS文件系统,比其他文件系统,如ufs(Sun Solaris、HP-UX采用)具有更高的性能,由于DMF后台执行的程序是基于XFS文件系统的xfsdump和xfsrestore,数据迁移效率高,因此DMF数据迁移对系统性能的影响很小(低于5%);
以下数据可供参考:
XFS文件系统性能创造多项世界记录(在Origin2000服务器上测试):
• 10 TB/小时 数据备份
• 7.9 TB/小时 影像数据恢复
• 70 TB 单一文件系统
• 12 GB/s单一文件系统 I/O 带宽
• 32 TB /天 单一数据库数据量增长
• 3PB 数据生命周期管理
Unix File System ufs没有提供此类测试数据,Veritas VxFS的文件系统性能只有1GB/s
2、 区别于其他分级存储管理软件的重要一点是DMF采用专用数据库对所有文件进行管理,而其他分级存储软件采用文件名管理,DMF数据迁移软件在检索、定位、恢复等方面具有更高的效率;下图是DMF文件系统数据库结构:
3、 DMF与其他分级存储软件的另一个区别是DMF可以和其他软件,如HA软件(SGI Failsafe或SGI Cluster Manager软件)、备份软件(如Atempo、Bakbone、Legato)以及共享软件(如SGI CXFS)结合,构成一个迁移、备份、归档、共享等应用的完整的、高可靠性的数据管理方案,而其他存储分级软件当存储服务器宕机时,则会造成服务中断。
以下是DMF与主要竞争产品的比较:
Item | SGI DMF | ADIC AMASS | IBM TSM | EMC FileMover |
DMAPI标准 | 是,支持第三方应用开发 | 否 | 是 | Legato DiskXtender 是 |
文件系统 | XFS或CXFS | 不确定,与主机操作系统有关 | 不确定,与主机操作系统有关 | 不确定,与主机操作系统有关 |
文件系统效率 | 12GB/s | N/A | N/A | N/A |
多个文件数据拷贝 | 是 | 是 (最多两个镜像) | 否 | 否 |
日志式文件系统 | 是 | 不确定,与主机文件系统有关 | 是 | 不确定,与主机文件系统有关 |
与备份软件结合 | 是 | 否 | 否 | 是 |
部分回迁 | DMF支持已迁移数据部分回迁 | 不支持 | 不支持 | 不支持 |
目标应用 | DMF更注重于数据生命周期管理,HPC海量数据 | 利用Disk Cache方式存储数据,消耗主机资源,适合于数据直接归档应用 | 分级存储 | EMC更强调信息生命周期管理,主要是Email、文件的管理 |
实际应用案例 | >100PB |
|
|
|