存储2.0--基于Web的存储即将推出

把开源软件、运行在低成本硬件上的分布式存储和万维网结合起来,你得到了什么?每月每千兆字节只需15美分的存储空间,另外每千兆字节用户上传或下载10到20美分。

这是一笔非常划算的交易,尤其是Forrester Research Inc.的分析师Andrew Reichman估计,仅购买辅助(备份或存档)存储所需的硬件和软件就需要每GB 15至25美元,每千兆字节50美元及以上用于股票交易或航空预订等业务关键型应用程序所需的主存储。这些价格都没有考虑到持续的管理成本。

但是,还不要扔掉光纤通道存储区域网络(SAN)。这些基于Web的服务缺乏在线事务应用程序或大型数据库查询所需的性能。然后是安全问题,以及他们的数据公司会信任多少互联网“云”中某个节点

不过,如果有前景的新技术能够实现,它们可能会减少企业对EMC公司、IBM和Hitachi Data Systems Inc.等行业巨头销售的专有、价格更高的存储硬件和软件的依赖,更不用说许多规模较小的公司了。

技术

支持这个新存储平台的第一项技术是开源存储软件。(参见“开放源码软件进入存储阶段”)。这可以是用于特定存储功能的工具的形式,例如Amanda开源备份和Darik的Boot and Nuke(DBAN)磁盘擦除实用程序。它还包括Lustre、OpenAFS和SAMBA等网络文件系统,它们可以构成整个存储基础设施的基础。

第二种技术是分布式网格或基于集群的存储体系结构,这些体系结构来自初创企业,如Cleversafe公司,以及成熟的服务,如Berkeley Data Systems公司的MozyPro。

第三种使能技术是在这些体系结构中使用业界标准的服务器和磁盘驱动器来代替高端存储阵列。

例如,伯克利数据系统公司(Berkeley Data Systems)的MozyPro在线备份服务基于其存储群集和文件服务软件,这些软件运行在伯克利数据系统数据中心的“白盒”(无品牌)服务器上,这些服务器将数据存储在其内部驱动器上。价格:每台使用该服务的台式机或服务器每月收费4美元,每存储千兆字节数据每月收费50美分。与其他通过存储多个副本来保护客户数据的在线存储提供商不同,伯克利的软件保存了33%的原始数据,如果需要,可以从中还原完整的原始数据。负责产品的副总裁万斯•切克茨(vancechecketts)表示,这意味着它只需比客户发送的数据多存储33%,而其他存储供应商则必须存储300%的原始数据。

Cleversafe是一家29人的初创公司,它将向其他公司提供alpha测试软件,用于构建基于Web的开放源代码分布式存储体系结构。它的软件使用算法将加密数据分成11个“切片”,这些“切片”存储在分布式服务器上,必须进行组合才能产生任何可用的信息。使用相同的算法,软件可以从任何原始切片中重新创建原始数据。通过消除整个文件的备份、归档和恢复,Cleversafe将公司为保护关键信息而必须存储的“额外”数据量从当前实际数据的300%或更多减少到130%,据CEO克里斯•格拉德温(chrisgladwin)说,他还声称数据切片本质上是安全的,因为没有一个存储节点包含任何文件的完整副本,因此更难窃取或破坏。可用性也得到了保证,因为11个节点中的任何5个都可能出现故障,而且软件仍然可以恢复数据,他说。

这个星球网总部位于休斯顿的托管公司互联网服务公司(Internet Services Inc.)正在调查Cleversafe,将其作为使用旧服务器创建低成本存储网格的一种方式。”公司董事长兼首席执行官道格•厄文(Doug Erwin)表示:“通过对磁盘驱动器进行适当的升级,我们可以让它们的使用寿命延长5到6年,而不是持续3年或4年。”。

总部位于芝加哥的网络咨询公司岸上网络有限责任公司的总裁兼创始人Stelios Valavanis认为,Cleversafe提供的安全性,而不是任何成本节约,可以使其对客户具有吸引力。他和那个星球网正在等待Cleversafe在今年晚些时候推出新功能,比如进一步减少存储在Cleversafe网格上的“额外”代码量,允许用户和应用程序将网格视为网络驱动器,然后再决定如何继续。

也许最大的在线玩家是亚马逊网站公司(见“亚马逊网站推出数据存储服务(datastorageservice))。amazonwebservices负责产品管理和开发人员关系的副总裁adamselipsky表示,它的S3服务是由位于多个位置的多个存储服务器阵列提供的,它们存储了客户数据的多个副本。它的目标是那些可以尝试构建创新应用程序的开发人员,因为它的低成本:每月存储的数据每千兆字节15美分,上传的数据每千兆字节10美分,下载的数据每千兆字节13到18美分。Selipsky拒绝描述S3中使用的技术,只是表示S3包括“多个位置的多个存储服务器阵列,存储多个数据副本”,Amazon在其整个基础设施中“主要使用开源软件”。

过来,EMC?

Illuminata公司的分析师John Webster说,开源软件和网格存储技术的结合可能会给拷贝、备份和灾难恢复软件供应商带来真正的风险。”他说,如果这种方法真的奏效,它将“从根本上简化存储管理”,从而改变游戏规则。

然而,其他一些观察家预测,用户将继续为他们最关键的应用程序购买专有产品。

其中一个原因是互联网固有的延迟和不可预测性,存储管理人员无法对其进行调整,以获得坚如磐石的可靠性和可预测的响应时间。安全是另一个问题。jeffpieper是Pieper&Associates公司的总裁,Pieper&Associates公司是一家位于加州托伦斯的营销设计公司,是在线存储供应商所追求的中小企业客户类型。但他说,他必须与许多客户签署一份多页保密表格,并计划将他们的数据保存在他从日立购买的4TB SAN上,以确保安全。

然而,韦伯斯特说,那些在内部构建自己的网格的用户可以控制自己的网络,因此甚至可以将其用于主存储。

然后是实际储蓄的问题。Reichman说,分布式存储的前期成本无疑远低于内部存储硬件,但长期管理成本的对比仍不清楚。Gladwin说现在讨论Cleversafe电网的具体价格还为时过早,但他说,客户应该看到节省的成本至少与他们所需的磁盘空间、电源、占地空间和管理的减少成正比。

Reichman说,随着客户将存储从内部硬件转移到基于Web的供应商,主要的存储硬件供应商将不可避免地失去一些业务。但他表示,同时销售服务器的供应商可以通过销售低价服务器和其他“网格构建块”来“弥补一部分收入”

瓦拉瓦尼斯认为,基于网格的存储甚至可以对这些供应商起到提振作用。”尽管Cleversafe允许您使用较便宜的硬件,但现实情况是,在IT部门构建网格的大公司不会容忍购买便宜的磁盘。现在购买EMC并希望基于网格模型进行构建的公司,他们将从谁那里购买磁盘?”他问道。

与其他在线供应商一样,伯克利数据系统公司创始人兼首席执行官乔希•科茨(Josh Coates)认为,MozyPro取代基于磁带的备份的频率高于高端磁盘。他说,客户正在放弃磁带系统,因为它们比伯克利和Carbonite公司等竞争对手提供的在线存储服务更慢、更不可靠、更复杂。

甚至Gladwin也将Cleversafe视为当前存储产品的补充,而不是替代品。尽管备份是通过数据的存储方式构建到Cleversafe网格中的,但他仍然希望许多客户继续使用快照(例如,快照)来捕获给定时间点的数据状态。

Reichman预测,中小型企业可能会首先使用此类服务,以避免管理自己的存储这一“极其困难”的工作。随着这些新技术得到验证,Reichman看到大型公司将更多的辅助存储转移到此类第三方供应商。他说,其他公司可能会在内部采用这类技术,从而在保持对自己存储的控制的同时节省成本。他表示,一些银行已经在评估这一举措。

亚马逊的Selipsky认为,amazons3在企业中有一席之地,因为与较小的组织一样,他们“希望非常简单,非常容易互动,非常容易集成,他还说,大公司内的许多部门或团体缺乏为大型基础设施项目提供资金的预算或组织能力,但“在一个季度内,可能有500美元、5000美元或50000美元的资金需要处理,以证明一个概念,并尝试一些东西。”

不要着急

向网格存储的任何转移都不会在一夜之间发生,也不一定要发生。Valavanis说,像Cleversafe这样一种引人注目的新方法需要宣传,也需要“在一定程度上理解技术”

Gladwin还指出,“IT组织通常每四年左右更换一次硬件。如果有人买了一个全新的建筑。。。六个月后他们就不会报废了,”他说。不过,Gladwin预计,在2到3年内,“分布式体系结构将经常用于大型数据存档应用程序。”

到那时,无论是客户还是开发人员,先驱者们都将更加清楚地知道他们手中的存储革命有多大。

存储2.0:有多重要?