系统集成论坛

标题: 大数据存储 未来存储的趋势 [打印本页]

作者: 思考的牛    时间: 2010-11-21 21:45
标题: 大数据存储 未来存储的趋势
今年的Teradata合作伙伴大会刚刚在圣迭戈闭幕。此次大会最大的看点之一就是通过跟踪客户在线购买行为零售商可以取得极大的优势,同时这对未来的存储资产也有很大的影响。商业经理们无法预测他们未来希望向客户问什么问题,同时也无法说搜集的哪个数据是有用的还是无用的。答案就是把它们都存起来。

许多公司一直都依赖于市场研究来理解如何进入市场和如何向客户销售商品。但是在线数据的兴起,尤其加上社交媒体,使得我们面临信息爆炸,并带来了另一个量级的考察客户行为的数据量。SAS研发副总裁Paul Kent表示:"随着我们从回归分析模式过渡到所有这些网络上的分析工具,我们可以发现很多东西。

例如,Ebay架构与经营高级总监Oliver Ratzesberger 指出,Ebay同时在站点上展开100个不同的实验,涉及数千名客户,并带来了数百万计的数据点。因此,Ebay可以深刻了解用户是如何在站点上购买产品的。Ratzesberger指出,一个实际的例子就是Ebay因此改进了展示服装的方式。在任意时刻,Ebay上的每位用户都可以选择大约70万件女装,这选起来非常麻烦。通过研究,Ebay发现如果开发一种新功能让用户可以自己定制尺寸、款式和制造商等搜索范围,那么客户将很欢迎这种功能。

存储需求会进一步增加,这不仅是因为需要匹配客户行为,同时也是因为组织希望分析这些客户的社交图。Kellog的Mark Jeffery表示:"在线世界的真正优势在于能够跟踪客户。"例如,加拿大世界银行同Weddingbells.com有合作关系,从而能够跟踪客户在站点上的互动。

但是,要取得这些珍贵的"资料",组织需要构建庞大的互动数据库,既包括自己网站上的,也包括来自合作站点上的信息。实际上,Ebay已经发展到单单跟踪站点上的客户行为也不够的程度了,因为它的网页变化得非常快(大约每隔五分钟)。为了能够了解并分析客户行为,Ratzesberger认为他们未来可能需要存储客户看到的每个屏幕--这是非常庞大的数据。

Ratzesberger表示:"如果你问老板哪些信息是他想保存的,哪些信息是他想删除的,他会跟你说哪个都不是。我们不知道未来我们需要运行哪些查询。因此,如果我们今天不把这些数据存起来,而有一天我们需要回答这种问题,那么我们需要13个月才能构建好足够的数据库。"

对存储和IT专家来说,存储更多数据和查询更多数据的倾向性意味着主数据层和次级数据层的增长。拥有更快查询速度的SSD将用于访问最热门的数据,而磁盘则为稍微不那么热门但仍然访问频繁的数据提供"快速"二级存储。

IT部门仍然需要考虑备份和冗余计划。复制或备份/恢复100GB的数据是一回事,对TB级或PB级数据这么做则又是另一回事。查询时间不可避免地将更长,光是存储数据的成本就大幅增加。

现在,也许现在在使用数据仓库的大型组织寻求将这些功能传递给中小企业。从商业的角度来看,Ebay所能享受到的好处从理论上来说也可以是其他任何电子商务公司能享受到的好处,因此它们会尽可能地保留数据。数据提供方式也变得更加可行。在同Teradata负责研发战略的总监Todd Sylvester交谈的时候,他明确表示该公司没有计划将软件提供给福布斯1万强企业。Teradata有可能采用数据仓库服务的形式,让服务提供商通过云提供数据仓库。然后,那些需要数据的组织就可以避免在自己本地构建庞大的存储架构了。

这种服务还不会很快到来。他指出,他们现在正在和Teramark磋商,后者是一家服务提供商。2011年,Teradata的数据库需要做一些结构性的改进以便支持多租赁功能。然后到2012年,Teradata有可能开始为小型企业提供大数据。
作者: 陌影    时间: 2011-1-17 12:18
谢谢分享!




欢迎光临 系统集成论坛 (http://bbs.xtjc.com/) Powered by Discuz! X3.1