案例研究:安客诚公司的国产电网

安客诚公司(acxiomcorp.)每月处理数十亿条记录,从潜在客户名单、电话记录和零售店销售额等来源中筛选,为其业务客户生成可用的消费者数据。

高产量令人印象深刻,但公司官员希望处理得更多——更快、更便宜。

“我们决定必须有一个更好的方法,”电网基础设施小组组长查尔斯C.霍兰德说。

因此,技术人员开发了客户信息基础设施(CII),获得了2005年计算机世界荣誉奖。这种网格环境允许Acxiom更快地处理更高的数据量,并且使用成本更低的设备。

例如,考虑到更新Acxiom的InfoBase数据库通常需要三个多月的时间;在网格上,则需要三天。”如果没有这种能力,我们将无法像今天这样经营我们的业务,”安客诚解决方案基础设施组织负责人亚历克斯•迪茨(Alex Dietz)表示。

Acxiom在1995年之前一直使用运行MVS的IBM大型机管理大多数数据,当时它将内部进程和客户机的应用程序转移到对称的多处理平台上。尽管SMP技术更强大、更具成本效益,但安客诚每年仍花费1.5亿美元购买资本设备以维持其能力。

但是安客诚的工作人员已经在开发一个名为AbiliTec的高性能应用程序,该应用程序可以链接和清理从多个数据源收集的个人消费者的信息。安客诚将从客户处收到的每个姓名和地址与200亿条记录的内部AbiliTec参考数据库进行匹配。每月有超过400亿条记录被链接。

安客诚的查尔斯·D·摩根、亚历克斯·迪茨和特里·塔利

应用程序运行得很好,但是Acxiom需要20个支持AbiliTec的unixsmp环境来处理处理负载。这是昂贵的,但仍然不够快,特里说,塔利,高级技术顾问康威,方舟子。

回报潜力

因此在2000年,一个研究小组开始寻找更好的方法,把希望寄托在网格技术上。迪茨把这个计划归功于塔利:“他带着把一堆PC机连接起来的想法来找我们,他证明了这是可行的。”

塔利说,他将应用程序分散在多台机器上,而不是使用一台大型机器。我们的速度要快得多,而且做一个记录的增量成本比我们以前的实现要低得多。”

2001年夏天,由8到10名技术人员组成的团队向首席执行官查尔斯•D•摩根(Charles D.Morgan)演示了网格计算机项目。

他说,这太好了。塔利回忆道:“去把安客诚所有的产品都做一遍吧。”。

马萨诸塞州南哈德利市网格技术合作伙伴的分析师、《网格计算:技术和应用实用指南》(Delmar Thomson Learning,2003)一书的作者Ahmar Abbas说,Acxiom对网格技术的使用使公司成为这一领域的领军者。至于这项技术对安客诚业绩的影响,他表示,工人们为使流程运行得更好、更便宜、更快所能做的任何事情,“都将直接影响到他们提供的服务和能产生的资金。”

安客诚数据产品集团负责人约翰里帕(johnripa)表示,新技术的影响是巨大的。

他以公司的一个产品InfoBase Enhancement为例。一个客户——例如一家手机公司——可能会要求提供消费者信息,以锁定新客户或交叉销售给现有客户。客户向安客诚发送数百万条自己的记录,然后安客诚根据其消费者信息数据库对这些记录进行处理,以生成手机公司想要的详细消费者文件。

瑞帕说,通过使用CII网格计算技术,Acxiom将其构建过程的速度提高了83%。它将这些文件传递给客户端的速度提高了77%。”可靠性大大提高。我们尽可能接近零停机时间,”他补充道。同样令人印象深刻的是硬件成本降低了86%,Ripa说,对比实施前后的成本。

“这使我们的客户能够快速完成以前从未考虑过的事情,”里帕说,并补充说,公司愿意为此速度支付溢价。

塔利说,安客诚面临的最大挑战是“应对心理冲击。人们对旧的和熟悉的模式感到满意。“这些变化要求工人”重新思考现有的流程和软件。“安客诚还必须长期管理大量的计算机。

“我们已经开发了很多软件来应对这一挑战,”塔利说第一次启动和运行一堆机器相对容易。随着时间的推移,添加、替换和更新这些机器要困难得多,如果有数千个节点,问题就会扩大。”

经验教训

没有路线图来指导他们,安客诚的IT员工不得不依靠自己的内部资源来弥补商业产品的不足。因此,他们构建了自己的资源调度器、网格控制、维护接口、软件分发功能和支持网格的数据管理功能。

开放源代码软件在可用时被使用;当不可用时,it人员编写组件。安客诚的官员还聘请了在其他公司开发通用电网产品的专家,以确认他们走上了正确的道路。

回报掩盖了许多挑战。Talley指出,一个人口统计增强产品在大型Unix计算机上运行需要近30天;在网格版本上运行不到一天。

“我们的网格是关于性能的。这是关于能够做你以前做不到的事情,”塔利说。

2003年,Acxiom宣布它也将在网格环境中托管客户机数据和运行客户机进程——这一策略演变为称为CII的体系结构。

CII产品负责人kenarcher表示,网格的速度、灵活性和可扩展性是满足客户需求的关键。

“我们的客户群很大一部分是金融服务,特别是围绕客户营销和客户获取。如果他们能更快地获得数据,他们就能更快地得到报价,做出这些决定,”他说。

安客诚目前在其数据中心拥有4000多个机架安装的两个处理器节点,这些节点专用于网格。每个节点都是运行Linux的基于PC的服务器。

官方不会透露该公司在其网格计算项目上投入了多少资金,尽管他们表示该项目的价值是值得的。他们以一家大型信用卡发行商为例,该公司使用CII环境和大型机并行处理和评分了2.5亿条客户记录;完成CII的时间为15小时,而大型机上的时间超过150小时。

Dietz说,Acxiom仍在向网格计算迁移,因此大约一半的工作仍在遗留环境中进行。塔利说:“在未来几年里,我们的尺寸和功能都将不断发展。”

普拉特是马萨诸塞州沃尔瑟姆的计算机世界特约作家。联系她的电话marykpratt@verizon.net。