美国国家安全局所谓的电话记录计划将焦点放在了数据挖掘上

美国国家安全局(nationalsecurityagency)与恐怖主义有关的监视工作(包括其据称的收集国内电话数据的项目)引发的争议,正将聚光灯对准高端数据挖掘这一深奥领域。

一家与美国国家安全局有公开联系的IT供应商是Narus公司,这是一家总部位于加州山景城的公司,销售用于拦截和分析电信和网络流量的系统。美国电话电报公司(AT&T)退休通信技术员马克·克莱因(Mark Klein)在今年4月提交的一份宣誓书(下载PDF)中说,2004年,他看到一份文件,其中列出了美国电话电报公司(at&T)位于旧金山的一个中央办公设施的“密室”中安装的设备中的纳鲁斯技术——据称是在一名美国国家安全局特工的指导下安装的。

EFF于1月31日在旧金山的美国地方法院对AT&T提起集体诉讼,声称这家电信运营商在没有许可证的情况下让NSA窃听其客户,违反了联邦法律。

Narus营销副总裁史蒂文•班纳曼(Steven Bannerman)拒绝证实或否认其公司与美国国家安全局(NSA)和美国电话电报公司(at&T)有关联。但他欣然承认,该公司的技术能够筛选大量网络数据,以搜索有针对性的信息。

Narus的流量处理引擎可以以高达10Gbit/sec的速度检查数据。班纳曼说,在对包括电话、电子邮件文本和流媒体视频在内的网络数据包内容进行深入检查的同时。他声称,这项技术使网络运营商能够发现病毒和识别人类目标,如垃圾邮件发送者或潜在的恐怖分子。

该设备配备了可选的合法拦截功能,旨在帮助确保只有假定来自法院批准的目标的网络数据包才能被跟踪,并且只有在签发搜查令时才被跟踪。但是,Bannerman指出,“一旦我们将产品出售给客户,软件中就没有机制来检查他们是否在使用认股权证管理系统。”

他说,收集数据包的设备与基于英特尔的“逻辑”服务器配对,该服务器运行Red Hat Linux,并实时分析数据包,寻找IP地址或“声纹”等预配置目标。它还可以检查异常模式。

确定要扫描的模式是分开进行的,通常使用数据挖掘和商业智能工具来分析存储在数据仓库中的信息。

俄亥俄州代顿市Teradata的首席技术官Stephen Brobst拒绝就NSA是否在使用NCR公司部门的数据仓库软件发表评论。但他承认,Teradata的技术在电信运营商和网络服务提供商中很受欢迎,因为它可以存储和分析他们收集的大量通话数据记录和网络流量信息。

例如,Brobst说,AT&T的Daytona数据仓库内部部分使用Teradata技术构建,它存储了1.88万亿个通话记录,总计超过312TB的数据。

总部位于马萨诸塞州沃尔瑟姆的一家咨询公司Winter Corp.的总裁理查德•温特(Richard Winter)表示,数据仓库通常需要的存储容量是数据本身所需容量的五倍。

Winter指出,设计用于备份和保护数据的RAID技术占用了额外的空间。此外,据Winter称,尽管磁盘每个主轴所能包含的数据量每年翻一番,但磁盘的旋转速度和容纳读写磁头的臂的移动速度变化不大。”这样做的结果是,要在正常的数据仓库中获得良好的性能,就必须让磁盘部分空置。”。

一些分析人士认为,社交网络分析(最常用于确定人与人之间相互联系的数据挖掘技术)仅对通话数据记录并不特别有效。

克利夫兰的顾问Valdis Krebs曾为许多国防和联邦政府IT承包商工作过,他说:“如果你掌握的唯一数据是什么电话号码打什么号码以及他们通话的时间,那么试图通过这种‘自上而下的方法’找出谁是恐怖分子是不可能的。”。

但Brobst说,社交网络分析长期以来一直被电话公司用来进行复杂的计算,例如找出如何最好地构建朋友和家人的通话计划,以吸引客户并实现利润最大化。”关键是你不知道自己在寻找什么,所以你使用数据挖掘来搜索模式往另一个方向走很容易。”

毫不奇怪,美国国家安全局没有谈论其数据收集和挖掘活动。”美国国安局发言人韦伯(donweber)通过电子邮件表示:“鉴于我们所做工作的性质,就实际或指称的业务问题发表评论是不负责任的;因此,我们没有信息可供提供。”不过,必须指出的是,国安局认真承担法律责任,在法律范围内运作。”