IBM大数据平台——领先能力彰显优势
IBM大数据平台的四大核心能力包括Hadoop系统、流计算(Stream Computing)、数据仓库(Data Warehouse)和信息整合与治理(Information Integration and Governance):
IBM在Hadoop系统领域的代表产品是InfoSphere BigInsights。IBM将其在数据管理上的丰富经验与Hadoop开源平台高效整合,使得BigInsights相较于普通的Hadoop开源工具在可用性、可管理性、安全性得以大大提高,成为最主要的静态大数据分析工具和平台;
IBM在流计算领域的代表产品是InfoSphere Streams,是目前业界独有的流数据处理技术。Streams能够在对诸如气象信息、通讯信息、金融交易数据的管理中动态捕捉信息、进行实时分析,能够对静态数据的处理提供有效补充;
IBM在数据仓库领域的代表产品是在线交易型数据仓库InfoSphere Warehouse和分析型数据仓库Netezza。Netezza克服了传统数据仓库在面临大数据挑战时的瓶颈,充分发挥对称多处理能力,可以将大量数据整合到统一的平台上,计算能力高达TB级。通过与Cognos和SPSS等卓越的业务分析工具相结合,IBM数据仓库产品还能够实现定制化的分析功能;
信息整合与治理是IBM在业界独有的方法论和技术,其代表产品是Optim和Guardium。近期推出的Guardium 9能够将如DB2这样的传统关系型数据仓库和基于Hadoop的分布式存储系统进行统一管理,并提供完整的数据生命周期管控。此外,Guardium 9也能够管理除IBM之外的第三方数据平台,帮助客户保持在原有的系统的基础上,最小成本、最大能力地提高信息安全和质量。
IBM软件集团大中华区信息管理软件总经理卢伟权表示:“IBM的独到之处在于,其将数据库领域里多年积累的经验,和对用户需求的高度考量融合到如今的大数据平台中,通过‘增强’的理念把大数据解决方案有机整合到客户现有的数据平台上。比如,IBM帮助客户将DB2和Hadoop结合,把DB2上部分不常使用的数据迁移到Hadoop,在降低数据仓库成本的同时提高效能。IBM大数据平台的宗旨是保护客户现有的投资,在不摈弃传统数据仓库的前提下,通过信息整合和治理等工具,为客户创造效率和成本的最佳平衡。”