随着互联网、云计算、物联网等网络技术快速发展和智能终端的广泛应用,以及智慧城市的大范围建设,全球的数据量出现指数级的爆炸式增长——大数据时代已经到来。作为新的信息金矿,大数据所带来的价值正在影响着各个行业。当前很多运营商为了提高自身的竞争力,都纷纷加大了对大数据平台的建设投入,但同时,不断飙升的管理维护成本和安全架构复杂化也让大数据的运营发展面临巨大挑战:
1.大数据时代的安全架构变得愈发复杂,各种威胁数据安全的案例层出不穷,管理大数据平台的安全需求也在持续增加,需要各种新技术应对新的风险和威胁。
2.传统网管一般利用性能评价体系KPI对数据应用平台进行状况评估,特别在面对多个大数据平台时,不能真实反映平台的运行状态和性能状况。
3.故障响应不及时,告警系统未智能化。大部分应用平台仅能将告警生成在各自的系统平台内,需要管理员定期去提取、查看,遇到故障也只能手工排除,可能会导致问题发现不及时,故障排查困难。
4.据统计,大数据平台中,结构化数据只占15%左右,其余的85%都是非结构化的数据,它们来源于社交网络、互联网和电子商务等领域。对此应提供关键安全策略以支持结构化与非结构化数据的管理。
针对上述市场需求,业内领先的信息安全技术公司蓝盾股份提出了大数据应用平台的安全管理方案,运用智能化、流程化、自动化、可量化、可视化等安全战略手段,构建安全、高效、经济的监管体系,帮助用户准确感知当前大数据平台的整体性能,实现大数据平台在操作、通信、存储、漏洞方面的全方位安全防护,达到提高工作效率、降低故障排除时间和维护成本的最终目的。同时,该安全管理方案还在以下几方面呈现出亮点:
大数据平台是一个面向主题的、集成的、随时间而变化的、不容易丢失的数据集合,支持各企事业单位管理部门的决策过程。采用基于Hadoop集群环境下的统计分析和大数据挖掘等技术,通过将各类日志资源和事件信息按照业务、地域、时间、涉密程度等***性和内在联系,进行归纳、分类、关联性以及趋势预测等分析,从海量数据中寻找有用的、有价值的信息,为不同层面、不同业务系统提供信息支持。
2、大数据平台的质量体验
用户体验质量QoE是用户端到端的概念,是指用户对大数据应用平台的主观体验,是从用户的角度感觉到的系统的整体性能。本安全管理系统以用户体验为中心,从KQI(业务层)、KPI(系统层)、PI(设备层)多个维度出发,注重用户对业务的端到端主观体验(QoE),从用户的角度来感受系统的整体性能,对用户所使用的业务的关键参数进行端到端的业务探测,主动感知用户的体验,真实全面反映系统性能,以可量化的方式,从业务应用可用性角度来监测大数据应用平台的质量状况和运营状况。
3、全面的智慧安全
大数据时代安全架构在变得愈发复杂,安全需求也在持续增加,需要各种新兴技术应对新型风险和威胁。但这势必增加企业管理的复杂度,投资的复杂度并造成技术成本压力。本系统采取深度防御策略,能主动对大数据应用平台进行漏洞扫描,并通过安全互联的方式实现全面整体的安全防御,实时获取安全信息,对其进行关联性分析,更快、更早的发现安全威胁。
4、安全基线自学习
为有效监测大数据应用平台的配置信息变更情况,安全管理系统采集大数据应用平台的配置信息,得出相应的安全基线。通过自动学习该基线,安管系统站在全局的角度对各大数据平台进行自动监测,并将监测结果与基线进行比对,以判断是否有配置变更,快速发现系统操作的异常行为。
5、故障快速定位及预警
系统重视故障管理的主动性,通过多个维度(物理和虚拟服务器、网络设备、数据库、云资源以及业务平台的运行状况)的检测视图,在故障发生之前,能主动检测到系统平台关键要素的状态变化并发出预警,管理员便可准确并深度定位应用性能问题的根源,及时修复故障问题,以免服务中断或数据外泄造成不可挽回的损失。
6、策略集中配置,统一下发
系统采用安全策略的集中配置及下发来对各大数据应用平台进行统一管理。此办法在面对管理多个大数据应用平台时优势明显。传统的策略配置是逐个“登录--配置”的过程,工作量成倍增大,且有可能造成安全策略冲突和形成漏洞。策略的统一配置下发扭转了该局面,如在安全系统上统一配置数据采集/存储策略、去隐私化策略、漏洞扫描规则、用户敏感信息行为处理规则、补丁管理策略,并分发至各个应用平台执行,大大简化了配置过程,避免策略的重复配置操作,提高运维管理能力等。
7、基于云计算架构的异构数据管理
云计算是一种基于互联网的、通过虚拟化方式共享资源的计算模式,存储和计算可以按需分配、动态部署、动态优化、动态收回。云数据服务通过总/分库的方式,利用分布数据库特性,将各类异构数据的存储和处理交给大量的分布式计算机(服务器),它们承担了庞杂的分析、计算工作,以服务的方式提供分享和交互,加速了从数据共享到信息共享再到服务共享的构想,提高了资源的利用效率和数据的安全性,降低了开发人员的工作量和网络负担,实现结构化数据和非结构化数据的全面整合,使各类数据有序联合起来,形成完整而统一的大数据信息资源。