你好,游客 登录
背景:
阅读新闻

企业勿盲目追风“大数据”:需要注意的问题

[日期:2013-10-09] 来源:ZOL中关村在线  作者: [字体: ]
  大数据的概念仍很模糊,因此企业用户应当明白——大数据到底能够做什么以及大数据有哪些局限性?因此,企业用户在制定战略时,需要弄清以下五个问题,这样才能确保最终从信息网络中获得有用的信息。
  1、了解你有什么问题?
  这似乎是一个非常明显的问题,不过,多数企业都有一种被“数据驱赶”的压力,这些公司可能在未弄清手中的问题或机遇时,就开始率先追赶大数据。你是一位无法将需要的数据填入电子表格的业务分析师吗?你无法率先获取公司的大数据吗?你是一位负责减少搜索等待时间的首席信息官吗?你是一位厌倦了等待搜索结果达数日之久的非技术用户吗?你的数据是结构化还是非结构化的?还是你面临着上述所有的问题?当然,你可能面临的一个问题是“预算”,特别是对初创企业和中小型企业而言,因为数据存储的价格及相关的硬件价格非常昂贵。
  2、支付自由软件(开放源软件)的成本是多少?
  hadoop一直有着很多争议。尽管其是一些企业所需的开放源解决方案,但是,自由并不意味着就不需要支付费用。Hadoop可以在一些日用硬件上运行,但这需要一些投资,例如需要消耗电能,并连接到其它一些设备上。
  3、考虑规模因素(包括企业规模和数据规模)
  大数据的规模动辄就以10的15次方字节来计算,但是,多数企业用户使用兆兆字节的数据。如果在兆兆字节的范围内工作的话,那么一大群机器所需的成本可能将难以支付。如果用户需要兆兆字节的数据规模,那么至少将需要一台单独的服务器,为此,用户需要尽可能降低成本,增强简捷性,以便一台服务器能够发挥作用。
  4、你的数据在哪里?
  如果用户的多数数据都是应急备用的,那么制定的战略就应当与云数据不同。例如,如果你的数据存储在 亚马逊 或Rackspace的云服务之中,那么在这样的框架内运行大数据方案将会非常有意义,因为这种数据能够很容易在那种环境下转移。不过,如果用户的多数数据都是应急备用的,而且用户还考虑在云中运行大数据,那么用户就应当三思而后行了。大数据很难随便移动,向云设备上传大数据并保持同步性将会面临很多的挑战。
  5、不同技术之间的区别是什么?
  目前用于大数据分析的技术有三大类型:软件数据库应用方案、硬件数据库应用方案和分发式数据库。软件数据库应用方案往往部署在日常硬件上,一般都是在一台独立的电脑上,这样的成本较低,而且便于构建,如果SQL server或MySQL。硬件数据库应用方案由与硬件捆绑在一起的软件组成。分发式数据库主要是指部署在多台电脑上的软件,这种数据库将便于用户平行存放和处理数据,但这种数据库结构较为复杂。




收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款