中国领先的IT技术网站
|
|

拨开迷雾:大数据所带来的变革其实并没那么夸张(1)

根据最新调查结果显示,尽管现代数据技术仍然保持着快速发展势头,但目前75%的企业数据仍然属于结构化类型。

作者:核子可乐译来源:51CTO|2015-04-17 15:43

沙龙活动 | 去哪儿、陌陌、ThoughtWorks在自动化运维中的实践!10.28不见不散!


根据最新调查结果显示,尽管现代数据技术仍然保持着快速发展势头,但目前75%的企业数据仍然属于结构化类型。

拨开迷雾:大数据所带来的变革其实并没那么夸张

如今的世界仍然由关系型数据库(简称RDBMS)所掌控,不过以Hadoop及NoSQL为代表的新型技术方案已经开始快速兴起并开始在结构化数据领域留下自己的足迹及影响。

这正是由戴尔软件公司赞助的Unisphere调查报告所发现的一大关键性转变,其中指出目前75%的企业数据仍然被牢牢锁定在关系型数据库当中——对于大多数企业来说,主要为甲骨文数据库以及微软SQL Server。更令人意外的是,在全部组织机构当中,只有不足三分之一在采取积极的非结构化数据管理机制。

现在不是大数据时代么?这些企业到底还生活在什么年代?

有趣的是,虽然调查报告揭示出了NoSQL与Hadoop在接纳与实施层面的显著增长,但其最大发现却在于、真正了解企业关键性数据该如何加以管理秘诀的仍然是那些保守派数据库管理员。

从结构化方案到结构化数据

关系型数据库可以说是人类技术发展历史上的一次伟大创新。早期的数据库方案(例如IMS)强迫开发人员提前考虑查询机制设计及架构实现思路,这往往会在数据需要进行变更时对灵活性造成巨大限制。

不过,关系型数据库的SQL(即结构化查询语言)会将查询设计从架构设计当中解耦出来,从而允许开发人员以更具信心的方式专注于架构设计、从而在未来的使用中根据需要实现数据查询。这一显著转变极大提升了数据库方案的可访问性,从而使其更为强大。

不过随着非结构化或者半结构化数据的不断涌现,原本舒适安乐的关系型数据库领域开始面临着一波又一波重压与挑战。大部分此类新型数据是由被Geoffrey Moore描述为所谓参与系统所生成,甚至在过去几十年来这类数据就已经开始在记录系统中出现(例如ERP以及CRM系统)。总而言之,当数据本身在变化、速度以及容量规模方面拥有可预测性时,关系型数据库依然在发挥着不可替代的关键性作用。

但我们的大数据世界可绝对不会老老实实遵循以下预测轨迹。

即便如此,未来的到来仍然需要经过相当长的一段时间。有鉴于此,无怪乎我们会在Unisphere的调查报告中看到受访者们仍然将主要关注重点放在结构化数据身上:

·83%的企业认为,交易性数据(其中包括电子商务)的持续增长将成为所在组织内结构化数据总量增长的最主要来源,而51%的受访者则认为管理数据亦有所增长——例如ERP系统。

·尽管目前已经有越来越多的行业开始将社交数据的不断增殖纳入议事日程,但内部文档的创建仍然被视为非结构化数据总量增长的首要推动力,并得到了超过50%受访者的认同。

尽管这类数据具有关系型数据库友好属性,但同样值得指出的是,其对于NoSQL与Hadoop的依赖性也在日益提高:

·在全部正在使用MongoDB的受访者当中,约有70%比例运行的数据库数量在100套以上,30%比例所运行的数据库数量超过500套,而且这部分受访者有接近60%供职于员工数量超过五千名的大型企业。

·在目前正在使用Hadoop的受访者当中,约有70%比例运行的数据库数量在100套以上,45%比例所运行的数据库数量超过500套,而且这部分受访者有三分之二左右供职于员工数量超过一千名的企业。

既然非关系型数据技术方案的表现如此出色,为什么普及程度仍然不尽如人意?答案(也许)在于,数据库管理员应当为此负责。

点赞 0

分享:
大家都在看
猜你喜欢

热门职位+更多

读 书 +更多

戴尔“血汗工厂”调查报告

去年11月至今年8月间,香港学生组织大学师生监察无良企业行动(以下简称SACOM)通过调查发现,戴尔公司位于东莞的三家代工厂严重违反了《劳...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊
× Python最火的编程语言