文基百科中关于大数据的定义为: 大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间的数据集[3]。
IDC对大数据作出的定义为: 大数据一般会涉及两种或两种以上数据形式。它要收集超过100TB的数据,并且是高速、实时数据流;或者是从小数据开始,但数据每年会增长60%以上[3]。
研究机构Gartner给出了这样的定义:大数据是需要具有新型的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的数据信息资产[3]。
尽管对于大数据的概念有着不同的表述,但他们都存在一个普遍的观点是,大数据与“海量数据”和“大规模数据”的概念是关联的,不同的是大数据在数据数量、数据复杂性和产生速度等方面均大大超出了传统的数据形态,也超出了原有技术手段的处理能力,并带来了前所未有的产业创新的机遇。在过去的十余年中,数据挖掘的应用在销售、人力、电子商务等各个商业领域广泛开展,并引起各国的高度关注,并取得了前所未有的成果。从这种意义上说来,大数据时代来临标志着面向数据的研究和应用已脱离了起步阶段,开始进入发展阶段。
(二) 大数据的特征
目前,大数据形成了较为统一的四个基本特征:数据规模大(Volume),数据种类多(Variety),数据要求处理速度快(Velocity),数据价值密度低(Value),即所谓的四V特性[4]。
1.数据量大
数据量大是大数据的基本属性。大数据需要海量的数据支撑,根据IDC的定义至少要有超过100TB的可供分析的数据。
2.数据类型多样
数据尽管数量庞大,但通常是事先定义好的结构化数据,这样就分为各种各样的类型。数据类型繁多,复杂多变是大数据的重要特性。
上一篇:中越旅游服务贸易合作探讨
下一篇:河南历史文化资源产业化开发研究

基于信息不对称理论的我...

基于区域差异视角货币政...

上海自贸区对长三角区域产业结构的影响探究

一带一路背景下中国对外...

超短期融资券对公司自身...

绿色壁垒对中欧纺织品服装贸易的影响

大数据金融环境下小微融...

酵母菌发酵生产天然香料...

浅谈高校行政管理人员的...

从政策角度谈黑龙江對俄...

基于Joomla平台的计算机学院网站设计与开发

压疮高危人群的标准化中...

AES算法GPU协处理下分组加...

浅论职工思想政治工作茬...

上海居民的社会参与研究

提高教育质量,构建大學生...

STC89C52单片机NRF24L01的无线病房呼叫系统设计