多大的数据,才能称为大数据呢?

2024-11-07 16:38:33
推荐回答(3个)
回答(1):

多大容量的数据才算大数据,其实并没有定论,所谓的大数据的规模压根没有具体的标准,而仅仅规模大也不能算做是大数据。但另一方面,我们需要注意的是,目前的数据确实在不断的变大,据国际公司IBM研究,截止到2020年,全世界的数据规模将达到今天数据量的几十倍,而今天的数据也早已只能用ZB这样庞大的计算单位来进行统计了。

那么,既然大数据并不是用大容量来衡量的,那究竟什么是大数据呢?

这就不得不引用之前提到的IBM公司了,他们自己对于大数据有一套著名的5V理论:Volume(大量)、Velocity(高速)、Variety(多样性)、Value(价值)以及Veracity(真实性)。

1.Volume(大量)

刚才也说道,大数据并不是用大容量来衡量的,但大数据一定代表着这个数据具有一定的量级了,以至于在一台机器上并不能处理,必须借助分布式运算的方式来进行操作。

2. Velocity(高速)

ZB级别的数据带来的并不仅仅是数据储存方面的问题,更代表着数据处理的速度必须到达一定的界值,不然我们很难有秒级的千人千面的广告推送。

3. Variety(多样性)

当下如此爆发性增长的数据其实更多的是非结构化数据,而这种数据是与我们传统印象中Excel储存的二维表是不同的。非结构化数据更多的是以声音、图像、地理位置、视频等形式存在。而这样的数据,则代表着更高的数据处理要求。

4. Value(价值)

大数据就是高价值的代名词么?并不是,反而大数据代表着价值密度更低的数据。用一个成语来形容如今的数据分析或者数据挖掘,那就是大浪淘金。而究竟如何在一个大数据中提取有价值的信息呢,不得不说,这是一个机遇也是一个挑战。

5. Veracity(真实性)

大数据就一定真实么?并没有。为什么这么说呢,想象一下当下泛滥的作弊流量吧,你还敢确保你的用户数据并没有虚假的吗?所以,大数据也是可以造假的,我们一定要有一双智慧的眼睛却辨别大数据的好坏。

回答(2):

    有人说拥有了数据,就仿佛拥有了全世界,数据所带来的是人类远远想不到的,随着时代的发现,大数据的新兴发展,给世界带来无限的可能,对于大数据,数据的含量是巨大的。对于大数据,没有明确的大小规定,大数据量和大数据是完全不同的两个概念,如果数据仅仅是规模大,这也不能称作大数据。大数据应该说是大计算再加数据量。

    单从数据量的角度来说,数据单位量达到PB、TB等,数据就会被称为大数据。这个单位所包含的数据量是非常巨大的。有人说,1PB所面对的数据,如果仅仅向磁盘写入1PB的数据就要耗费200多天,并且全人类的总资产加起来也不到1P美元,还有以TB单位的数据相当于全世界沙滩全部的沙子量,大小永远是相对的,更多的是运用数据,发现数据背后的价值,这是要经过精心的分析才会被开发出来。

     规模也是要靠不同的维度去衡量,从时间序列累积大量的数据,还有在深度上更加细化的数据。例如再小的数据,纵向积累时间长了,也可以累计成大的数据,横向积累也可以与其他数据关联起来也可能形成大数据,因此大数据中的数据都是彼此关联,具有价值的。

  对于大数据,其中“大”是必要条件,但非充分条件,有了数据也不会处理挖掘,也没用,大数据的核心价值在于开发运用,有了大数据的支撑才有智能的出现。

回答(3):

企业端(B端)数据近十万的级别,就可以称为大数据;
个人端(C端)的大数据要达到千万级别。
收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据。
截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。