大数据的主要特征有哪些,大数据的特征

描述

 从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术,明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

 在莱尼的理论基础上,IBM提出大数据的4V特征得到了业界的广泛认可:第一,数量,即数据巨大,从TB级别跃升到PB级别;第二,多样性,即数据类型繁多,不仅包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等;第三,速度,即处理速度快;第四,真实性,即追求高质量的数据。

 数据体量巨大

 容量大是大数据的首要特征,随着网络的发展,迫切的需要足够大的容量去统计分析以及预测大规模的数据。最开始的mp3时代仅仅只是mb级的存储,但是已经能满足很多人的要求了。随着信息技术的高度发展,存储单位也慢慢的发生了演变。从大家耳熟能详的jb存储到了tb存储,乃至现在有了pb,eb等存储。

 数据速度快

 大数据的数据产生、处理和分析的速度在持续加快。加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。业界对大数据的处理能力有一个称谓——“1秒定律”,也就是说,可以从各种类型的数据中快速获得高价值的信息。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别。

 数据类型繁多

 大数据的数据类型繁多,传统IT产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。

 现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如XML、邮件、博客、即时消息、视频、照片、点击流、日志文件等。企业需要整合、存储和分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。因为大数据的来源非常广泛,所以多样性成为了大数据的另一大特点。在任何形式下,所获取的来源都是可以使用的,目前为止应用比较广泛的有淘宝,网易云,头条等等。这些平台通过对用户的数据进行分析,从而对应的推荐一些用户比较喜欢的东西。

 真实性

 数据的重要性就在于对决策的支持,数据的规模并不能决定其能否为决策提供帮助,数据的真实性和质量才是获得真知和思路最重要的因素,是制定成功决策最坚实的基础。追求高数据质量是一项重要的大数据要求和挑战,即使最优秀的数据清理方法也无法消除某些数据固有的不可预测性。

 在处理这些类型的数据时,数据清理无法修正这种不确定性,然而,尽管存在不确定性,数据仍然包含宝贵的信息。我们必须承认、接受大数据的不确定性,并确定如何充分利用这一点。
 

 文章整合自:个人图书馆、百度服务商点亮工场、蚂蚜网

审核编辑:鄢孟繁

相关推荐

相关文章