https://api.vvhan.com/api/avatar/boy

技术博客分享

大数据笔记

大数据笔记

介绍

主要分为以下几个部分,首先是大数据的概述,会介绍各种类型的大数据框架和相应的技术,其次是spark的笔记

23号开始,在这个目录里面加入大数据算法的内容

大数据的概述

大数据的概述

1.1 大数据的概念

海量数据,具有高增长率,数据类型多样化,一定时间内无法使用常规软件工具进行捕捉,管理和处理的数据集合。

1.2 大数据的特征(4V说法,普遍认可的)

1,volume:巨大的数据量