数据又分为结构化数据和非结构化数据 。
从名字可以看出 , 结构化数据 , 是指可以用预先定义的数据模型表述 , 或者 , 可以存入关系型数据库的数据 。

文章插图
结构化数据
例如 , 一个班级所有人的年龄、一个超市所有商品的价格 , 这些都是结构化数据 。
而网页文章、邮件内容、图像、音频、视频等 , 都属于非结构话数据 。
在互联网领域里 , 非结构化数据的占比已经超过整个数据量的80% 。
大数据 , 就符合这样的特点:数据形式多样化 , 且非结构化数据占比高 。
- Velocity(时效性)
我们还是用数字来说话:
就在刚刚过去的这一分钟 , 数据世界里发生了什么?
Email:2.04亿封被发出
Google:200万次搜索请求被提交
Youtube:2880分钟的视频被上传
Facebook:69.5万条状态被更新
Twitter:98000条推送被发出
12306:1840张车票被卖出
……
怎么样?是不是瞬息万变?
- Value(价值密度)
大数据的数据量很大 , 但随之带来的 , 就是价值密度很低 , 数据中真正有价值的 , 只是其中的很少一部分 。
例如通过监控视频寻找犯罪分子的相貌 , 也许几TB的视频文件 , 真正有价值的 , 只有几秒钟 。

文章插图
2014年美国波士顿爆炸案 , 现场调取了10TB的监控数据(包括移动基站的通讯记录 , 附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料) , 最终找到了嫌疑犯的一张照片 。
大数据的价值
刚才说到价值密度 , 也就说到了大数据的核心本质 , 那就是价值 。
人类提出大数据、研究大数据的主要目的 , 就是为了挖掘大数据里面的价值 。
大数据 , 究竟有什么价值?
早在1980年 , 著名未来学家阿尔文·托夫勒在他的著作《第三次浪潮》中 , 就明确提出:“数据就是财富” , 并且 , 将大数据称为“第三次浪潮的华彩乐章” 。

文章插图
- 第一次浪潮:农业阶段 , 约1万年前开始
- 第二次浪潮:工业阶段 , 17世纪末开始
- 第三次浪潮:信息化阶段 , 20世纪50年代后期开始
- 庄家洗盘的目的是什么?
- 在A股里,真正的人工智能龙头除了科大讯飞,还有哪几个?
- 您知道全球人工智能Al机器人行业里面的四大家族吗?您个人怎么去评价这四家公司?
- 股票中量大但是出现十字星能代表什么?
- 吃阿胶糕可不可以淡斑
- 系统 如何在公司建一个网站,来把资料上传大家一起看、编辑?
- 今天11月2日,大盘收十字星,明天将变盘,会出现大阳线吗?
- 王者荣耀10月26日更新,八大福利来袭,四周年皮肤上线,内测皮肤免费得,你还满意吗?
- 茄子黄萎病
- 以找老伴为幌子?捞外快的老大妈可恨吗?
