退一步来说,拉脱维亚电报数据 “大数据”到底是什么?你能用它做什么?最重要的是,你为什么需要知道?从本质上来说,大数据是指数据量非常大,以至于传统数据处理工具和方法(例如 Excel 电子表格或文本处理器)无法处理的数据。
“数据太大,移动速度太快,或者不符合数据库架构的约束。要从这些数据中获取价值,您必须选择另一种方法来处理它。” –福布斯
由于科技的进步,世界上90%的数据是在过去两年内产生的。
我们个人每秒都会产生1.7兆字节(一百万字节)的数据,相当于每天1.145万亿兆字节。
到 2025 年底,我们每天可能会产生大约 463 EB的数据。
为了更清楚地说明这一点,现在大多数智能手机都配备了 64 GB(十亿字节)的存储空间。64 GB 仅为 0.0000000064 EB。
大数据和三个“V”
大数据是一个相对较新的术语,生成式人工智能:2025 年销售用例 但大数据的概念(数据的收集、存储和处理)却是一个古老的概念(至少有二十年历史)。
它始于 21 世纪,当时行业分析师 Doug Laney 将大量数据的收集和利用概括为三个“V”:
- Volume(容量):指的是正在处理的数据量。
- 速度:表示处理数据的速度。
- 种类:说明正在处理的不同类型的数据。
这三个属性定义了大数据。
“大数据是包含更多种类的数据,其数量不断增加,速度也越来越快。 ” – Oracle
这就是大数据,但是……
所有这些数据从哪里来
大多数企业每天都会被大量数据淹没,在此添加您的标题文本
其中大部分数据主要来自三个来源:
- 社交数据:这些数据是从所有社交媒体平台上的网络搜索和点赞、推文、评论、分享、视频和照片等内容中收集的。
例如,每天有超过500 TB的数据被输入 Facebook 的数据库。 - 机器数据:这是通过机器学习收集的数据。例如,网络跟踪工具、图像处理、智能电表、道路摄像头、卫星、游戏和 IoT/IIoT 设备。 例如,劳斯莱斯仅模拟一次喷气发动机就会产生10 TB的数据。
- 交易数据:这是企业每天收集的交易数据。发票、付款单、存储记录和交货收据就是其中几个例子。
例如,纽约证券交易所每天产生1 TB (1 万亿字节)的新交易数据。
这些数据非常庞大。但我们该如何使用它们呢?