首页 » 博客 » 大数据:它是什么、我们为什么需要它以及如何使用它

大数据:它是什么、我们为什么需要它以及如何使用它

退一步来说,拉脱维亚电报数据 “大数据”到底是什么?你能用它做什么?最重要的是,你为什么需要知道?从本质上来说,大数据是指数据量非常大,以至于传统数据处理工具和方法(例如 Excel 电子表格或文本处理器)无法处理的数据。

“数据太大,移动速度太快,或者不符合数据库架构的约束。要从这些数据中获取价值,您必须选择另一种方法来处理它。” –福布斯

由于科技的进步,世界上90%的数据是在过去两年内产生的。

我们个人每秒都会产生1.7兆字节(一百万字节)的数据,相当于每天1.145万亿兆字节。

到 2025 年底,我们每天可能会产生大约 463 EB的数据。

为了更清楚地说明这一点,现在大多数智能手机都配备了 64 GB(十亿字节)的存储空间。64 GB 仅为 0.0000000064 EB。

大数据和三个“V”

大数据是一个相对较新的术语,生成式人工智能:2025 年销售用例 但大数据的概念(数据的收集、存储和处理)却是一个古老的概念(至少有二十年历史)。

它始于 21 世纪,当时行业分析师 Doug Laney 将大量数据的收集和利用概括为三个“V”:

  • Volume(容量):指的是正在处理的数据量。
  • 速度:表示处理数据的速度。
  • 种类:说明正在处理的不同类型的数据。

这三个属性定义了大数据。

大数据是包含更多种类的数据,其数量不断增加,速度也越来越快。 ” – Oracle

这就是大数据,但是……

所有这些数据从哪里来

大多数企业每天都会被大量数据淹没,在此添加您的标题文本
其中大部分数据主要来自三个来源:

  • 社交数据:这些数据是从所有社交媒体平台上的网络搜索和点赞、推文、评论、分享、视频和照片等内容中收集的。
    例如,每天有超过500 TB的数据被输入 Facebook 的数据库。
  • 机器数据:这是通过机器学习收集的数据。例如,网络跟踪工具、图像处理、智能电表、道路摄像头、卫星、游戏和 IoT/IIoT 设备。   例如,劳斯莱斯仅模拟一次喷气发动机就会产生10 TB的数据。
  • 交易数据:这是企业每天收集的交易数据。发票、付款单、存储记录和交货收据就是其中几个例子。
    例如,纽约证券交易所每天产生1 TB (1 万亿字节)的新交易数据。

这些数据非常庞大。但我们该如何使用它们呢?

滚动至顶部