密码:
当前位置: 首页
>教研组>信息技术组>教学资源
62.1K
信息技术知多少?(3)——什么是大数据?
来源:计算机组 浏览次数: 发表时间:2023-02-10 [ ] [关闭页面]

1. 什么是大数据

大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式 才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2. 大数据特征

  • 容量:数据的大小决定所考虑的数据的价值和潜在的信息

  • 种类:数据类型的多样性

  • 速度:指获得数据的速度

  • 可变性:妨碍了处理和有效地管理数据的过程

  • 真实性:数据的质量

  • 复杂性:数据量巨大,来源多渠道

  • 价值:合理运用大数据,以低成本创造高价值

3. 大数据Hadoop技术

Hadoop是Apache公司开发的一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。

Hadoop的核心有以下几点:

  •  HDFS(分布式文件存储系统): 数据以块的形式,分布在集群的不同节点。在使用 HDFS时,无需关心数据是存储在哪个节点上、或者 是从哪个节点从获取的,只需像使用本地文件系统一 样管理和存储文件系统中的数据。

  •  MapReduce(分布式计算框架): 分布式计算框架将复杂的数据集分发给不同的节点去操作,每个节点会周期性的返回它所完成的工作和最新的状态。

  •  YARN(资源调度器): 相当于电脑的任务管理器,对资源进行管理和调度。

4. 大数据发展趋势

  •  数据资源化:资源化是指大数据成为企业和社会关注的重要战略资 源,并已成为大家争相抢夺的新焦点

  •  与云计算的深度结合:大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一

  •  科学理论的突破: 随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。

  •  数据泄露泛滥

(来源:https://cloud.tencent.com/developer/article/2149979  )


Produced By 大汉网络 大汉版通发布系统