Apache Hadoop项目大数据基础(5月15日)

时间:04-27 14:30 - 16:30
嘉宾:


1
¥4.95
收藏 2054人浏览 扫一扫
介绍
资料
评价

嘉宾介绍

1

主题介绍

Apache 项目的大数据基础 详细大纲

以下列出了完整的 Apache 项目的大数据基础 大纲

单元 关键词 描述

A 部 开源 – Apache 项目

1 介绍 什么是开源软件?

为什么开源很重要?

开源运动如何影响数码转变?

2 关于 Apache Apache 世界领先的开源软件组织:

历史,组织,财务,Apache 许可证,开源软件(Open

Source Software OSS)。

OSS, 它是如何运作的?

Apache 开源软件 许可证与闭源软件许可证的主要区别。

3 Apache 软件覆盖范围 Apache Software 项目剖析

(https://projects.apache.org/)

4 Apache 大数据和 AI 相

关项目

Apache 大数据和 AI 相关项目及其影响

- 技术

- 社会影响

- 行业应用

B 部 Apache Hadoop 大数据的业界标准

5 Apache Hadoop 概述 Apache Hadoop 的概述和设计概念

6 为什么 Apache Hadoop

很有吸引力?

Apache Hadoop 与传统技术的差异:

计算和存储

可扩展性

可靠性

7 使用案例 Apache Hadoop 的真实案例

C 部 Apache HBase Apache HBase 的概述和设计概念

8 HBase 和 Hadoop HBase 在 Hadoop 大数据环境中的重要性。

- 表格访问

- 大表 Big Table

- HBase 作为 Hadoop 的 NoSQL 平台

- NoSQL

9 NoSQL 数据库 什么是 NoSQL? 为什么 NoSQL 很重要?

- 半结构化,非结构化数据的动态模式

- 使用 SQL 与 NoSQL

11

奥斯合计算机科技(上海)有限公司 OpenCertHub.com

10 HBase 使用案例 Apache HBase 的实际使用案例

D 部 Apache Spark

11 Spark 数据处理 Spark 基于大数据 Hadoop 的分析

在内存计算 (比 MapReduce 快 10 到 100 倍)

对整组数据进行操作(读/写)

机器学习操作的完美伴侣

12 Spark 机器学习 - Apache Spark 机器学习的业界标准

- 使用 Spark SQL 和 DataFrames

- 图形计算(通过 GraphX)

- 数据串流(实时计算)和实时交互式查询处理

- Spark SQL 和 DataFrames

- MLlib 机器学习,

- 算法库 提供机器所需的必要速度

- 与其他工具和语言集成

像 R,Python,Java,Scala 等。

13 使用案例 Apache Spark 的实际使用案例

E 部 Apache Kafka 大数据的快速数据

14 Kafka 数据串流 处于数据串流的大数据时代

实时流数据的重要性。

15 Apache Kafka 概述 Apache Kafka的概述和设计概念

16 使用案例 Apache Kafka 的实际使用案例

F 部 TensorFlow 一个 Python 的开源库,使机器学习更快更容易

17 What is TensorFlow TensorFlow 在 AI 中的应用

18 使用案例 TensorFlow 的实际使用案例

G 部 数据可视化 有效的视觉和行动传达

19 可视化的形式和风格 不同的数据可视化方法

- 报告

- 仪表板

- 信息图表

- 行动

20 使用案例 数据可视化实际使用案例

未上传任何附件
说点什么

—— 点击加载更多 ——

收起