Apache 项目的大数据基础 详细大纲
以下列出了完整的 Apache 项目的大数据基础 大纲
单元 关键词 描述
A 部 开源 – Apache 项目
1 介绍 什么是开源软件?
为什么开源很重要?
开源运动如何影响数码转变?
2 关于 Apache Apache 世界领先的开源软件组织:
历史,组织,财务,Apache 许可证,开源软件(Open
Source Software OSS)。
OSS, 它是如何运作的?
Apache 开源软件 许可证与闭源软件许可证的主要区别。
3 Apache 软件覆盖范围 Apache Software 项目剖析
(https://projects.apache.org/)
4 Apache 大数据和 AI 相
关项目
Apache 大数据和 AI 相关项目及其影响
- 技术
- 社会影响
- 行业应用
B 部 Apache Hadoop 大数据的业界标准
5 Apache Hadoop 概述 Apache Hadoop 的概述和设计概念
6 为什么 Apache Hadoop
很有吸引力?
Apache Hadoop 与传统技术的差异:
计算和存储
可扩展性
可靠性
7 使用案例 Apache Hadoop 的真实案例
C 部 Apache HBase Apache HBase 的概述和设计概念
8 HBase 和 Hadoop HBase 在 Hadoop 大数据环境中的重要性。
- 表格访问
- 大表 Big Table
- HBase 作为 Hadoop 的 NoSQL 平台
- NoSQL
9 NoSQL 数据库 什么是 NoSQL? 为什么 NoSQL 很重要?
- 半结构化,非结构化数据的动态模式
- 使用 SQL 与 NoSQL
11
奥斯合计算机科技(上海)有限公司 OpenCertHub.com
10 HBase 使用案例 Apache HBase 的实际使用案例
D 部 Apache Spark
11 Spark 数据处理 Spark 基于大数据 Hadoop 的分析
在内存计算 (比 MapReduce 快 10 到 100 倍)
对整组数据进行操作(读/写)
机器学习操作的完美伴侣
12 Spark 机器学习 - Apache Spark 机器学习的业界标准
- 使用 Spark SQL 和 DataFrames
- 图形计算(通过 GraphX)
- 数据串流(实时计算)和实时交互式查询处理
- Spark SQL 和 DataFrames
- MLlib 机器学习,
- 算法库 提供机器所需的必要速度
- 与其他工具和语言集成
像 R,Python,Java,Scala 等。
13 使用案例 Apache Spark 的实际使用案例
E 部 Apache Kafka 大数据的快速数据
14 Kafka 数据串流 处于数据串流的大数据时代
实时流数据的重要性。
15 Apache Kafka 概述 Apache Kafka的概述和设计概念
16 使用案例 Apache Kafka 的实际使用案例
F 部 TensorFlow 一个 Python 的开源库,使机器学习更快更容易
17 What is TensorFlow TensorFlow 在 AI 中的应用
18 使用案例 TensorFlow 的实际使用案例
G 部 数据可视化 有效的视觉和行动传达
19 可视化的形式和风格 不同的数据可视化方法
- 报告
- 仪表板
- 信息图表
- 行动
20 使用案例 数据可视化实际使用案例
版权所有:杭州点赞科技有限公司 | 浙ICP备16039906号 Copyright©2016 itdks.com
—— 点击加载更多 ——
收起