2019年1月Cloudera宣布与Hortonworks合并后将传统AI驱动数据管理与端到端数据管理方式相结合,创建了全球领先的下一代数据平台CDP(Cloudera Data Platform)。Cloudera希望为企业提供一个本身即是多云且多功能的平台,用于管理企业数据云。通过统一的平台界面,对数据进行整个生命周期管理,并提供一致的安全和治理服务。
2019年11月,Cloudera发布了CDP私有云Base版本,融合了CDH和HDP超过35个以上的开源组件。CDP私有云Base版本主要用于本地部署,采取传统的存储和计算耦合架构,便于原CDH和HDP用户的升级。
本次活动将详解CDP与原有CDH组件的差别,以及从CDH到CDP的我们所建议的三种具体升级方案。
会议议程
05/27 12:30 - 13:30
自助午餐
05/27 13:30 - 13:45
从CDH到CDP技术升级简介
综述CDP的产品架构以及CDH到CDP的原地升级和拷贝升级两个方案。
05/27 13:45 - 14:45
如何从CDH5升级到CDP7
CDP7是融合CDH和HDP所有优势组件的一个全新版本,提供了很多全新的功能,也集成了很多CDH5中没有的一些组件比如Ozone,Flink等,因为CDH5现已停止支持,对于CDH5的用户首先会关心如何升级/迁移到CDP7。这里重点介绍原地升级与拷贝升级的方法,同时会分享从CDH5升级到CDP7以后,Hive,Spark,HBase等相关的代码如何改造。
05/27 14:45 - 15:00
升级问题现场问答
05/27 15:00 - 15:15
茶歇
05/27 15:15 - 16:00
Hive 3.X 与 Hive 1.X的差异及使用方式介绍
Hive 3.X 对于 CDH的用户来说属于比较新的内容,部分用户在升级至CDP后对Hive 3.X的变化并不完全了解。本段内容主要介绍Hive3.X对比Hive1.x在设计上及使用方式上的差异,以及其众多新特性的功能介绍。
05/27 16:00 - 16:45
Cloudera 实时数据处理业务的场景及相关套件
实时数据处理在近几年得到的长足的发展,得益于社区的贡献,Apache Flink 已经成为实时数据处理的标准化工具。于此同时,Apache Kafka 社区也逐步的推出了Kakfa Stream , Kafka Connects 等实时数据处理工具。本次演讲以实时数据仓库为中心,从整体架构的角度分析并展实时数据仓库各个技术环节中的可选技术及相关建议以及Cloudera的实时数据仓库最佳实践。
时间:05-27 13:30 - 16:45
地点:明天广场