数据科学的瑞士军刀Jupyter Notebook

时间:04-23 20:30 - 21:30
免费
收藏 15645人浏览 扫一扫
介绍
资料
评价

嘉宾介绍

主题介绍

Jupyter Notebook 是一个开源的web应用程序,允许用户创建和分享包含实时代码、公式、图形化展示和markdown叙述性文本的文档。用途包括: 数据清洗和转换、数字仿真、统计建模、数据可视化、机器学习等。目前已支持超过40种编程语言,包括Python、R、Julia和Scala等。用户的代码可以生成丰富的交互式输出:HTML、图像、视频和自定义MIME类型。

    本套Spark大数据工程师课程将采用Jupyter Notebook工具进行代码部分的教学展示。将Jupyter Notebook用于spark课程教学,可以将代码演示的live code状态保存为ipynb文件,学员可以在不考虑spark相关依赖环境的条件下直接进行live code的阅读和学习,结合markdown对代码的友好注释,达到更加高效的学习效果和体验。

    活跃的技术社区也提供了丰富的kernel支持,使得Jupyter可以在原生支持python的基础上,支持更多的语言环境,使得Jupyter Notebook可以利用Python、R和Scala等进行Apache Spark大数据交互式开发,也可以很好的和Pandas,scikitt-learn, ggplot2, TensorFlow等数据科学库结合使用。目前已经被google、微软、Netapp等知名公司广泛使用。


未上传任何附件
说点什么

—— 点击加载更多 ——

收起