机器学习是一门让计算机在非精确编程下进行活动的科学,计算机科学家认为机器学习是人工智能研究的核心内容,统计学家认为机器学习是统计学习的延伸。
在大数据盛行的今天,机器学习促进了车辆无人驾驶、高效语音识别、精确网络搜索及人类基因组认知的大力发展。
机器学习几乎无孔不入,你可能已经在不知不觉的情况下使用过无数次,对于机器学习的初学者或者进阶者,还存在很多类似的疑问。例如:如何构建合理的特征工程,组合、分解、选择数据,从而使得正确理论带来应用的合理性;如何有效解决算法所带来的过拟合、维度灾等问题;如何评估所构建的算法的可靠性,以及解释算法的真实性。
携程技术沙龙此次的云海机器学习Meetup,将通过最真实的案例,从模型调优、特征转换和评估等多角度、多维度呈现机器学习在不同领域方面的应用。
云龙风虎,海纳百川,在这个春暖花开的4月,让我们和各位爱学习的小伙伴们一起来探讨机器学习技术,互相交流,共同进步。
活动信息
【时间】2017年4月22日(周六)13:00-17:30
【地点】上海市长宁区金钟路968号,凌空SOHO 12号楼
【议程】
13:00-13:30 签到
13:30-14:10 《机器学习在携程酒店图像数据中的应用》-李翔
14:10-14:50 《携程酒店浏览客户流失概率预测》-陈无忌
14:50-15:30 《去哪儿酒店算法服务平台》-张中原
15:30-15:50 茶歇
15:50-16:30 《机器学习在一号店商品匹配中的实践》-刘洋
16:30-17:30 《优化模型不得不想的几个问题——理论与案例》-胡淏
议题介绍
李翔,携程高级数据分析师,毕业于中山大学。现阶段主要负责携程酒店图像数据的分析、建模和处理。研究兴趣为计算机视觉和机器学习,包括人脸/行人/行为识别、大规模图像检索、迁移学习和距离学习等,在包括ICCV和CVPR在内的学术会议和国际期刊上发表十余篇学术论文。
携程拥有数以亿计的酒店图像数据,图像的处理和维护需要花费大量的人力成本,如何利用机器学习有效地减少图像上的人工干预成为了急需解决的问题。本次分享围绕这一问题展开,分享深度学习和迁移学习等机器学习技术在携程酒店图像数据中的若干实际应用和实践经验,以及携程酒店图像数据未来的机器学习发展方向。
听众收益
1、了解现阶段机器学习技术在携程酒店图像数据的具体应用场景;
2、了解相关深度学习和迁移学习模型的基本原理和实际应用细节;
陈无忌,就读于中国科学技术大学计算机学院,15 级硕士研究生。研究方向机器学习、大数据、智能交通等。在校期间多次参加大数据竞赛,携程云海平台比赛中,两次和队伍一起获得第一名。曾在科大讯飞实习,实现基于信令的道路匹配算法,并申请专利。
客户流失率是考量业务成绩的一个非常关键的指标。根据历史数据建立模型,预测客户流失概率,可以找出用户流失的因素,从而完善产品,提升用户体验,减少客户流失概率。
拿到一个预测问题,需要做哪些分析?如何提取特征?如何选择合适的机器学习模型?如何调整模型的参数?对于一个大数据比赛的赛题,有什么常见的套路?
一个数据挖掘的任务包含了数据预处理,特征提取,模型建立,模型融合等步骤,本次将基于模型原理以及比赛实战经验,分享如何解决客户流失概率的预测问题。
听众收益
1.了解一个数据挖掘问题的常见处理方法;
2.了解如何有效的抽取数据中的特征;
3.了解Xgb的基本原理及模型调参方法;
4.了解一些提升机器学习模型准确率的方法;
张中原,2010年加入去哪儿网,先后从事交易系统、酒店数据、公司基础平台与组件、存储和监控等相关工作,曾长期担任应届生技术培训和指导。技术涉猎广泛、代码洁癖、关注工程师开发效率和质量,系统设计和易用性,代码的实际效益。
对于机器学习和算法本身,如今开放的互联网上已经有足够多的资料学习和参考,而将这些智慧和技术实际应用到现实场景中,我们又会遇到一系列的问题:
模型如何快速上线?如何监控与评估?多种类型的模型怎么办?迭代优化如何对业务方透明?训练和预测时的特征转换如何统一?
在过去的一段时间内,我们经过一系列的优化和迭代,算法服务平台逐渐成型,实现了算法平台和业务系统无缝连接,提高模型反馈到业务系统的效率。这里跟大家分享我们在解决这些问题时所做的努力与尝试。
听众收益
1、机器学习在实际系统应用时,如何走完最后一个环节;
2、打造算法平台时将会遇到哪些问题及如何解决;
3、系统的设计和实现,如何兼顾系统易用性和性能;
刘洋,1号店搜索部算法工程师,机器学习的爱好者和实践者。上海大学博士,在语义分析、知识发现有深入研究。
电子商务通过服务和商品给用户带来极致体验。其中,服务包括浏览体验、配送体验和客服体验等,而商品则包括了商品质量、商品价格以及商品丰富度等。正所谓知己知彼、百战不殆,及时了解友商的商品信息,从海量非结构化的商品信息中发现商品的匹配关系,对商品定价、商品选品、用户推荐等场景都发挥着基础性作用。
1号店的商品匹配任务历经规则匹配、模型匹配、机器学习匹配等阶段,不断提升商品匹配的召回率和准确率,支持了业务部门的用户端和运营端需求。如何解决商品匹配过程中遇到的困难和陷阱,本次演讲将分享其中的实践总结。
听众收益
1、了解商品匹配问题的解决思路;
2、了解高质量模型的优化过程;
3、了解机器学习的实战经验。
胡淏,美团算法工程师,毕业于哥伦比亚大学。先后在携程、支付宝、美团从事算法开发工作。了解风控、基因、旅游、即时物流相关问题的行业领先算法方案与流程。
机器学习无疑是近年来备受瞩目的技术热点,也是算法RD普遍掌握的技能。模型效果没达到预期?又如何诊断一个模型潜在的问题?初来乍到,许多人很难找到切入点。数据的噪音、模型的过拟、特征不够精细、不明确的业务问题、项目的排期... 这些问题的优先级是什么?如何对症诊断下药?
这是我多年作为一线算法工程师反复去思考的问题,也是一线算法同学都在思考、历练、取得成绩的核心命题。本次将分享这些年算法的经历,和我眼中优秀的模型分析/工程师应该具备的素质与方法论。
听众收益
1. 对机器学习优化问题有结构化的解决方案;
2. 了解一个大规模的机器学习项目 从0-1,从1 - CEO prize的过程;
3. 了解前沿风控体系的构建;
活动路线
上海地铁2号线淞虹路地铁站,5号口出,步行约15分钟(手机端可长按保存图片后,放大查看路线指引)。
中国科学技术大学计算机学院硕士研究生
时间:04-22 13:00 - 17:30
地点:上海长宁金钟路968号凌空SOHO