当前AI技术已成为引领科技创新和发展的重要力量,但在大数据领域,我们依然面临诸多挑战。例如,如何在超大规模数据集上进行模型训练迭代,以及在真实复杂场景中进行实际应用和落地等方面。
4月23日09:00-12:45,在DataFunSummit2022:大数据计算架构峰会上,由Alluixo开源布道师傅正佳出品的大数据计算+AI论坛,旨在通过百度、第四范式、Alluxio、Zoom和阿里巴巴的案例分享,对深度学习的自动化和可解释性、大规模实时特征计算、AI语音识别算法性能提升、基于数据编排和缓存技术的训练加速、以及大规模GPU集群资源效率优化等核心问题进行多维度、更深入得探讨和方案展现。
个人介绍:傅正佳,Alluxio 开源布道师。本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。
个人介绍:熊昊一博士毕业于法国巴黎第六大学与国立电信学院,美国弗吉尼亚大学系统与信息工程系博士后。归国前曾任美国密苏里大学罗拉终身序列助理教授。2018年加入百度研究院,现担任百度大数据实验室主任研发架构师。研究方向为物联网与自动化深度学习。获得过法国国家科学中心 CNRS Samovar 杰出博士论文奖、参与飞桨团队中国电子学会科技进步一等奖、获得 IEEE TCSC Early Career Researcher Award。
演讲提纲:自动化深度学习、迁移学习与小样本技术,以及机器学习可解释性是新一代基于深度学习的人工智能带来的新技术问题。我们在这个问题上有大量原始性技术突破,并通过飞桨深度学习平台以及EasyDL、BML等商业化产品持续输入成果,并繁荣国内外AI开源与商业生态。
个人介绍:卢冕 OpenMLDB 研发负责人,第四范式系统架构师,数据库团队和高性能计算团队负责人。博士毕业于香港科技大学计算机系,专注于数据库系统和异构计算领域。
个人介绍:邱璐,毕业于美国乔治华盛顿大学数据科学专业,是 Alluxio 开源社区的 PMC maintainer,负责 Alluxio AI/ML 场景的研发工程。之前也负责研发 Alluxio 的高可用系统,日志系统,和监控系统。
余英豪,阿里巴巴GPU调度领域技术专家,负责阿里集团万卡规模的GPU AI超算中心的建设和资源效率优化。博士毕业于香港科技大学。
翁祈桢,阿里巴巴研究型实习生,香港科技大学博士在读;研究机器学习系统和 GPU 集群调度优化。
演讲主题:阿里巴巴万卡GPU AI超算中心的资源效率优化:数据剖析和工程实践
在大型生产数据中心,AI负载的数据规模、复杂度以及计算单元的异构程度,都在快速增长,这给异构资源的效率优化带来巨大挑战。我们立足阿里集团万卡规模的GPU集群,解读AI作业和异构资源的特性,剖析资源效率优化的瓶颈和挑战,以及我们在生产实践中发现的机遇和正在进行的努力。