沙龙简介
INTRODUCTION
随着互联网技术的不断发展,音视频应用已经成为人们生活中不可或缺的一部分,在短视频、直播、在线会议、教育、电商等行业都有着丰富的实践应用,逐渐成为新时代互联网的基础设施之一。为了满足人们对音视频应用的需求,各种音视频技术不断涌现,使得音视频传输更加高效、稳定和可靠,同时,在5G、人工智能等技术的加持下,音视频应用将会更加智能化,从而带来更好的体验和更丰富的内容。
沙龙议程
AGENDA
签到
KVQ:基于AI的快手视频质量评价
孙明 快手 图像视频处理分析负责人
端到端语音识别中的语言模型融合技术创新与落地实践
陈智鹏 火山语音 语音识别算法研究员
用户视听体验的优化实践
刘华平 网易云音乐 音视频实验室负责人
透明视频在AR场景中的应用实践
党予博 Rokid 应用平台音视频负责人
演讲嘉宾
SPEAKER
孙明
快手 图像视频处理分析负责人
主要负责视频质量评价和图像处理算法开发。曾先后在百度深度学习研究院/商汤研究院工作,担任过检测/Automl/视频分析/大规模细粒度分类等多个技术方向负责人,发表CVPR/ICML/ICLR/NIPS/ICCV等顶会论文20余篇,具体信息见个人主页msunming.github.io
陈智鹏
火山语音 语音识别算法研究员
清华大学博士,长期从事语音识别和语音关键词检索相关技术的研究。2020年加入字节跳动火山语音团队,主要负责面向视频场景的语音识别算法研发工作。
刘华平
网易云音乐 音视频实验室负责人
刘华平博士,高级工程师,网易云音乐音视频实验室负责人。曾任阿里巴巴高级技术专家、盛大创新院研究员等职,是早期Google Android SDK多媒体架构的贡献者、开源AMR_WB编码器工程开发者;拥有88项技术发明专利、20余篇专业论文和15项软件著作权。
党予博
Rokid 应用平台音视频负责人
党予博,Rokid 应用平台音视频负责人。2016年加入 Rokid,了解 AR 行业。实现了 AR 眼镜上的音视频远程协作,应用在电力、汽车制造等领域;积极探索音视频技术在更多 AR 场景的落地,拓展音视频技术的应用领域。
参会指南
GUIDE
会议地点:浙江省杭州市
浙江大学校友企业总部经济园一期(浙大智源)双创会客厅A20幢2层
关注主办方
报名咨询
18515297859
媒体合作
15611889277
商务合作
13801332155