更多城市

沙龙简介

INTRODUCTION

随着互联网技术的不断发展,音视频应用已经成为人们生活中不可或缺的一部分,在短视频、直播、在线会议、教育、电商等行业都有着丰富的实践应用,逐渐成为新时代互联网的基础设施之一。为了满足人们对音视频应用的需求,各种音视频技术不断涌现,使得音视频传输更加高效、稳定和可靠,同时,在5G、人工智能等技术的加持下,音视频应用将会更加智能化,从而带来更好的体验和更丰富的内容。

沙龙议程

AGENDA

13:30-14:00

签到

14:00-14:45

KVQ:基于AI的快手视频质量评价

孙明 快手 图像视频处理分析负责人

14:45-15:30

端到端语音识别中的语言模型融合技术创新与落地实践

陈智鹏 火山语音 语音识别算法研究员

15:30-16:15

用户视听体验的优化实践

刘华平 网易云音乐 音视频实验室负责人

16:15-17:00

透明视频在AR场景中的应用实践

党予博 Rokid 应用平台音视频负责人

演讲嘉宾

SPEAKER

孙明

快手 图像视频处理分析负责人

个人介绍

主要负责视频质量评价和图像处理算法开发。曾先后在百度深度学习研究院/商汤研究院工作,担任过检测/Automl/视频分析/大规模细粒度分类等多个技术方向负责人,发表CVPR/ICML/ICLR/NIPS/ICCV等顶会论文20余篇,具体信息见个人主页msunming.github.io

陈智鹏

火山语音 语音识别算法研究员

个人介绍

清华大学博士,长期从事语音识别和语音关键词检索相关技术的研究。2020年加入字节跳动火山语音团队,主要负责面向视频场景的语音识别算法研发工作。

刘华平

网易云音乐 音视频实验室负责人

个人介绍

刘华平博士,高级工程师,网易云音乐音视频实验室负责人。曾任阿里巴巴高级技术专家、盛大创新院研究员等职,是早期Google Android SDK多媒体架构的贡献者、开源AMR_WB编码器工程开发者;拥有88项技术发明专利、20余篇专业论文和15项软件著作权。

党予博

Rokid 应用平台音视频负责人

个人介绍

党予博,Rokid 应用平台音视频负责人。2016年加入 Rokid,了解 AR 行业。实现了 AR 眼镜上的音视频远程协作,应用在电力、汽车制造等领域;积极探索音视频技术在更多 AR 场景的落地,拓展音视频技术的应用领域。

精彩时刻

MOMENTS

参会指南

GUIDE

会议地点:浙江省杭州市

浙江大学校友企业总部经济园一期(浙大智源)双创会客厅A20幢2层

关注主办方

报名咨询

18515297859

媒体合作

15611889277

商务合作

13801332155

Copyright©2005- 51CTO.COM 版权所有
未经许可 请勿转载