三位大咖亮相WOT AI峰会机器学习会场,揭秘AI如何赋能行业应用

原创
网络
11月30下午,A会场机器学习分论坛召开,三位资深专家受邀出席发表精彩演讲,会后51CTO将专家发言整理成文,希望他们的演讲内容精华对大家有所帮助。

【51CTO.com原创稿件】2018年,人工智能作为人类开创未来最耀眼的技术之一,正在深刻影响着全球产业结构、商业模式、城市形态以及人类生活工作方式。如何让人工智能技术为行业赋能,让众多行业共享科技生产力,是数字化转型浪潮下的重要课题。作为推动人工智能务实创新的年度重要活动,11月30日-12月1日,WOT2018全球人工智能技术峰会在北京•粤财JW万豪酒店盛大召开。60+国内外人工智能一线精英大咖与千余名业界专业人士齐聚现场,分享人工智能的平台工具、算法模型、语音视觉等技术内容,探讨人工智能如何赋予行业新的活力。

WOT,AI,机器学习

  11月30下午,A会场机器学习分论坛召开,三位资深专家受邀出席发表精彩演讲,会后51CTO将专家发言整理成文,希望他们的演讲内容精华对大家有所帮助。

  杨雪峰 深圳追一科技有限公司高级研究员

  阅读理解技术探索与在企业服务中的应用

WOT,AI,机器学习,杨雪峰

  杨雪峰的分享主要有两部分重点,首先他介绍了机器阅读理解的现状、市场上前沿技术,以及机器阅读理解的背景、意义、方法论。其次他分享了AI技术落地的难点与阅读理解技术的产品化实践。

  在杨雪峰看来,机器阅读理解通俗来说就是针对给定的问题找到用户需要的答案,答案可能是文字,也可能是图片、数字、符号、片段,不同的答案形式,难度也有很大区别,通常通过不同的数据集来处理。他在现场介绍了目前主流的四个英文数据集,即谷歌发明的CNN & Daily Mail数据集、微软MCTest数据集、斯坦福创建的SQuAD1&2数据集,以及微软的MS MARCO万量级数据集。此外中文数据集做的比较好的有百度的DuReader和科大讯飞的CMRC数据集。

  杨雪峰还在现场举了几个机器阅读理解的应用场景:

  一是客服和新员工培训场景。由于客服流动性较大,企业需要尽量减少培训环节,让客服人员尽快上岗,熟悉操作手册和业务常用文档,而通过机器阅读理解产品,可以第一时间解答员工疑问,帮助员工熟悉业务;

  二是在金融领域里提供专业咨询服务。由于人手有限,基金经理无法回答所有人的提问,但是通过机器阅读理解,可以让用户自主查询到详尽的文档和数据,提升用户体验;

  三是儿童兴趣早教,可以给儿童提供用于教育应用的通用知识问答系统,例如儿童早教机、婴幼儿辅导等环节,孩子们可以在娱乐中丰富自己的知识。

  杨雪峰在现场还以他们为南方航空提供的解决方案现身说法,他表示南方航空每周都会推出各种活动,每当这时客服人员都需要解答大量多的问题,追一科技会从上千篇文档集中筛选出最容易被咨询的文档,建立模型通过自动抽取功能,推荐很多问答字段,简化企业标注流程,并做出细致的标注,尽可能让用户简单使用,满足高并发访问场景。“未来这个领域还有很多挑战,尤其是金融客户大多都是私有化部署,数据是一个闭环系统,他们希望能够叠加自己的数据训练新的模型,而让服务商只提供产品逻辑即可。”

WOT,AI,机器学习,杨雪峰

  俞圆圆 杭州威佩网络科技有限公司CTO

  深度学习在电子竞技行业中的应用

WOT,AI,机器学习,俞圆圆

  俞圆圆在一开场就表示,传统体育行业的数据分析方式并不适用于电子竞技领域。同样是数据搜集,传统体育行业是以人工搜集和技术搜集同步进行,例如某个球员又进了进个球,需要人工根据现场情况进行登记,而且更多的是依赖现场专业人员进行解读。而这些数据分析的手段在电子竞技领域则行不通,例如电子竞技选手往往一天可以打几十场游戏比赛,游戏迭代快,游戏规则和逻辑多变,传统数据分析很难跟得上变化节奏。除此之外,游戏里角色复杂,每个角色的装备、团队贡献值、伤害力等多重指标都需要做一个数据分析和展示。更特殊的是,电竞行业参与者的主观意识都很强,认知差别大,很难套用传统体育专家分析的模式。“在过去的电竞数据分析中,很多的团队使用的传统数学模型,往往会被玩家和用户指责不够客观或是不够全面。使用深度学习的话,就可以很有效的规避这些问题。”

  对比传统数学模型,深度学习具有可塑性、普适性、高效性三大优势。俞圆圆指出,深度学习的模型可以是很多很多的building block,可以把很多问题全部变成工程化的问题,经过训练后很快就可以搭建模型,而且模型很容易被移动到另外一个项目上。当然,俞圆圆也坦言,电竞行业的深度学习也有缺点,需要非常多的训练数据,而且也不能直接学习和理解。“当深度学习和电子竞技游戏结合以后,处理大量的数据也不需要人工因素的干扰,客观性更好,而且可以快速完整处理大批量数据。”

  演讲最后,俞圆圆详细介绍了一个胜率分析项目AlphaMao,来展示他们如何运用深度学习的技术和模型解决电竞问题的。在半年的时间中,模型每天都在通过学习新的比赛样本来更新自己的模型,训练数据来自六千万场电竞比赛。由于游戏规则更迭很快,所以他们既要学习过去的数据,又要更新最新的数据,而且要随时调整提高更新数据的权重比例,最终模型拥有60%的总体准确率以及高达97.6%的相对准确率。

  “未来我们关注的方向主要有三个。” 俞圆圆透露,他们将在模型中添加上时间数据,争取可以做到实时胜率分析,而且还将对对胜率进行分析,为玩家提供更直观有效的建议。除此之外,他们希望深度学习模型可以轻易的移植到其他游戏中。

  贾荣飞 淘宝高级算法专家

  重新定义人货场——端上智能,情景计算

WOT,AI,机器学习,贾荣飞

  贾荣飞在演讲中谈到,消费者在购买东西的时候,不同场景下有不同的需求,例如在公司里由于时间紧迫,人们希望更快下单,但是如果是在家里,人们则更愿意舒舒服服躺在床上慢慢浏览购物页面。鉴于此,淘宝希望能够重新定义人货场,加大对用户手机上信息的理解,改变电商与消费者多的交互模式,从而推动电商智能化发展。

  当越来越多的货品通过电商销售,如何准确理解消费者的需求变得更加重要。贾荣飞认为,智能手机时代给这一切提供了可能,它可以定位用户的实时状态,然后淘宝通过情景计算技术对用户实时状态进行分析和理解,更聚焦地了解客户此次此刻需要什么。“这比原来的推荐搜索更进一步理解用户。”他坦言,这里也存在很多难点,一来用户信息量很大,如何在复杂信息中抽取有效信息?二来随着处理的数据量越来越大,电商的计算能力如何支撑更大的信息量和更复杂的模型?这是非常有挑战性的课题。

  据贾荣飞介绍,淘宝对于情景计算的诉求主要是希望能够实时处理用户的订单,对于单一用户希望有更大的算力进行服务,在这样的需求下,淘宝毫不犹豫地选择将计算力在客户端部署为主,在云上更多的是构建全局模型,用户之间实现信息共享,整体情景计算的架构设计“以端为主,以云为辅。”而深度学习的模型就被应用在对用户信息的甄别和理解上,对于判断用户所处环境非常有帮助。

  由于这些模型都是复杂模型,而复杂模型在端上不可避免的会遇到计算能力的问题,所以淘宝就开始研究如何通过端上框架的改进来支持可计算性。贾荣飞介绍到,首先在端上会有原始数据的采集,定期获取用户实时状态,发送到基础模型生产出中间数据,为应用产品进行服务。同时在云端,淘宝会完成模型的训练,再定期同步到用户手机端,用实验和各种参数确保用户拥有良好的使用体验。

  “下一步我们希望在三个方向上做更多的尝试,”贾荣飞透露,第一个是做用户需求发现引擎,能够分析出用户在不同场景的喜好,第二个是实现从千人千面到千人千模,充分发挥用户手机端的计算能力和对用户的深入理解,在每个手机上训练出一个针对单一用户更个性化的东西。最后一个是云+端的联合学习,淘宝希望把云+端的信息联合在一起进行训练,取得更好的效果。

  以上内容是51CTO记者根据WOT2018全球人工智能技术峰会的《机器学习》分论坛演讲内容整理,更多关于WOT的内容请关注51cto.com。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:周雪 来源: 51CTO
相关推荐

2019-01-03 14:23:48

人工智能人机智能业务创新

2018-05-29 15:05:25

WOTOpenStack

2018-11-30 17:22:52

人工智能AI机器学习

2018-11-30 12:04:15

AIWOT51CTO

2019-07-17 15:10:12

WOT2019人工智能

2018-12-17 19:13:43

WOT人工智能数据处理

2022-03-28 18:08:03

昇思

2018-06-13 10:36:49

ARWOT

2018-12-24 11:13:32

WOT2018AI人工智能

2018-02-01 11:20:17

技术门诊

2019-07-15 17:21:14

AIWOT机器学习

2018-12-29 14:47:38

WOT2018

2018-05-25 16:32:04

运维,AI,人工智能,

2018-12-18 11:17:14

人工智能WOT2018AI工具

2018-12-21 16:47:58

中科创达孙力AI赋能行业

2021-05-25 13:50:23

数字化

2018-02-23 17:16:03

态牛

2017-10-25 13:10:14

美团

2019-04-05 10:10:22

AI机器学习安全
点赞
收藏

51CTO技术栈公众号