【WOT2018】孙林:技术改变行业 AI在贝壳找房业务中的应用实践

原创
人工智能
在“全球软件与运维技术峰会——人工智能技术探索”分会场,贝壳找房高级经理孙林以《人工智能技术在贝壳找房业务中的应用》为主题展开精彩分享。孙林提到,链家在十余年里已经形成了一套标准化的服务能力,并希望将这些能力开放给整个行业,这就是链家网的升级版——贝壳找房。

【51CTO.com原创稿件】2018年5月18-19日,由51CTO主办的全球软件与运维技术峰会在北京召开。此次峰会围绕人工智能、大数据、物联网、区块链等12大核心热点,汇聚海内外60位一线专家,是一场高端的技术盛宴,也是顶级IT技术人才学习和人脉拓展不容错过的平台。

在“人工智能技术探索”分会场,贝壳找房高级经理孙林以《人工智能技术在贝壳找房业务中的应用》为主题展开精彩分享。孙林提到,链家在十余年里已经形成了一套标准化的服务能力,并希望将这些能力开放给整个行业,这就是链家网的升级版——贝壳找房。

贝壳找房高级经理 孙林

一、为什么贝壳找房能落地人工智能技术?

人工智能技术的落地离不开ABCD四要素:Algorithm(算法)+ Bigdata(大数据)+ Computing(算力)+ Domain(领域/场景)。孙林认为,ABC是人工智能在某一场景落地的必要条件。从当前的技术发展情况来看,得益于硬件尤其是GPU的发展,算力方面不存在太大的问题。而在算法方面,目前国内外各家公司的差距并不大。现阶段,人工智能技术是基于大数据的智能,再好的模型也需要大数据去训练,因此数据更加重要。而人工智能技术落地的充分条件就是D,也就是我们所说的业务和场景。孙林认为,人工智能能否落地取决于技术能否为你所在的行业带来社会价值以及商业价值。

孙林提到,链家能够将人工智能技术落地取决于以下两项因素:

首先,链家有丰富的数据。链家在十余年的业务发展过程中,积累了大量的结构化以及非结构化的数据,包括语音、文本、图片、视频等不同的数据类型。同时链家有完整的产品闭环,有自己的产品和流量,可以持续不断地生产出更多的数据,而这些数据又可以帮助去迭代算法,从而推动贝壳找房产品的不断优化。

其次,链家有非常合适的落地场景。举个例子,用户在找房的过程中会有房屋搜索和房屋推荐两个方面的需求;在找到房源后还要了解户型、房价、首付及贷款政策等等,这是知识问答的需求;定了房子之后还要有很长的线下签约的流程,在这个过程中如何控制风险也要考虑全面。搜索、推荐、问答、风控,都是人工智能技术典型的应用场景。

二、贝壳落地AI的三项成果

1、提升效率

贝壳找房的智能助手应用,满足了用户在找房过程中的搜索、问答、推荐的需求,同时也提升了经纪人的工作效率。孙林提到,由于房源过多,经纪人的能力也不尽相同,不太可能了解所有房源的具体情况,而经纪人在不同系统中查找和切换耗费时间,用户等待的时间越长,体验也就越差。通过人工智能技术,智能助手应用已经覆盖了70%的用户需求,智能助手首先将用户问题的答案推荐给经纪人,而经纪人只需进行简单的编辑即可发送给客户,极大地缩短了问题反馈的时间。智能助手将经纪人的服务效率及服务品质实现标准化,极大地改善了用户体验。

2、节约成本

孙林表示,人工智能技术的另一个目标便是帮助公司节省成本。目前贝壳找房的智能客服产品的转人工率已低于10%,这意味着经纪人的每10个问题中,就有9个是可以被智能客服产品自动化解决的。未来,链家会将贝壳找房的能力开放给全行业,服务全国100万经纪人,降低行业中坐席团队的人数,为行业降低人工客服的成本。

3、控制风险

贝壳找房还能帮助行业控制风险。在链家的业务场景中有很多线下的场景,经纪人和客户之间要进行电话沟通,涉及到语音质检和商机发现两个问题,通过语音质检,贝壳找房每天对4000余小时的语音数据进行分析、质检和风险控制,检测经纪人的服务品质,并从中筛选出潜在商机。

三、贝壳找房落地AI技术的应用场景

用户在买房或租房的过程中涉及到搜房源、问房源信息、安排看房、购买流程等环节,中间涉及了搜索系统、问答系统、推荐系统、对话系统等多种技术,智能系统既要降低知识和信息的获取门槛,又要提升服务的效率和品质。这就意味着底层的知识库及知识图谱要足够全面和准确,技术体系也要足够健全。

贝壳找房的系统架构

业务流程:用户(左),经纪人(右)

如何构建知识体系?

贝壳找房从知识怎么来、谁来管、怎么管三方面构建知识体系。知识的来源可分为内部知识和外部知识,包括财务要求、经纪人品质规范、UGC知识、互联网知识等等。内部知识由生产部门管理,确保知识的准确性,外部抓取的知识则采取众包校验机制。在知识的管理方面,对于语音、图片等非结构化数据,通过分类加标签的方式进行组织。知识组织好以后,贝壳找房通过众包系统进行知识的运营,同时设计了一套知识管理系统来确保知识的准确性,系统的功能包括知识的录入、搜索、众包、分发和抽检机制等,另外,还通过数据挖掘的方式弥补知识的缺失,通过这两种方式来确保知识的准和全的问题。孙林介绍,目前贝壳找房对已有的上亿个楼盘字典,通过知识图谱的方式进行组织,每个知识都有相应的维护人员对其进行维护。

如何构建应用系统?

有了知识,就要通过构建应用系统让知识为用户服务所用。经过几年的积累,链家已经拥有超过亿级的多轮对话信息,这些信息能够帮助贝壳找房构建对话系统。一个完整的对话系统包括ASR、SLU、DST、Dialog Policy、NLG、TTS六个模块。

 

认证系统的架构设计

贝壳找房的对话系统的架构包括Web接入层、中控、语义理解、对话管理、Session存储服务、搜索、问答、推荐等模块。其中,中控从web接入层接收到用户的请求,将从Session存储服务中获取的用户的多轮对话的对话历史发送给语义理解和对话模块来理解用户的需求,进而调用搜索、问答、推荐等服务来满足用户的需求。同时,构建了一套完整的体系来保证对系统的效果进行持续的优化:通过流量实验平台对流量进行切分,可以对各个算法模块进行A/B test实验,并通过在指标平台上建立的指标进行效果回收,从而验证算法的好坏。同时,贝壳找房每天有上亿次搜索,为了保障服务的稳定性,还需要有完善的服务监控体系,此外,贝壳找房还有人工干预系统,能够对系统进行干预。

随后,孙林在演讲中介绍了房屋搜索系统和知识问答系统的主要架构,以及其中的核心模块的算法。

房屋搜索系统

房屋搜索系统的主要架构

贝壳找房的房屋搜索系统通过统一网关将链家所有的业务数据接入、存储在分布式的存储引擎中,用户的query进来之后,经过query的纠错、改写、分类、理解等模块,分析出用户的意图后,到引擎里做数据的召回。通过使用learning to rank模型和深度强化学习等技术,对召回数据进行二次排序。同时,系统有一套灵活的策略干预机制,可以满足各种强运营规则的排序需求。

意图理解及召回策略

意图理解

房屋搜索系统主要涉及到意图理解和召回策略两个方面。首先,在意图理解方面,使用规则系统和机器学习模型等多种手段进行意图理解。规则系统解决系统的冷启动问题,经过冷启动阶段积累了大量数据之后,可以通过CNN 、LSTM-CRF等方法做意图分类和实体识别,同时通过半监督学习机制保证来系统模型的持续迭代。

房屋质量打分

其次,是召回模块,召回前先要对物料进行质量打分。物料的得分包括两类:一类是对房屋的物理属性的静态打分,例如房屋各房间的朝向、是否南北通透等,这些静态属性会归类到房屋的DNA中;另一类是房屋的行为得分,如房屋的带看量,推荐量等,对这类特征可以通过时序模型如LSTM等技术,对成交属性和GMV转化等实际属性进行刻画,最终得到一个房屋的质量分。

知识问答系统

知识问答系统架构

知识问答与房屋搜索的架构大部分相同,图中绿色部分是不同之处。房屋搜索更多的是结构化的查询任务,而问答则是非结构化的查询任务。传统的基于关键词搜索的问答系统需要对query进行分词、同义词、简略词的挖掘和改写,如校区的各种缩写等。为了解决这个问题,贝壳找房尝试用向量化的方式做召回:首先使用embedding的技术,将物料知识以向量化的方式进行存储,并建立向量化的索引。当新用户的query进来之后,对query做向量化处理,使用近似近邻算法做召回,通过Deep Semantic Matching等深度学习技术做query和知识的语义匹配,从而保证召回的多样性。

四、展望AI在贝壳的未来

AI技术在贝壳找房和链家成功落地,在提升效率和服务品质的同时,也为公司节约了成本,控制了风险。孙林强调AI的最佳实践必须是产品、技术和运营三位一体的,除技术外,还要有一整套完整的知识产品以及完善的运营体系去支撑。在过去的一年里,从链家升级到贝壳找房,AI赋能改变了链家的产品链条,未来贝壳找房和链家期望成为人们“住”的入口,为人们提供买房、租房、装修、物业等多种体验。最后,孙林引用“荒林春雨足,新笋迸龙雏”作为结尾,他认为链家有着丰富的数据和合适的场景,期望AI技术能够在链家的平台上继续成长,从而取得长足的发展。

以上内容是51CTO记者根据贝壳找房高级经理孙林在WOT2018全球软件与运维技术峰会的演讲内容整理,更多关于WOT的内容请关注51cto.com。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:查士加 来源: 51CTO
相关推荐

2018-04-02 09:14:10

人工智能链家WOT2018

2018-12-24 11:13:32

WOT2018AI人工智能

2018-12-24 14:58:02

人工智能AI视觉搜索

2018-12-29 14:47:38

WOT2018

2018-03-20 09:39:12

AI技术短视频应用实践

2018-12-05 09:49:06

AI贝壳找房房产服务

2018-12-18 11:17:14

人工智能WOT2018AI工具

2018-12-29 15:12:58

人工智能NLPWOT2018

2018-11-30 12:04:15

AIWOT51CTO

2018-12-01 16:11:34

WOT2018人工智能51CTO

2021-08-04 18:14:25

贝壳找房 DorisDB

2018-05-18 22:07:27

WOT2018前端AIOps

2018-05-19 18:24:02

WOT2018微服务容器

2018-03-23 17:35:21

WOT2018董明鑫Docker

2018-11-30 17:22:52

人工智能AI机器学习

2018-05-19 15:04:11

WOT2018OpenStackAR

2018-06-26 10:41:50

物联网制造

2018-06-15 09:59:02

WOT史扬边缘计算

2018-03-19 20:51:07

Weex小程序应用开发

2018-06-21 11:40:51

AR开发
点赞
收藏

51CTO技术栈公众号