数据创新:数据创新的关键成功因素

企业动态
一个智能投研的项目启动了,自然语言识别、统计学、数据挖掘加机器学习的多个科技服务公司都蜂拥而至做POC,从政府公开数据、社交数据、历史交易数据、第三方数据等多方面采集数据,构建消费者画像,竞品画像,预测沙盘等众多模型, 希望构建一个全方位的能够从多维度做销量预测的投研模型。

数据创新的窘境

这是一个真实的案例。

某大型多业态地产集团,其业务涵盖地产、商业、物业三大领域,同时也在开辟和扩展商业的边界,在租赁、电商领域也有所试水。对于一个地产项目来说,最重要的一个环节就是在投研阶段。在哪里买地,花多少钱买地,买了地盖什么类型的房子?这三个问题直接决定了一个项目是否能成功。而这么重要的一个环节,过去这么多年,靠的都是以人的经验为主的决策方法,很难找到一个相对客观,可度量可描述的投研方法。该企业希望建立数据驱动的投研的体系,所有的一切决策都是有数据支撑的,比如在标的地块所在地区的经济发展水平,周边的消费生态,居民结构,竞品情况等。

一个智能投研的项目启动了,自然语言识别、统计学、数据挖掘加机器学习的多个科技服务公司都蜂拥而至做POC,从政府公开数据、社交数据、历史交易数据、第三方数据等多方面采集数据,构建消费者画像,竞品画像,预测沙盘等众多模型, 希望构建一个全方位的能够从多维度做销量预测的投研模型。但是,即使是在POC阶段,大家也发现了众多难以解决的问题:

1、业务目标模糊,领域太宽

这个地段应该盖什么类型的房子?看上去这个***很清晰,但是拆解后就会发现这个业务目标非常模糊,领域太宽。业务度量的标准是什么?潜在用户的范围应该如何界定?是周边还是全市,还是全省,还是全国?如何利用数据产生比常识更加精准的结论?如果把这个业务目标所有的可能性都列举一遍,会发现基本上会涵盖所有的业务领域,是很难用一个模型就能够清晰的定义出一个***实践的。

2、需要的数据集太广,大部分数据处理较复杂

投研本身是一个非常宽的业务领域,所需要的数据集非常的广泛,从宏观政策数据、市场行情数据、交易数据、消费者数据等多方面,而且数据之间的相关性较弱。而通过前期的POC,我们会发现,如果要让这些数据都能够被建模,这过程中的数据处理会非常的复杂,基本上会涉及所有的人工智能技术的应用场景。

3、项目范围庞大,建设周期长,业务见效慢

经过两周左右的POC,大家都发现,这样的一个业务***本身是一个研究领域,如果作为一个项目来做,哪这个项目的范围会非常的庞大,周期也会变得无法控制的长。而这也就意味着,项目的投资需要很长的时间才能看到业务上的回报。

所以***客户放弃了这样的一个项目。

数据驱动创新的几个关键成功因素

通过这个POC的过程,我们发现要成功的利用数据产生新的洞察来做创新,支撑决策,需要具备以下几个关键成功因素:

1、清晰的业务愿景和目标

一定要制定清晰的业务愿景和目标。

在现状调研,数据分析这样的具体的工作开始之前,首先要定义可理解,简单,简短和可以衡量的目标,这一点非常重要。这些目标可以以问题的形式列出,比如“我们的用户转化率能否提高到40%以上?”和“如何能够提升高端产品销量?”。

当然,很多时候我们会发现,我们的业务愿景本身是挺复杂的,不可以被衡量,那我们需要将这个愿景,相对模糊的目标分析,拆解成可理解,简单和可衡量的目标。

这个环节非常重要,定义问题本身是产生有价值的创新的基础,否则就是漫无目的的探索,那可能带来的是资源的浪费和无效的投入。

2、能够带来价值的业务场景

在定义了清晰的目标以后,为了达到这个目标,一定要探索出有价值的业务场景。业务场景是可被实现,可落地,与真实业务可以紧密结合的端到端的一系列流程的组合。这个场景一定要与业务相关联,能够为业务产生价值。也就意味着通过数据关联、分析产生的洞察是能与具体的业务挂钩的,而不是一个飘在空中的不可实现的幻想和空想。

3、可实现的数据资产和技术支撑

有价值的创新场景需要被实现,这里面就需要数据和技术支撑。我们需要在一开始的时候就有顶层设计的思路,把这些创新场景所需要的数据集,技术的支撑,对于工具平台的要求从架构层面列示清楚,然后在实现过程中快速迭代,只有这样才能保证体系上一开始就是可实现的,是集成的。

【本文为51CTO专栏作者“凯哥”的原创稿件,转载请通过作者微信公众号shikai590获取授权】

 

戳这里,看该作者更多好文

责任编辑:武晓燕 来源: 51CTO专栏
相关推荐

2020-07-30 11:40:54

数据湖大数据数据湖平台

2021-07-07 10:09:18

物联网数据产品创新物联网

2023-05-25 13:56:58

2017-01-03 08:36:15

大数据关键模型

2017-01-11 14:58:50

大数据分析模型数据分析

2019-12-04 12:16:04

CIO数据驱动人工智能

2022-03-14 14:35:25

数据中心净零数据中心卫星宽带

2021-12-03 17:13:04

CIO运营IT

2019-11-12 14:05:39

云计算数据IT

2011-04-14 15:42:59

瞬捷企业企业创新

2011-11-25 10:47:32

大数据企业创新

2016-10-10 09:55:06

数据驱动数字化

2021-03-04 14:12:47

数据中心创新数字化转型

2018-12-21 10:14:43

2022-01-04 11:58:26

甲骨文数据库创新

2013-01-14 09:59:04

大数据

2024-01-11 16:30:09

数字化转型数字化

2023-05-29 14:16:13

峰会

2021-01-21 17:20:28

大数据安全人工智能

2024-01-23 15:23:06

数据中心服务器电力基础设施
点赞
收藏

51CTO技术栈公众号