谷歌收购Kaggle为什么会震动三界(AI、机器学习、数据科学界)?

人工智能 深度学习 机器学习
在昨晚的 Google Cloud Next 谷歌云计算开发者大会上,华人 AI 学界的骄傲、谷歌云首席科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。

在昨晚的 Google Cloud Next 谷歌云计算开发者大会上,华人 AI 学界的骄傲、谷歌云***科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。

其实,关于这事儿,近两天陆续有风声传出。但谷歌和 Kaggle 对各路媒体总是一副“无可奉告”的态度,导致大家各自猜测,但无从证实。即便是李飞飞在 Next 大会上对全世界进行宣布,也仅仅停留在“没错,我们是收购了 Kaggle,这事儿对双方都有好处”的层面;对收购细节、未来计划等信息一概无涉,更不要提收购协议和价格。

[[185037]]

但是,Google+Kaggle,即便不进行任何发酵,也是震动数据科学、AI、机器学习三界(好吧,在很多方面“三界”本是一体)的大事件。其衍生出来的潜藏信息:对开发者社区的意义、行业走向,以及谷歌的机器学习布局等——虽然当事者惜字如金,却为嗅觉敏锐的观察者带来巨大的想象空间。这隐约使人联想起 2014 年谷歌对 DeepMind 的收购:虽则后者与 Kaggle 不管在业务、还是运营方式上都完全不同,但 Kaggle 所掌握的行业资源,只在 DeepMind 之上;两次收购对于谷歌的意义,同样位于极高的战略层面。

[[185038]]

李飞飞宣布谷歌云收购 Kaggle

下面我们来整理一遍,关于此次收购迄今为止披露的所有信息。

Kaggle 简介

凡是玩数据科学和机器学习的老司机,有两个网站一定不会错过:GitHub 和 Kaggle。前者用来分享,后者进行实战练习。对于不熟悉 Kaggle 的童鞋,我们先来进行一段简介。

简而言之,Kaggle 是玩数据、ML 的开发者们展示功力、扬名立万的江湖。

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

它在 2010 创立,专注于举办数据科学周边的线上竞赛。它吸引了大量数据科学家、机器学习开发者的参与,为各类现实中的商业难题开发基于数据的算法解决方案。竞赛的获胜者、领先者,在收获对方公司提供的优厚报酬之外,还将引起业内科技巨头的注意,获得各路 HR 青睐,为自己的职业道路铺上红地毯。

因此,与 GitHub 不同的地方在于,Kaggle 为其社区提供了一整套服务。其中最有名的是它的招聘服务以及名为 Kaggle Kernels 的代码分享工具。

或许因为如此,Kaggle 社区在圈内极受欢迎:用户基数大、粘性强。通常认为 Kaggle 平台有几十万数据科学家。至于具体多少,有媒体认为是五十万,有人说八十万(李飞飞),还有人说超过一百万。

总而言之,Kaggle 是当今***的数据科学家、机器学习开发者社区,其行业地位***。

而大约一年前,Kaggle 开始全力在 AI、机器学习领域发力,相关竞赛项目纷纷上马。李飞飞评论道:

“Kaggle 是搜寻、分析公共数据集,开发机器学习模型,和提高数据科学专业水平的***场所。”

“AI 民主化”的使命

在大会上,李飞飞发表了主题为“让 AI 民主化”的演讲。在此次演讲和之后撰写的博文里,她对谷歌收购 Kaggle 的意图给出了官方版本的解释:

“我强调 AI 民主化的重要性——我们必须降低进入 AI 领域的门槛,让 AI 技术能为尽可能多的开发者社群、用户和企业所用,让 AI 被用于解决他们各自的问题和需求。Kaggle 加入谷歌,能加速这一进程。”

冠冕一些来讲,推动 AI 技术的分享和推广,是谷歌收购 Kaggle 背后的 “mission”,即使命。

加入谷歌之后的 Kaggle

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

虽然谷歌对收购协议的内容进行保密,我们仍能从双方已透露的信息看出一些端倪。比如,有一件事是确定无疑的:Kaggle 将保留独立品牌和团队。

Kaggle 创始人 Anthony Goldbloom 也在昨晚发表博文,回顾 Kaggle 创立以来取得的成绩,对支持 Kaggle 社区的开发者表示感谢,并透露了一些将来的计划:

“ Kaggle 团队仍会是一个整体,并将作为谷歌云旗下的独立品牌运营。我们会继续扩展 Kaggle 上的竞赛和开源数据平台;并且我们会继续对所有的数据科学家、公司、和技术敞开怀抱。Kaggle Kernels 会继续对各类机器学习库和工具包组成的多样生态进行支持,不管其是否来自谷歌。

加入谷歌能让我们实现更多。此次收购,把世界上***的数据科学社区与***进的机器学习云结合到了一起。

加入谷歌后,我们能够向社区提供谷歌云技术。这将使大家能利用更强大的基础设施和部署服务(deployment services),进行可扩展的训练,并且帮助 Kaggle 拥有存储、获取大型数据集的能力。”

[[185040]]

Anthony Goldbloom(图片与本新闻无关)

李飞飞在大会和博客上的表态,虽没有 Anthony Goldbloom 详细,但也印证了一些 Anthony Goldbloom 提到的要点。比如,飞飞老师说谷歌云将为 Kaggle 社区成员提供云机器学习开发环境,Kaggle 和谷歌云将继续支持训练和部署服务,并帮助社区存储、获取大型数据集。

结合飞飞老师对 “AI 民主化”的表态,以及在大会上回溯她亲手创建的 ImageNet、对数据库重要性进行的强调;雷锋网认为,我们应当可以期待谷歌云在数据上为 Kaggle 提供强力支持,帮助 Kaggle 社区的开发者获取更多、更有价值的数据集。而这确实击中了数据科学家和机器学习开发者的一大痛点。这无疑也将直接提升谷歌对数据科学、机器学习社区的影响力,以及在其中的口碑和品牌认同。

收购 Kaggle 之后的谷歌

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

谷歌的核心业务与 AI 紧密相关,也已经成为推动这一轮 AI 技术浪潮的主要玩家之一。AI、数据科学和机器学习对于谷歌的战略意义,已毋庸赘言。自从去年 AlphaGo 与李世石的世纪之战,谷歌的江湖声望更是如日中天。

但是,在 AI 应用和技术的各个垂直领域,如自动驾驶、语音识别、深度学习等,谷歌很可能已经感觉到压力。众所周知,谷歌 Waymo 自动驾驶业务并不是一帆风顺。在语音识别领域,微软和 IBM 屡创纪录。深度学习领域,Facebook AI 实验室 FAIR,以及 OpenAI 都在生成对抗网络 “GAN” 这一前沿技术上投入巨大,产出丰厚研究成果。业内人士对于谷歌在 AI 技术上“领先”于其它对手的印象,已经不再那么牢固(如果此前称得上“牢固”的话)。

想要维持“老大哥”地位,就要进一步投入。而有一个领域是谷歌远远甩开对手的:没错,我说的是 Tensorflow。在深度学习开源工具上,Tensorflow 的市场占有率远远超出其他任何框架、平台。因此,对于开发者这一群体,谷歌的影响力具有天然优势。而收购 Kaggle 则将这一优势***扩大

当然,我们不要忘记,Kaggle 加入的部门是谷歌云。与竞争对手亚马逊 AWS、微软 Asure 相比,谷歌云的地位一直十分尴尬,市场占有率远远落后于前两者。此次的 Google Cloud Next 大会,重点其实是宣传谷歌在云计算上的巨大投入和决心。而细看谷歌对于此次收购的官方表态,也不乏对谷歌云将来能为 Kaggle 所提供的各种支持的强调。谷歌或许希望 Kaggle 能成为谷歌云业务的一项突破口比如借 Kaggle 平台让开发者体验谷歌云、为后者做宣传。至于其它玩法,现在不得而知,尚待将来观察。

另外,外媒纷纷猜测,收购 Kaggle 可使谷歌在雇佣***开发人才上获得便利。这是一个十分合情合理的推测。

周边

  • 谷歌与 Kaggle 的合作已经开始

    雷锋网消息,上个月(2 月 16 日),Kaggle 与谷歌联合举办了 Google Cloud & YouTube-8M Video Understanding Challenge。这是迄今为止世界***规模的视频理解挑战赛。该挑战要求机器学习开发者,寻找出自动标记 Youtube 视频的方法。。

  • 澳大利亚媒体的哀叹:“谷歌买走了我们的 Kaggle!”

    雷锋网了解到,Anthony Goldbloom 是墨尔本大学毕业生。他于 2010 年在悉尼创办 Kaggle ,但在 2011 年将公司总部迁去了旧金山,这次更是直接被美国企业收购。不出意料,对这次谷歌收购 Kaggle 报道最积极的当属澳大利亚媒体。这再次让小编联想起 DeepMind——以及它被收购后英国 AI 圈的反应。

责任编辑:张燕妮 来源: 雷锋网
相关推荐

2019-12-16 14:15:37

Spark数据科学Hadoop

2017-03-09 15:51:09

AI地位

2013-12-04 10:00:56

PythonR语言数据科学家

2020-02-03 08:00:00

机器学习人工智能AI

2019-12-25 14:00:26

数据科学人工智能科学家

2020-08-10 15:08:25

数据科学Kaggle数据集

2018-11-05 09:00:00

人工智能AI机器学习

2021-03-08 11:11:00

机器学习人工智能AI

2020-11-23 09:26:22

机器学习技术算法

2022-07-28 19:31:39

AlphabetDeepMind扩展数据库

2023-05-08 15:09:49

AI开源

2021-01-10 15:28:23

数据科学机器学习AI

2019-02-27 08:00:00

机器学习编程语言框架

2023-03-26 21:03:54

GPT-4人工智能

2022-08-10 14:24:56

机器学习解决方案

2021-12-09 23:16:47

数据科学数据工程机器学习

2018-12-20 12:09:03

Kaggle数据科学算法

2020-05-06 14:19:53

大数据数据科学机器学习

2016-09-22 16:30:17

ITPythonSQL queries

2018-01-25 14:19:32

深度学习数据科学迁移学习
点赞
收藏

51CTO技术栈公众号