ICML国际机器学习顶会隆重召开,格物钛登台分享AI开放数据

企业动态
崔运凯表示:“在过去的几十年里,ImageNet、KITTI 和 MNIST 等开放数据一直是人工智能研究的核心。随着开放数据的兴起,越来越多的研究人员开始意识到数据在人工智能发展中的重要性。行业专家吴恩达和许多其他开发人员正在倡导从以模型为中心的 AI 过渡到以数据为中心的 AI 开发。”

 

第三十八届国际机器学习大会(ICML)于2021年7月18日正式召开。ICML作为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,致力于展示和发表与人工智能、统计学和数据科学等密切相关领域以及重要应用领域的研究成果,推动人工智能分支机器学习的发展。

一年一度的ICML汇聚了众多高水平的学者、工业研究人员、企业家以及工程师,共同分享科技领域的前沿资讯。格物钛作为今年ICML 2021的主办人之一,登台ICML Expo分享大会,与机器学习领域内的研究者们共同探讨开放数据的未来。

 

 

在Expo Talk上,格物钛创始人兼CEO崔运凯从当前开放数据的一些痛点角度出发,分享了格物钛对于公开数据集的思考以及解决方案。崔运凯表示:“在过去的几十年里,ImageNet、KITTI 和 MNIST 等开放数据一直是人工智能研究的核心。随着开放数据的兴起,越来越多的研究人员开始意识到数据在人工智能发展中的重要性。行业专家吴恩达和许多其他开发人员正在倡导从以模型为中心的 AI 过渡到以数据为中心的 AI 开发。”

崔运凯总结了目前使用公开的数据集存在的主要痛点,包括了查找公开的数据集有难度,不是所有的公开数据集都标注完整,部分公开数据集的标注存在错误,以及数据集本身存在偏差。不仅如此,数据的托管、宣传,社群的运营、互动也需要很多资源和精力。

 

 

基于公开数据集的重要性与行业现存的痛点,崔运凯认为,目前格物钛推出的公开数据集平台(Open Datasets)可以帮助开源数据的发布者与使用者有效的解决这些问题。对于发布者来说,他们可以在平台上实现数据托管、用户吸引以及社区互动等功能;对于使用者来说,他们可以高效搜索具有某类特征的数据集,明确详细的数据使用协议,也可以筛选以及合并多个数据集。

在未来,以数据为中心(Data Centric)的开发模式中,数据必然会扮演越来越重要的角色。随着更多更高质量数据集的开源,将为人工智能的发展带来巨大的价值。

格物钛定位为面向机器学习的数据平台,致力于为 AI 开发者打造下一代新型基础设施,从根本上改变其与非结构化数据的交互方式。通过非结构化数据管理工具TensorBay和开源数据集社区Open Datasets,帮助机器学习团队和个人降低数据获取、存储和处理成本,加速 AI 开发和产品创新,为人工智能赋能千行百业、驱动产业升级提供坚实基础。

责任编辑:赵立京 来源: 网络
相关推荐

2012-11-30 14:03:22

2011-05-23 09:58:42

IBM天津策略发布

2020-06-19 10:33:16

阿里AIICML

2014-05-09 12:28:14

Teradata 大数据天睿

2017-02-24 18:01:25

SDN

2012-11-19 10:33:33

2021-07-09 17:25:32

WAIC开源AI

2015-10-27 11:09:29

机房360

2013-11-04 13:18:56

云计算

2014-04-17 16:05:15

NETGEAR合作伙伴

2013-09-04 17:51:13

智慧商务

2011-12-16 13:53:29

2010-03-24 13:46:08

软件研发

2010-06-04 17:20:14

2010中国工业软件发

2015-08-24 13:41:14

乐智网

2010-05-21 15:03:58

中国政府网站国际化程度研讨会

2015-03-20 11:01:36

IBM Insigh大数据分析大数据

2014-09-30 10:55:03

沈阳国际手机博览会智能产品

2017-11-01 15:52:52

数据
点赞
收藏

51CTO技术栈公众号