海天瑞声品牌升级 率先发力自动驾驶领域

原创
人工智能
近日,海天瑞声宣布品牌升级,英文名称改为“DataOcean AI”,同时启用全新 Logo,全面进入 AI+领域,通过语音、图像、文本全覆盖,并且深入行业应用场景,赋能企业用户,全方位助力 AI 前沿项目的全球商业落地。

近日,海天瑞声宣布品牌升级,英文名称改为“DataOcean AI”,同时启用全新 Logo,全面进入 AI+领域,通过语音、图像、文本全覆盖,并且深入行业应用场景,赋能企业用户,全方位助力 AI 前沿项目的全球商业落地。

海天瑞声 CEO 王晓东强调,“此次品牌升级不仅是一个简单的改名,还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索。过去海天瑞声是语音 Speech 海洋,未来在人工智能领域是数据 Data 海洋。品牌升级后,海天瑞声将更好地满足客户全方位的 AI 数据需求,共建 AI 未来!”

海天瑞声 CEO 王晓东

品牌焕新,实现 AI 数据全覆盖

海天瑞声于2005年成立,起家时专注于智能语音数据。随着近些年人工智能技术的快速迭代发展,海天瑞声的业务已经从单纯的语音数据服务,扩展至提供覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集,未来还将支持以数据驱动的生成式 AI 业务发展。

为了打破市场对于海天瑞声固有的语音业务印象,同时服务于客户全方位的需求,海天瑞声于近日完成了品牌焕新,中文名称“海天瑞声”保持不变,英文名称将从“SpeechOcean”改成“DataOcean AI”,公司启用全新的 Logo。

近年来,海天瑞声的业务范围在逐步扩大,但是海天瑞声还是会坚持提供高质量的数据。王晓东强调,“海天瑞声不仅具备开发、训练和评估算法能力,还提供生成人工智能和大模型数据解决方案。但有一点永远不会改变,我们致力于为客户提供高质量的数据集和解决方案。”

据了解,海天瑞声一直在为 AI 产业链上的各类机构提供 AI 算法模型开发训练所需的专业数据集,目前这些数据集已覆盖智能语音、计算机视觉、自然语言等 AI 核心领域。经过多年深耕,海天瑞声的产品和服务已获得阿里巴巴、腾讯、三星等国内外头部客户的认可,并在自动驾驶、虚拟主播、声纹识别、人脸姿态等众多人工智能场景及相关算法模型的训练过程中获得应用。

为了践行推进数据资源整合共享的社会责任,海天瑞声还宣布开放多模态数据集「DOTS-MM-0526」,覆盖图像、语音、文本等多个维度的数据集,免费开放给全球 AI 开发者和研究人员使用,共同推动人工智能技术的发展和落地。王晓东表示,“开源数据集可以帮助各领域的研究者和开发者快速获得更多高质数据样本,进而提高模型的精准度和鲁棒性,帮助他们更好地进行算法研究和模型训练,助力中国人工智能开放生态建设。”

深入行业,率先发力自动驾驶领域

自动驾驶是2020年至今,AI 基础数据服务支出规模最大的细分行业,同时也是最具增长潜力的行业,主要数据采集需求包括车内驾驶舱以及车外道路环境感知等场景。但是,自动驾驶行业数据仍面临诸多痛点,包括数据处理迭代速度无法满足技术路线的飞速发展;人工标注效率低;项目多样化,要求复杂,流程管理困难;数据安全合规趋于严格。

汽车领域,是海天瑞声率先落地的战略之一。海天瑞声于4月18日推出了“DOTS-AD 自动驾驶平台”。 据海天瑞声 CTO 黄宇凯介绍,这是一款专为自动驾驶场景设计的全栈式数据平台,能够支持多维度、全方位的自动驾驶标注任务,数据标注效率提升高达8倍,可支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化部署,包括公有云、私有云和混合云部署模式。

海天瑞声 CTO 黄宇凯

值得注意的是,DOTS-AD 自动驾驶平台具有四大核心功能:一是全面支持自动驾驶领域各维度2D/3D/4D 点云或图像数据标注;二是能针对不同场景支持辅助标注/自动化标注;三是支持项目的柔性管理,支持流程/工具/标签的自定义;四是可实现对数据的智能化管理,确保客户的商业敏感数据安全合规。基于这些核心功能,海天瑞声正建立起在智能驾驶数据训练领域的核心壁垒,也将赋能自动驾驶技术走迈向新高度。

黄宇凯表示,“希望通过 DOTS-AD 自动驾驶平台,能够赋能自动驾驶企业的算法高效量产,让每一个辆车更智能、更安全地行驶在世界的每个角落。”

大模型训练中的数据价值

去年年底以来,随着 ChatGP 的发布以及之后各种大模型的出现,让我们加速走进了大模型时代,并真切地感受到了其与日俱增的能力。众所周知,大模型也需要进行训练,那么在此过程中与数据相关的工作,与此前有什么不同呢?

对此,黄宇凯认为,从大方向上来看并没有什么不同,还是需要先提出数据方案,然后进行设计,再执行采集、标注等一系列的工作流程,最终目标也是让客户能够基于所提供的数据,训练出效果良好的模型。

其中,不一样的地方在于,不同企业关注的侧重点不同。比如,大模型主要分为预训练和强化学习两个阶段,这两个阶段对数据都有很高的要求。就前者而言,虽然大模型对应的是大数据,但并不是数据越多越好,还要执行数据清洗的步骤。数据公司必须掌握如何清洗、向哪个方向清洗,才能更好地应用于大模型的基础能力。对于后者来说,进行强化学习需要撰写对应的提示词,这对数据标注人员的逻辑思维能力和表达能力也有较高的要求。

对于一家数据公司来说,数据安全与合规是其底线,也是立身之本。因此,海天瑞声组建了专门的团队,对欧盟颁布的《通用数据保护条例》、我国颁布的《数据安全法》和《个人信息法》等法规进行了深入的研究,并制定了高于国家法律的数据合规要求。具体来说,其在整个公司层面上,要求所有成员在严格遵循当地法律法规的基础之上,开展包括数据采集、标注等在内的具体工作。

责任编辑:鸢玮 来源: 51CTO
相关推荐

2023-04-18 14:35:00

海天瑞声

2020-05-08 10:25:03

自动驾驶智慧物流技术

2021-05-31 10:46:16

自动驾驶特斯拉数据

2022-10-27 10:18:25

自动驾驶

2021-11-18 09:50:35

自动驾驶辅助驾驶人工智能

2024-02-20 11:26:07

物联网

2018-08-08 17:32:22

自动驾驶

2022-07-12 09:42:10

自动驾驶技术

2018-10-24 14:16:33

自动驾驶道路测试牌照

2021-04-28 05:34:04

人工智能AI自动驾驶

2017-07-10 10:05:50

机器学习自动驾驶AI

2017-07-07 16:52:54

机器学习人工智能自动驾驶

2021-04-15 06:24:50

人工智能AI自动驾驶

2017-07-10 09:28:19

人工智能机器学习自动驾驶

2022-01-10 15:50:30

自动驾驶数据人工智能

2020-09-28 14:00:06

自动驾驶AI网络

2019-09-19 14:10:12

人工智能物联网自动驾驶
点赞
收藏

51CTO技术栈公众号