社区编辑申请
注册/登录
Hightouch如何使用“反向ETL”在仓库和SaaS应用程序之间同步数据? 译文
数据库 SaaS
Hightouch在Amplify Partners牵头的一轮融资中筹资1210万美元,这个平台旨在帮助企业将客户数据从数据仓库同步到CRM、营销及其他众多业务工具中。

【51CTO.com快译】Hightouch在Amplify Partners牵头的一轮融资中筹资1210万美元,这个平台旨在帮助企业将客户数据从数据仓库同步到CRM、营销及其他众多业务工具中。

现代企业数据堆栈包括各种组件,从数据摄取工具(比如Fivetran)到基于云的数据仓库(比如Snowflake和谷歌的BigQuery),不一而足。通过以这种方式汇集来自多个来源的数据,公司可以运行查询,并生成无法从独立数据孤岛获取的洞察力。一旦数据已经在仓库中,用户需要取出数据,并导入到Salesforce之类的应用程序中,Hightouch在数据工程界就有了用武之地。

因此,虽然Fivetran是许多公司用来将数据“提取、转换和加载”到仓库中的最知名平台之一,Hightouch却恰恰相反,这就是众所周知的“反向 ETL”(reverse ETL)。

图1:Hightouch:将数据从仓库导入到业务应用程序

简单来说,反向ETL就是在表之间复制粘贴数据。比如说,一家公司可能希望将数据从服务台管理平台Zendesk获取到Salesforce。为此,他们可以使用Fivetran将数据导入到仓库,然后使用Hightouch从仓库获取数据并导入到Salesforce。这么做可以帮助销售团队明确一位客户通过Zendesk请求怎样的支持。

Hightouch联合创始人Kashish Gupta告诉媒体:“由于让仓库中的数据更有用,Hightouch 使Fivetran更强大,反之亦然——如果没有Fivetran提供的数据,Hightouch中的许多工作流程将无法实现。”

Hightouch于2018年在旧金山成立,迄今为止三年内积累了众多知名客户。除了与 Nando's和Autotrader等B2C公司合作外,它还与Kong、Plaid和Mattermost等B2B公司合作。

集成式

Hightouch支持众多公司的约60个“目的地”集成,从 ActiveCampaign、Anaplan、Asana、 Amplitude到Facebook、Google Sheets和Marketo,不一而足。该公司还提供“自定义目的地”选项,使用户能够构建自己的Hightouch目的地。而在数据来源方面,Hightouch可以获取来自亚马逊的Redshift、Databricks、谷歌的BigQuery、Looker、Snowflake和Airtable等来源的数据。

Hightouch本身是一个SaaS应用程序,公司可以将其部署在选择的任何云上,允许非数据工程师通过SQL查询数据。Hightouch然后在其UI中将列映射到相应目的地SaaS工具的列。Gupta说:“然后,Hightouch自动实时同步永久有效的数据。”

图2:将“仓库”模型中的字段映射到HubSpot中的相应字段

此外,Hightouch还有一个界面,使企业能够在其他较擅长技术的用户构建的模型之上“可视化过滤”细分市场,这意味着他们本身不必了解任何SQL。

比如说,营销团队可以结合仓库中多个来源的数据,基于“30天内登录并查看过2种产品的所有用户”或“住在纽约市,往购物车添加了电视机的50岁以上的所有人”来开展广告活动。

图3:针对技术含量较低的用户的可视化过滤

据Gupta声称,为了实现Hightouch所提供的功能,许多公司采用的主要现有解决方案是编写Python脚本,并将脚本与Tray或Zapier之类的工具相结合。不过事实上,反向ETL领域还有其他类似的玩家。另一家成立于2018年的旧金山公司Census在几个月前融资1600万美元。Grouparoo和Polytomic等处于早期阶段的公司也崭露头角,它们都在过去的九个月完成了小额种子轮融资。

正如您所料,每种产品都有各自的差异化优势。比如说,Hightouch让非技术用户能够在现有模型之上过滤数据。与此同时,Grouparoo在构建一种开源数据框架。然而,多种价值主张相似的产品几乎在同一时间上市表明了企业需要将内部客户数据与其他无数的业务系统同步。

更宽泛地说,最近数据集成领域动作频频:GitLab将Meltano这个新开源平台作为一家独立公司拆分出来,Dbt Labs(前身是Fishtown Analytics)融资1.5亿美元(估值达15亿美元),可帮助分析员转换仓库中的数据。而Airbyte也在今年获得了风险投资,随后开放其平台以支持数据湖,先从支持亚马逊的S3入手。

然而,Hightouch与这些数据集成平台不一样。事实上,它的技术是互补性的。除了今天的融资外,Hightouch还宣布与Dbt Labs和Fivetran在集成方面建立深度合作伙伴关系,两家公司都会向希望在仓库外使用集体数据的自家用户推荐Hightouch。

开源?

“开源”是涉足更广泛的数据工程领域的许多公司当中的一个共同主题,Grouparoo、Meltano、Dbt Labs和Airbyte都在开源基础上构建商用产品。Hightouch尚未奉行开源理念,但这可能会在未来受到关注。Gupta解释:“我们正在考虑这方面的路线图。我们的客户还没有要求开源。”

最终,Hightouch是一种有别于数据堆栈中其他工具的产品。许多公司可能不是很迫切地在自己的基础设施上托管Hightouch——首先,它本身不存储任何客户数据。Gupta说:“应用程序托管在我们的云中,但数据百分之百驻留在客户的基础设施中。数据直接从客户的数据仓库进入到其自己的云存储桶,然后进入到SaaS工具。因此,我们能够与规模庞大的金融科技和医疗保健客户合作,他们能够证明Hightouch并不对其数据驻留或安全构成额外的风险。”

原文标题:How Hightouch uses ‘reverse ETL’ to sync data from warehouse to SaaS apps,作者:Paul Sawers

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

责任编辑:华轩 来源: 51CTO
相关推荐

2022-06-20 22:37:25

Linux操作系统命令

2022-06-16 11:01:22

数据库SQL

2021-11-26 09:00:00

2022-05-12 11:20:06

SaaS软件即服务

2020-02-12 08:00:44

SaaS数据云计算

2022-06-07 14:47:43

飞书智能问答模型

2022-06-21 14:22:08

云计算混合云人工智能

2022-04-20 10:15:56

SaaS模块化客户

2022-06-28 08:37:07

分布式服务器WebSocket

2022-04-12 18:29:41

元数据系统架构

2022-05-24 07:36:53

Java 8APIJava

2022-04-14 08:02:06

2022-05-27 15:06:22

攻击面管理(ASM)网络安全运营

2022-06-10 10:59:08

数据管理

2022-03-14 07:53:27

ELTETL大数据

2022-04-08 08:40:36

Nginx日志服务器

2015-03-17 09:18:52

SaaS应用程序遗留系统

2022-04-07 13:56:17

Azure谷歌云AWS

2022-05-19 14:14:26

go语言限流算法

2022-04-29 11:52:02

API代码HTTP

同话题下的热门内容

横空出世的 Data Fabric,是下一个风口吗?一次非常有意思的 SQL 优化经历:从 30248.271s 到 0.001s字节云数据库未来方向的探索与实践海量数据冷热分离方案与实践这年头,谁还不知道这10个高级SQL概念?面试经典问题,如何提高数据库的性能?提高分层 SQL 结构的性能Redis 的内存淘汰策略和过期删除策略,你别再搞混了!

编辑推荐

Oracle数据库初学者开场篇NoSQL数据库概览及其与SQL语法的比较如果对MySQL还停留在这个印象,就out了SQL编程之高级查询及注意事项防止服务器宕机时MySQL数据丢失的几种方案
我收藏的内容
点赞
收藏

51CTO技术栈公众号