为什么开源对于数据分析很重要?

开源
开源对于数据分析非常重要,它能为用户、社区成员和公司带来长远利益。

我曾经写过介绍 Cube 社区的文章,至今已过去了一年多。随着和社区会员以及其他供应商在一起工作,我更坚信开源对于数据分析工作是很有好处的。我也认为,需要不断思考开源为什么重要,以及开源是如何为人们带来长远利益的。

开源对于用户和客户的好处

我从 Cube 社区听说的第一件事就是:他们经常可以从与其他社区成员的交流中得到技术支持,这种支持往往好于使用需要付费的专有软件获得的支持。在很多开源社区中,我发现,社区成员很乐意帮助别人(特别是帮助新手),并且把这种帮助看作回报开源社区的方式。

在开源社区,你不需要获得许可就可以加入。一个好的开源社区不但服务于开发者,而且令人们感觉到有一种信任的文化,认为与他人在聊天室、论坛和问题跟踪工具进行开放式讨论是一件愉快的事。这对于诸如数据工程师或数据分析师之类的非开发者来说也很重要。

当然,借助开源软件,还可以直接查看代码、修复错误或为项目添加新功能。以 Cube 社区为例,对于 GraphQL 的支持就是我们去年的亮点,我们的社区成员为项目 贡献了这些功能

对一个活跃的社区来说,也是很有好处的。即使当供应商不能及时地发布修复版本,你仍然可以自行修改,并可以在等待官方修复版的这段时间内使用修改后的版本。社区成员和用户也不愿意被供应商的奇思妙想所束缚,而且使用开源软件时也不存在升级的压力。

开源社区在 GitLab、GitHub、Codeberg、YouTube 等各种地方留下了很多“面包屑”,这令衡量活跃程度和社区参与度更容易,也可以衡量社区参与和文化的水平。所以,即使在试用软件前,你也可以在做决定之前了解到它的社区(以及公司)的一些情况。

开源对公司的好处

没有其他办法比开源更能降低使用软件的障碍了。在早期,开源可以提高技术受众的认知度。早期的使用者往往后来会成为你的最忠实的粉丝。

早期的使用者也是加速产品发展的催化剂。他们对于产品的反馈和功能需求(例如对问题的追踪)能实现对真实用例的洞察。另外,很多开源爱好者可以合作开发(比如通过代码仓库)新功能和进行 BUG 修复。不用说,这对于创业早期的公司来说是很重要的,因为当时缺少开发和产品相关的资源。

你对社区的关注会令它发展壮大,并且呈现多样化趋势。多样化不仅体现在人数和地域方面。你需要来自新兴行业的用户或从事各种职业的用户。以 Cube 社区为例,在一年前我常常会跟一些开发者交流,但一年后与我交流得更多的是那些数据使用者和用户。

在良好的开源社区里,合作文化降低了准入门槛,不仅对于开发者,对于其他提问者、分享观点者或愿意作出非技术性贡献的人们来说都是如此。随着公司和社区的发展,你可以更好地接触到不同的观点。

对包括社区成员在内的广大人群来说,开源使合作变得更容易。例如,你需要跟其他贡献者在同一个数据库驱动或集成上进行合作,如果可以通过开源仓库进行合作,就很方便了。

关于社区

以上这些好处都降低了使用软件和协作开发的门槛。开源模型不仅对单个软件或公司有帮助,它还能令整个生态和行业加速发展。我希望在数据分析领域看到更多开源的公司和社区,同时希望人们持续关注开源产品。

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2013-01-08 14:58:48

Firefox OS

2020-09-08 12:48:19

数据分析图表互联网

2011-06-21 16:58:09

外链

2022-09-26 13:58:44

数据治理数据素养通信

2022-08-24 15:03:21

数据智能数据分析

2022-05-19 16:40:16

工业物联网设备工业自动化

2023-02-13 11:06:58

决策智能数据分析

2024-01-08 13:28:00

5G低延迟

2023-03-07 14:29:34

数据中心PDU

2022-11-07 11:22:33

2023-05-23 16:08:19

2022-01-10 23:39:18

Java测试开发

2020-11-03 11:03:59

大数据数据分析工具

2019-12-12 14:38:33

数据分析菜鸟工具

2023-09-15 11:42:15

配电单元数据中心

2020-10-23 14:58:07

戴尔

2020-12-30 13:30:38

数据中心计算机超级计算机

2022-05-11 15:08:16

加密货币私钥安全

2021-02-23 10:52:38

云计算物联网技术

2015-10-19 17:57:33

容器OpenStack微服务
点赞
收藏

51CTO技术栈公众号