三条命令搞定MacOS安装Greenplum

系统 MacOS
本文主要介绍如何在MacOS上安装部署Greenplum,并给出了具体的操作步骤,安装过程也十分简单。对于Mac的用户而言,如果需要安装一些大数据的环境用于学习和测试,完全没有必要安装虚拟机,一般的大数据技术组件都是支持在MacOS上部署运行的,如果不行,使用Docker也能够方便地安装部署。

写在前面

Mac的Term2 是 Terminal 的替代者。这是一款用于 macOS 的终端模拟器,支持窗口分割、热键、搜索、自动补齐、无鼠标复制、历史粘贴、即时重播等功能特性,适用于 MacOS 10.10 及以上版本。

Mac的用户可以通过iterm2终端获取Linux操作系统的体验。我们常见的大数据技术组件(比如Flink、Hadoop、Hive、Kafka等等)都可以在Mac OS上直接进行安装,操作过程与Linux安装基本无差别。既然主流的大数据技术框架可以很方便地在MacOS上部署运行,那Greenplum是否也可以很方便的在MacOS上部署呢?翻阅官网发现了下面的支持部署的操作系统说明:

Greenplum 6 runs on the following operating system platforms:

  • Red Hat Enterprise Linux 64-bit 7.x (See the following Note[2].)
  • Red Hat Enterprise Linux 64-bit 6.x
  • CentOS 64-bit 7.x
  • CentOS 64-bit 6.x
  • Ubuntu 18.04 LTS
  • Oracle Linux 64-bit 7, using the Red Hat Compatible Kernel (RHCK)

既然仅支持linux部署,那只能通过Docker进行安装了。

如何使用Docker安装GP

使用Docker安装GP主要有两种方式:

  • 第一种是安装centos的镜像,然后在centos中安装greenplum,此种方式相当于先装一个linux的虚拟机,然后在使用GP的安装包进行安装,过程相当繁琐,本文不做过多说明。
  • 第二种方式是直接通过docker拉去Greenplum的镜像,然后直接运行容器即可,本文使用的是第二种方式。

安装步骤

安装Docker

假设用户已经安装了Homebrew ,就可以通过Homebrew 安装docker了,步骤非常简单:

  1. $ brew install --cask --appdir=/Applications docker 

镜像制作

假设已经安装了git,可以执行下面的步骤:

  1. git clone https://github.com/tangyibo/greenplum_docker.git 

克隆完成之后,进入克隆的文件夹

  1. cd greenplum_docker/ 

可以看到文件夹下面有如下的文件:

  1. -rw-r--r--  1 username  staff   665B  8 24 14:57 Dockerfile 
  2. -rw-r--r--  1 username  staff     8B  8 24 14:57 LICENSE 
  3. -rw-r--r--  1 username  staff   1.3K  8 24 14:57 README.md 
  4. -rw-r--r--  1 username  staff   246B  8 24 14:57 build.sh 
  5. drwxr-xr-x@ 4 username  staff   128B  8 24 15:45 data 
  6. -rw-r--r--  1 username  staff   1.6K  8 24 14:57 entrypoint.sh 
  7. -rw-r--r--  1 username  staff   2.9K  8 24 14:57 install.sh 
  8. -rw-r--r--  1 username  staff   116B  8 24 14:57 test.sh 

执行build命令:

  1. sh build.sh 

 

build的过程大约十分钟左右。

运行镜像

创建一个文件夹

  1. mkdir -p ~/data/gpdb 

运行容器

  1. docker run -d --name greenplum -p 5432:5432 -v /Users/jmx/bigdata/data/gpdb:/Users/jmx/bigdata/data  inrgihc/greenplum:6.16.3 

 

此时容器已经运行了,可以通过一下命令查看:

  1. docker ps -a 
  2. CONTAINER ID   IMAGE                      COMMAND               CREATED              STATUS              PORTS                                               NAMES 
  3. b16c80b552f9   inrgihc/greenplum:6.16.3   "sh /entrypoint.sh"   About a minute ago   Up About a minute   22/tcp, 0.0.0.0:5432->5432/tcp, :::5432->5432/tcp   greenplum 

进入容器

上面可以查看容器id为:b16c80b552f9

  1. docker exec -it b16c80b552f9 bin/sh 

简单操作

进入容器后,我们就可以是使用greenplum了,下面是环境的一些配置说明:

进入安装目录:

  1. cd /usr/local/greenplum-db 

 

切换gpadmin用户

  1. su gpadmin 

使用psql客户端

  1. $ psql 

 

列出数据库

  1. postgres=# \d 
  2. No relations found. 
  3. postgres=# \l 
  4.                                List of databases 
  5.    Name    |  Owner  | Encoding |  Collate   |   Ctype    |  Access privileges 
  6. -----------+---------+----------+------------+------------+--------------------- 
  7.  postgres  | gpadmin | UTF8     | en_US.utf8 | en_US.utf8 | 
  8.  template0 | gpadmin | UTF8     | en_US.utf8 | en_US.utf8 | =c/gpadmin         + 
  9.            |         |          |            |            | gpadmin=CTc/gpadmin 
  10.  template1 | gpadmin | UTF8     | en_US.utf8 | en_US.utf8 | =c/gpadmin         + 
  11.            |         |          |            |            | gpadmin=CTc/gpadmin 
  12. (3 rows

创建数据库

  1. postgres=# create database test; 
  2. CREATE DATABASE 

使用数据库

  1. CREATE DATABASE 
  2. postgres=# \c test 
  3. You are now connected to database "test" as user "gpadmin"
  4. test=# 

建表

  1. create table test2(id int,name varchar(128)) distributed by (id); 
  2. CREATE TABLE 
  3. test=# 

查看表描述信息

  1. test=# \d test2; 
  2.             Table "public.test2" 
  3.  Column |          Type          | Modifiers 
  4. --------+------------------------+----------- 
  5.  id     | integer                | 
  6.  name   | character varying(128) | 
  7. Distributed by: (id) 

查看数据

  1. test=# insert into test2 values(1,'tom'),(2,'jack'),(3,'Bob'); 
  2. INSERT 0 3 
  3. test=# select * from test2; 
  4.  id | name 
  5. ----+------ 
  6.   2 | jack 
  7.   3 | Bob 
  8.   1 | tom 
  9. (3 rows
  10.  
  11. test=# 

查看所有表

  1. test=# \dt 
  2.              List of relations 
  3.  Schema | Name  | Type  |  Owner  | Storage 
  4. --------+-------+-------+---------+--------- 
  5.  public | test2 | table | gpadmin | heap 
  6. (1 row) 

运维命令

  1. gpstate -s 

 

总结

本文主要介绍如何在MacOS上安装部署Greenplum,并给出了具体的操作步骤,安装过程也十分简单。对于Mac的用户而言,如果需要安装一些大数据的环境用于学习和测试,完全没有必要安装虚拟机,一般的大数据技术组件都是支持在MacOS上部署运行的,如果不行,使用Docker也能够方便地安装部署。

 

责任编辑:未丽燕 来源: 大数据技术与数仓
相关推荐

2012-10-22 10:04:11

AMD微型服务器嵌入式

2022-09-19 13:11:56

命令SSH内网穿透

2009-04-17 16:20:26

职场迷茫期对策

2019-12-04 11:16:23

区块链数字货币

2018-07-27 15:20:50

企业新兴技术

2009-06-10 10:33:33

华为离职员工定律

2023-11-13 14:43:47

API接口

2021-09-24 09:00:00

MySQL数据库SQL

2017-12-08 20:32:39

2009-04-22 17:14:11

LinuxSAMBA服务

2014-11-27 10:49:50

AWS re:Inve亚马逊EC2亚马逊

2023-06-06 07:17:44

云变化管理策略

2014-01-13 10:14:20

WindowsLinux

2012-12-27 10:07:22

2013-01-25 13:06:47

安全风险

2016-09-28 22:07:45

SMB网络通信

2011-04-29 11:14:34

投影机

2010-10-20 09:39:50

2022-02-14 11:14:34

Java工程师开发

2021-04-30 15:30:54

大数据互联网数据分析
点赞
收藏

51CTO技术栈公众号