四个技巧将 Docker 镜像体积减小 90%

开发 前端
多层镜像构建是指在一个Dockerfile中使用多个RUN指令来构建镜像。每个RUN指令会产生一个新的镜像层,而每个镜像层都会占用额外的存储空间。

优化 Docker 镜像可以提高构建速度、减少镜像大小、提高安全性和效率。以下是一些优化 Docker 镜像的方法:

使用适当的基础镜像

选择合适的基础镜像可以减小镜像大小,并确保基础镜像的安全性和更新性。Alpine、Ubuntu Minimal 等轻量级基础镜像是常用选择。

使用多阶段构建

多阶段构建是一种有效的优化技术,可以在一个Dockerfile中使用多个FROM指令,每个FROM指令都代表一个构建阶段。每个构建阶段都可以从之前的阶段复制所需的文件,并执行特定的构建操作。

使用多阶段构建可以使得最终生成的镜像只包含运行应用程序所必需的文件和依赖,而不包含构建过程中产生的不必要文件和依赖。以下是一个多阶段构建的示例:

# 构建阶段1
FROM golang:1.17 AS builder
  
WORKDIR /ap
COPY . .
  
# 编译应用程序
RUN go build -o myapp
  
# 构建阶段2
FROM alpine:latest
  
# 复制编译后的应用程序
COPY --from=builder /app/myapp /usr/local/bin/
  
# 设置工作目录
WORKDIR /usr/local/bin
  
# 容器启动时运行的命令
CMD ["myapp"]

在上面的例子中,我们使用两个构建阶段。第一个构建阶段使用Golang基础镜像来编译应用程序,第二个构建阶段使用Alpine Linux基础镜像,仅复制编译后的应用程序,并设置容器启动时的命令。

有效使用缓存

当构建 Docker 镜像时,Docker 使用缓存来优化构建过程,避免重复构建不变的层。下面是一个使用缓存机制的例子:假设有一个简单的 Node.js 项目,其中有一个 package.json 文件和应用代码文件,例如 app.js。为了构建这个项目的 Docker 镜像,可以编写一个 Dockerfile 如下:

# 设置基础镜像
FROM node:14
 
# 设置工作目录
WORKDIR /app
 
# 将 package.json 复制到工作目录
COPY package*.json ./
 
# 运行 npm install 安装依赖
RUN npm install
 
# 将应用代码复制到工作目录
COPY . .
 
# 指定容器启动命令
CMD ["node", "app.js"]

在这个 Dockerfile 中,我们将 package.json 文件复制到容器中,并运行 npm install 命令来安装依赖。接着,复制应用代码到容器,并设置容器的启动命令。

当我们构建这个镜像时,Docker 使用缓存机制来尽可能地重用之前构建过的层。如果 package.json 文件没有改变,Docker 将会重复使用之前的缓存层,只有当 package.json 文件发生变化时才会重新运行 npm install 这个命令。

例如,首次构建镜像时,Docker 会运行 npm install 安装依赖,并创建一个缓存层。

在后续构建过程中,如果只有 app.js 文件发生了改变,而 package.json 文件没有变化,Docker 将会重用之前的缓存层,直接复制 app.js 到镜像中,而无需重新安装依赖,从而加快构建速度。

这种缓存机制可以大幅提升构建速度,特别是在开发过程中,当只有部分文件发生变化时,Docker 可以重复使用之前的层而不必重新构建整个镜像。

多层镜像构建优化

多层镜像构建是指在一个Dockerfile中使用多个RUN指令来构建镜像。每个RUN指令会产生一个新的镜像层,而每个镜像层都会占用额外的存储空间。

为了优化多层镜像构建,可以使用&&操作符将多个命令合并成一个RUN指令,避免产生额外的镜像层。同时,在一个RUN指令中执行多个命令可以减少Docker镜像的大小。

例如,将多个apt-get安装命令合并成一个RUN指令:

RUN apt-get update && apt-get install -y \
    package1 \
    package2 \
    package3

这样可以将多个安装命令合并为一个镜像层,减少镜像大小。

责任编辑:武晓燕 来源: 云原生运维圈
相关推荐

2022-07-15 14:54:00

DockerLinux技巧

2022-03-08 14:22:01

大数据数据分析技巧

2023-02-19 15:22:22

React技巧

2020-08-25 08:47:15

开源软件技巧

2023-11-13 10:00:09

数据中心服务器

2020-09-27 07:00:00

安卓应用Android

2022-05-04 12:44:57

Python编程语言

2011-07-25 14:39:06

组策略

2022-05-14 08:35:12

Webpack前端

2021-10-19 09:53:38

智能建筑数据中心边缘计算

2023-10-26 07:47:35

JavaScript代码变量

2019-11-04 06:08:48

云计算成本云计算迁移

2020-05-20 15:27:44

智慧城市数据技术

2022-04-07 09:34:39

技巧云服务费用

2022-10-21 10:22:30

网络网络容量网络资源 Tech

2014-10-16 09:50:41

2022-10-08 15:32:24

Python开发技巧

2009-10-29 10:44:18

ADO.NET Dat

2022-12-13 14:41:01

技术人工智能

2013-03-18 13:31:28

点赞
收藏

51CTO技术栈公众号