「 不懂就问 」Esbuild 为什么这么快?

开发 开发工具
每次运行打包器时,JavaScript VM 都会在没有任何优化提示的情况下看到打包程序的代码。在 esbuild 忙于解析 JavaScript 时,node 忙于解析打包程序的JavaScript。

[[402061]]

前言

esbuild 是新一代的 JavaScript 打包工具。

他的作者是 Figma 的 CTO - Evan Wallace。

[[402062]]

( 这卡姿兰大眼睛,令人唏嘘的发际线, 一看就知道很强!)

esbuild以速度快而著称,耗时只有 webpack 的 2% ~3%。

esbuild 项目主要目标是: 开辟一个构建工具性能的新时代,创建一个易用的现代打包器。

它的主要功能:

  • Extreme speed without needing a cache
  • ES6 and CommonJS modules
  • Tree shaking of ES6 modules
  • An API for JavaScript and Go
  • TypeScript and JSX syntax
  • Source maps
  • Minification
  • Plugins

现在很多工具都内置了它,比如我们熟知的:

  • vite,
  • snowpack

借助 esbuild 优异的性能, vite 更是如虎添翼, 快到飞起。

今天我们就来探索一下: 为什么 esbuild 这么快?

下文的主要内容:

  • 几组性能数据对比
  • 为什么 esbuild 这么快
  • esbuild upcoming roadmap
  • esbuild 在 vite 中的运用
  • 为什么生产环境仍需打包?
  • 为何vite不用 esbuild 打包?
  • 总结

正文

先看一组对比:

使用 10 份 threeJS 的生产包,对比不同打包工具在默认配置下的打包速度。

webpack5 垫底, 耗时 55.25秒。

esbuild 仅耗时 0.37 秒。

差异巨大。

还有更多对比:

https://twitter.com/evanwallace/status/1314121407903617025

webpack5 表示很受伤: 我还比不过 webpack 4 ?

...

为什么 esbuild 这么快 ?

有以下几个原因。

(为了保证内容的准确性, 以下内容翻译自 esbuild 官网。)

1. 它是用 Go 语言编写的,并可以编译为本地代码。

大多数打包器都是用 JavaScript 编写的,但是对于 JIT 编译的语言来说,命令行应用程序拥有最差的性能表现。

每次运行打包器时,JavaScript VM 都会在没有任何优化提示的情况下看到打包程序的代码。

在 esbuild 忙于解析 JavaScript 时,node 忙于解析打包程序的JavaScript。

到节点完成解析打包程序代码的时间时,esbuild可能已经退出,您的打包程序甚至还没有开始打包。

另外,Go 是为并行性而设计的,而 JavaScript 不是。

Go在线程之间共享内存,而JavaScript必须在线程之间序列化数据。

Go 和 JavaScript都有并行的垃圾收集器,但是Go的堆在所有线程之间共享,而对于JavaScript, 每个JavaScript线程中都有一个单独的堆。

根据测试,这似乎将 JavaScript worker 线程的并行能力减少了一半,大概是因为一半CPU核心正忙于为另一半收集垃圾。

2. 大量使用了并行操作。

esbuild 中的算法经过精心设计,可以充分利用CPU资源。

大致分为三个阶段:

  • 解析
  • 链接
  • 代码生成

解析和代码生成是大部分工作,并且可以完全并行化(链接在大多数情况下是固有的串行任务)。

由于所有线程共享内存,因此当捆绑导入同一JavaScript库的不同入口点时,可以轻松地共享工作。

大多数现代计算机具有多内核,因此并行性是一个巨大的胜利。

3. 代码都是自己写的, 没有使用第三方依赖。

自己编写所有内容, 而不是使用第三方库,可以带来很多性能优势。

可以从一开始就牢记性能,可以确保所有内容都使用一致的数据结构来避免昂贵的转换,并且可以在必要时进行广泛的体系结构更改。缺点当然是多了很多工作。

例如,许多捆绑程序都使用官方的TypeScript编译器作为解析器。

但是,它是为实现TypeScript编译器团队的目标而构建的,它们没有将性能作为头等大事。

4. 内存的高效利用。

理想情况下, 根据数据数据的长度, 编译器的复杂度为O(n).

如果要处理大量数据,内存访问速度可能会严重影响性能。

对数据进行的遍历次数越少(将数据转换成数据所需的不同表示形式也就越少),编译器就会越快。

例如,esbuild 仅触及整个JavaScript AST 3次:

  1. 进行词法分析,解析,作用域设置和声明符号的过程
  2. 绑定符号,最小化语法。比如:将 JSX / TS转换为 JS, ES Next 转换为 es5。
  3. 最小标识符,最小空格,生成代码。

当 AST 数据在CPU缓存中仍然处于活跃状态时,会最大化AST数据的重用。

其他打包器在单独的过程中执行这些步骤,而不是将它们交织在一起。

它们也可以在数据表示之间进行转换,将多个库组织在一起(例如:字符串→TS→JS→字符串,然后字符串→JS→旧的JS→字符串,然后字符串→JS→minified JS→字符串)。

这样会占用更多内存,并且会减慢速度。

Go的另一个好处是它可以将内容紧凑地存储在内存中,从而使它可以使用更少的内存并在CPU缓存中容纳更多内容。

所有对象字段的类型和字段都紧密地包装在一起,例如几个布尔标志每个仅占用一个字节。

Go 还具有值语义,可以将一个对象直接嵌入到另一个对象中,因此它是'免费的',无需另外分配。

JavaScript不具有这些功能,还具有其他缺点,例如 JIT 开销(例如隐藏的类插槽)和低效的表示形式(例如,非整数与指针堆分配)。

以上的每一条因素, 都能在一定程度上提高编译速度。

当它们共同工作时,效果比当今通常使用的其他打包器快几个数量级。

以上内容比较繁琐,对此,也有一些网友做了简要的总结:

  • 它是用 Go 语言编写的,该语言可以编译为本地代码。而且 Go 的执行速度很快。一般来说,JS 的操作是毫秒级,而 Go 则是纳秒级。
  • 解析,生成最终打包文件和生成 source maps 的操作全部完全并行化
  • 无需昂贵的数据转换,只需很少的几步即可完成所有操作
  • 该库以提高编译速度为编写代码时的第一原则,并尽量避免不必要的内存分配。

仅作参考。

Upcoming roadmap

以下这几个 feature 已经在进行中了, 而且是第一优先级:

  1. Code splitting (#16, docs)
  2. CSS content type (#20, docs)
  3. Plugin API (#111)

下面这几个 fearure 比较有潜力, 但是还不确定:

  1. HTML content type (#31)
  2. Lowering to ES5 (#297)
  3. Bundling top-level await (#253)

感兴趣的可以保持关注。

esbuild 在 vite 中的运用

vite 中大量使用了 esbuild, 这里简单分享两点。

optimizer

https://github.com/vitejs/vite/blob/main/packages/vite/src/node/optimizer/index.ts#L262

  1. import { build, BuildOptions as EsbuildBuildOptions } from 'esbuild' 
  2.  
  3. // ... 
  4. const result = await build({ 
  5.     entryPoints: Object.keys(flatIdDeps), 
  6.     bundle: true
  7.     format: 'esm'
  8.     external: config.optimizeDeps?.exclude, 
  9.     logLevel: 'error'
  10.     splitting: true
  11.     sourcemap: true
  12.     outdir: cacheDir, 
  13.     treeShaking: 'ignore-annotations'
  14.     metafile: true
  15.     define, 
  16.     plugins: [ 
  17.       ...plugins, 
  18.       esbuildDepPlugin(flatIdDeps, flatIdToExports, config) 
  19.     ], 
  20.     ...esbuildOptions 
  21.   }) 
  22.  
  23.   const meta = result.metafile! 
  24.  
  25.   // the paths in `meta.outputs` are relative to `process.cwd()` 
  26.   const cacheDirOutputPath = path.relative(process.cwd(), cacheDir) 
  27.  
  28.   for (const id in deps) { 
  29.     const entry = deps[id] 
  30.     data.optimized[id] = { 
  31.       file: normalizePath(path.resolve(cacheDir, flattenId(id) + '.js')), 
  32.       src: entry, 
  33.       needsInterop: needsInterop( 
  34.         id, 
  35.         idToExports[id], 
  36.         meta.outputs, 
  37.         cacheDirOutputPath 
  38.       ) 
  39.     } 
  40.   } 
  41.  
  42.   writeFile(dataPath, JSON.stringify(data, null, 2)) 

处理 .ts 文件

https://github.com/vitejs/vite/commit/59035546db7ff4b7020242ba994a5395aac92802

为什么生产环境仍需打包?

尽管原生 ESM 现在得到了广泛支持,但由于嵌套导入会导致额外的网络往返,在生产环境中发布未打包的 ESM 仍然效率低下(即使使用 HTTP/2)。

为了在生产环境中获得最佳的加载性能,最好还是将代码进行 tree-shaking、懒加载和 chunk 分割(以获得更好的缓存)。

要确保开发服务器和产品构建之间的最佳输出和行为达到一致,并不容易。

为解决这个问题,Vite 附带了一套 构建优化 的 构建命令,开箱即用。

为何 vite 不用 esbuild 打包?

虽然 esbuild 快得惊人,并且已经是一个在构建库方面比较出色的工具,但一些针对构建应用的重要功能仍然还在持续开发中 —— 特别是代码分割和 CSS处理方面。

就目前来说,Rollup 在应用打包方面, 更加成熟和灵活。

尽管如此,当未来这些功能稳定后,也不排除使用 esbuild 作为生产构建器的可能。

总结

esbuild 为构建提效带来了曙光, 而且 esm 的数量也在快速增加:

https://twitter.com/skypackjs/status/1113838647487287296

 

希望 esm 生态尽快完善起来, 造福前端。

本文转载自微信公众号「前端皮小蛋」,可以通过以下二维码关注。转载本文请联系前端皮小蛋公众号。

 

责任编辑:武晓燕 来源: 前端皮小蛋
相关推荐

2021-05-29 06:23:47

webpack esbuild

2021-06-09 09:32:58

Esbuild 工具前端

2020-02-27 15:44:41

Nginx服务器反向代理

2024-02-26 21:15:20

Kafka缓存参数

2020-02-27 21:03:30

调度器架构效率

2020-03-30 15:05:46

Kafka消息数据

2023-08-29 07:46:08

Redis数据ReHash

2020-10-15 09:19:36

Elasticsear查询速度

2023-03-21 08:02:36

Redis6.0IO多线程

2020-10-21 09:17:52

Redis面试内存

2020-04-27 07:13:37

Nginx底层进程

2021-03-18 14:34:34

达达集团京东云电商

2022-01-04 08:54:32

Redis数据库数据类型

2023-11-02 10:22:29

gRPC后端通信

2017-06-06 16:30:55

戴尔交付保障

2021-06-27 22:48:28

Redis数据库内存

2013-06-14 10:12:22

共享并行

2013-06-19 10:55:40

Disruptor并发框架

2019-06-17 14:20:51

Redis数据库Java

2013-06-17 14:41:10

Disruptor并发编程
点赞
收藏

51CTO技术栈公众号