社区编辑申请
注册/登录
HTTP 缓存策略:强缓存和协商缓存
存储 数据管理
缓存(Cache)是一种数据存储技术,广泛应用在电脑工程领域。

大家好,我是前端西瓜哥。今天讲一下 HTTP 缓存策略的强缓存和协商缓存。

缓存是什么?

缓存(Cache)是一种数据存储技术,广泛应用在电脑工程领域。

它将原本访问起来较慢的数据,放到访问更快的存储介质中,当第二次访问时,能够更快地访问数据,是一种 空间换时间 的做法。

比如,有个文件经常被读取,且很少改变,那我们就直接将其缓存到内存中,节省掉耗时的 IO 磁盘读取时间。

再比如,在写代码时,我们的一个方法会接受参数,然后计算返回一个结果,假设这个计算过程非常耗时,且结果值只依赖传入的参数。

那我们就可以将参数和结果的对应映射,保存到哈希表中,下次如果是相同参数,就能命中然后直接从哈希表里获取,速度有了极大提升。

HTTP 缓存也是一样的道理,用户通过 HTTP 请求访问的资源会缓存到本地,在用户第二次访问相同资源时,直接使用之前缓存的资源。

当然资源可能并不一定是不变的,在必要的时候需要更新缓存。为此我们可能需要设置一下缓存的有效期,或是发送一个占用带宽小的请求询问服务端等等。

这些,就是 HTTP 缓存策略。

强缓存

强缓存,指的是 让浏览器强制缓存服务端提供的资源。

“东西就给你了,没事别找我。”

Cache-Control: max-age=<seconds>

响应头字段 Cache-Control,通过设置 max-age=<seconds>,可以规定资源的缓存有效时间长度,单位为秒。

需要注意的是 Cache-Control 是通用头字段,请求头和响应头中都可以使用。

响应头字段的 Cache-Control 用于告知客户端如何缓存资源。

客户端的 Cache-Control 则是告知服务器需要多新鲜的资源,比如 no-cache 或 max-age=0 表示要最新鲜的资源。

Cache-Control: max-age=31536000

在浏览器 devtool 的 network 面板,我们看到 from disk cache 的字样,代表这个资源并没有去发送请求,而是使用了来自硬盘的缓存。

如果你不停地刷新页面,你还会看到 from memory cache :来自内存的缓存。因为刷新前资源正在使用,还在内存中,刷新后浏览器就直接从内存中取出来了。

当你强制刷新时,浏览器会在请求头中加上 Cache-Control: no-cache 或是 Cache-Control: max-age=0,要求服务端返回最新资源。

Expires

Cache-Control: max-age= ,是缓存的有效时长。

当看到一个叫 max-age(有效时长)的东西时,我们经常会发现它的孪生兄弟:Expires(过期时间点)。如果你熟悉 Cookies,你会发现 Cookies 也有这么一对属性。

Expires: Wed, 21 Oct 2015 07:28:00 GMT

Expires 使用的 GMT 格式的时间戳字符串。

当 max-age 和 Expires 都存在时,使用 max-age。这点和 Cookies 一样。

强缓存,就是让浏览器将资源缓存下来,在缓存过期前,不发送请求获取新资源,而是直接使用本地资源。

协商缓存

协商缓存,是在缓存过期的情况下,客户端和服务端协商,确认客户端缓存是否需要更新。

Last-Modified 和 If-Modified-Since

响应头字段 Last-Modified 表示提供的资源最后被修改的时间。值是 GMT 格式的字符串。

Last-Modified: Sat, 09 Apr 2022 14:47:36 GMT

这个时间会标记在对应缓存上,起到标识的作用。

当浏览器的缓存失效后,会再次请求服务端,并带上 If-Modified-Since 请求头字段,它的值就是之前 Last-Modified 带过来的值。

If-Modified-Since: Sat, 09 Apr 2022 14:47:36 GMT

当服务端发现资源最后修改时间和 If-modified-since 值相等,代表资源从该时间后再未改变过。

服务端于是返回 304(Not Modified)状态码,表示资源没有改变,并且响应体为空。浏览器拿到后,就知道原本可能过期的缓存其实还可以继续使用。

如果资源改变了,就会返回 200,且响应体带上最新资源。

ETag 和 If-None-Match

除了用 Last-Modified 代表的资源最后修改时间作为标识,我们还可以使用 ETag 响应头。

ETag 的值没有规定,你可以是时间戳的哈希值,也可以是版本号。

另外 ETag 分为强 ETag 和弱 ETag,其中弱 ETag 以为 W/ 开头。

ETag: "33a64df551425fcc55e4d42a148795d9f25f89d4"
ETag: W/"0815"

然后和 If-Modified-Since 一样,当缓存过期时,客户端会在请求头带上 If-None-Match 去请求资源。

If-None-Match: "33a64df551425fcc55e4d42a148795d9f25f89d4"

如果资源依旧新鲜,则返回 304,客户端继续复用本地资源。

结尾

强缓存,设置一个过期时间,让客户端在过期前使用本地缓存,直到过期才请求更新鲜的资源。涉及的头字段有 Cache-Control: max-age= 或 Expires 。

协商缓存,在客户端缓存过期的情况下,和服务端协商一下,是否可以继续使用本地缓存。涉及的头字段有 Last-Modified / If-Modified-Since 和 ETag / If-None-Match。

不过需要注意的是,这些都只是规范,我们无法确定客户端或服务端在实现上完全遵循,而且可能在版本更新中会出现一些 bug。

所以对于发生变化的文件,我更倾向于给文件名加上哈希串。毕竟,访问一个从来没访问过的资源,客户端是不会有缓存的。这样就能绕开缓存机制,真正拿到最新资源,而不会掉入缓存陷阱。

参考

  • RFC7234 - Request Cache-Control Directives:https://www.rfc-editor.org/rfc/rfc7234#section-5.2.1。
  • RFC7232 - Weak versus Strong:https://www.rfc-editor.org/rfc/rfc7232#section-2.1。
  • stackoverflow - What takes precedence: the ETag or Last-Modified HTTP header?:https://stackoverflow.com/questions/824152/what-takes-precedence-the-etag-or-last-modified-http-header。
责任编辑:姜华 来源: 今日头条
相关推荐

2022-04-01 10:08:21

SQL 优化MySQL数据库

2022-03-31 08:21:14

数据库缓存双写数据一致性

2022-03-31 13:58:37

分布式SpringRedis

2022-05-09 15:08:56

存储厂商NFV领域华为

2022-03-04 14:57:50

缓存数据库代码

2022-04-01 16:55:22

2022-04-28 09:46:20

Nginx文件Linux

2022-03-22 07:37:33

DNS域名IP

2021-12-01 08:26:27

2022-05-17 11:46:48

高并发服务数据库

2022-03-29 10:39:10

2022-03-16 14:45:18

MySQL慢查询数据库

2022-03-19 12:16:49

Redis高并发系统集群部署

2022-05-07 09:08:13

路由策略网络规划

2022-04-13 18:40:59

Python开发

2022-05-09 16:33:03

EDR终端安全

2022-04-12 09:48:22

云计算安全云服务云安全

2021-12-26 14:32:11

2022-04-27 18:49:29

黑客网络攻击

2022-04-18 09:07:54

Linux网络延迟

同话题下的热门内容

人工智能赋能兼容测试,引领智能测试风向大型系统存储层迁移实践理“Druid 元数据”之乱磁盘预测技术助力潮数保护重庆市监局档案数据不止于备份恢复,Commvault File Storage Optimization加速数据迁移潮数保护陕西汉德车桥数据 推动“二次汽车下乡”

编辑推荐

从携程系统瘫痪,看国内企业数据管理乱象大数据有道之spark选择去重微服务架构下的分布式数据管理分布式存储中的元数据管理数据管理的未来发展趋势
我收藏的内容
点赞
收藏

51CTO技术栈公众号