Http 响应头中的 ETag 值是如何生成的

网络 网络管理
1. 尽量便于计算,不会特别耗 CPU。这样子利用摘要算法生成 (MD5, SHA128, SHA256) 需要慎重考虑,因为他们是 CPU 密集型运算。

​关于 etag 的生成需要满足几个条件,至少是宽松满足

  1. 当文件更改时,etag 值必须改变。
  2. 尽量便于计算,不会特别耗 CPU。这样子利用摘要算法生成 (MD5, SHA128, SHA256) 需要慎重考虑,因为他们是 CPU 密集型运算
  3. 必须横向扩展,分布式部署时多个服务器节点上生成的 etag 值保持一致。这样子 inode 就排除了

以上几个条件是理论上的成立条件,那在真正实践中,应该如何处理?

我们来看一下 nginx 中是如何做的

nginx 中 ETag 的生成

我翻阅了 nginx 的源代码,并翻译成伪代码如下:由 last_modified 与 content_length 拼接而成

etag = header.last_modified + header.content_lenth

可见源码位置,并在以下贴出: ngx_http_core_modules.c

etag->value.len = ngx_sprintf(etag->value.data, "\"%xT-%xO\"",
r->headers_out.last_modified_time,
r->headers_out.content_length_n)
- etag->value.data;

总结:nginx 中 etag 由响应头的 Last-Modified 与 Content-Length 表示为十六进制组合而成。

随手在我的k8s集群里找个 nginx 服务测试一下

$ curl --head 10.97.109.49
HTTP/1.1 200 OK
Server: nginx/1.16.0
Date: Tue, 10 Dec 2019 06:45:24 GMT
Content-Type: text/html
Content-Length: 612
Last-Modified: Tue, 23 Apr 2019 10:18:21 GMT
Connection: keep-alive
ETag: "5cbee66d-264"
Accept-Ranges: bytes

由 etag 计算 Last-Modified 与 Content-Length,使用 js 计算如下,结果相符

> new Date(parseInt('5cbee66d', 16) * 1000).toJSON()
"2019-04-23T10:18:21.000Z"
> parseInt('264', 16)
612

Nginx 中的 ETag 算法及其不足

协商缓存用来计算资源是否返回 304,我们知道协商缓存有两种方式

  • Last-Modified/if-Modified-Since
  • ETag/If-None-Match

既然在 nginx 中 ETag 由 Last-Modified 和 Content-Length 组成,那它便算是一个加强版的 Last-Modified 了,那加强在什么地方呢?

Last-Modified 是由一个 unix timestamp 表示,则意味着它只能作用于秒级的改变,而 nginx 中的 ETag 添加了文件大小的附加条件

那下一个问题:如果 http 响应头中 ETag 值改变了,是否意味着文件内容一定已经更改

答案:不能。

因此使用 nginx 计算 304 有一定局限性:在 1s 内修改了文件并且保持文件大小不变。但这种情况出现的概率极低就是了,因此在正常情况下可以容忍一个不太完美但是高效的算法。

文章出自:​​前端餐厅​​,如有转载本文请联系前端餐厅ReTech今日头条号。

github:https://github.com/zuopf769

责任编辑:武晓燕 来源: 今日头条
相关推荐

2021-07-23 15:55:31

HTTPETag前端

2021-05-26 05:18:51

HTTP ETag Entity Tag

2017-02-08 14:29:04

2021-07-27 14:50:15

axiosHTTP前端

2019-12-13 09:14:35

HTTP2协议

2015-07-09 10:32:23

Windows Ser云计算应用架构

2019-07-02 08:24:07

HTTPHTTPSTCP

2019-04-08 15:11:12

HTTP协议Web

2022-07-03 16:26:43

比特币货币加密货币

2019-01-27 14:37:47

数据HTTP服务

2023-09-19 22:41:30

控制器HTTP

2010-05-07 12:20:38

负载均衡etag

2009-06-04 10:41:52

Struts工作原理

2015-09-15 15:20:35

2011-10-14 09:23:14

2021-01-18 05:13:04

TomcatHttp

2023-11-08 09:49:19

Java实践

2021-08-06 09:21:26

Linux内核 Coredump

2009-08-04 13:31:35

C#自定义事件

2013-12-25 11:01:16

JavaScript
点赞
收藏

51CTO技术栈公众号