HTTP缓存机制

HTTP 缓存机制

强缓存

强缓存流程

涉及到字段：
● 请求返回 Expire 字段 http1.0 的产物，来设置过期时间，它是服务端生成，可能存在客户端和服务器端时间不一致，或者前端可以修改本地时间，导致缓存命中产生误差，目前基本都被 Cache-Control 替代了
● Cache-Control http1.1，一般使用 max-age 来设置缓存多长时间，单位秒；no-store 禁止一切缓存，no-cache 强制客户端向服务器发请求，服务器收到请求，然后判断内容是否变更，变更了就返回新内容，没有就返回 304；这个单词很容易误解，以为不缓存，其实是会被缓存的，只不过每次请求，都要服务端验证缓存。

协商缓存

协商缓存流程

第一次请求数据：服务器会将缓存标识和数据返回给浏览器，然后将两者保存在缓存数据库中

再次发请求：浏览器会将标识发送给服务器检测，是否过期，如果没有过期，就返回 304 状态码，可以使用缓存数据，如果过期了，服务器重新响应数据。

有两对字段配合检测缓存是否过期

● Last-Modified / If-Modified-Since：服务器响应的时候会返回，访问的资源最后修改的时间 Last-Modified，下一次请求的时候，会通过 If-Modified-Since 字段带上修改的时间，服务器回去对比资源修改的时间，如果不相同就说明修改过了，返回新的响应数据，重新缓存，如果相同就可以继续使用缓存，并返回 304 状态码。

● Etag / If-None-Match（优先级高于 Last-Modified / If-Modified-Since）：服务器响应的时候，会返回一个当前资源的标识（唯一的），下一次请求的时候，会通过 If-None-Match 字段带上这个标识，服务器去对比传过来的标识和当前资源的标识是否一致，如果不一致说明被修改过了，否则就可以继续使用缓存，并返回 304 状态码。

为什么存在 Last-Modified 和 Etag 一起设置的情况？

Etag 和 Last-Modified 是允许一起使用的，服务器会优先验证 Etag，在 Etag 一致的情况下，再去对比 Last-Modified，这是为了防止有一些 HTTP 服务器未将文件修改日期纳入哈希范围内。

我们知道 Etag 是根据文件内容来生成哈希值的，ETag 的值，默认是对文件的索引节点（INode），大小（Size）和最后修改时间（MTime）进行 Hash 后得到的。假如我生成 Etag 生成策略不包含修改时间，改完后的内容索引节点和大小还是一样，其实内容变了，但是由于生成策略不包含修改时间，导致生成 Etag 一样了，所以还要通过 Last-Modified 字段来判断资源修改时间。

为什么要有两种缓存呢？有了强缓存为什么还要有协商缓存？

因为强缓存有缺陷，假如通过 max-age 设置了过期时间，到了过期时间，但是其实内容并没有变更，就需要重新拉取资源，因此就有了 Last-Modified 字段，用来对比前后资源修改的时间，但是 Last-Modified 字段也有缺陷，因为它的时间是 s，如果 1s 内有资源修改了，它的修改时间是不会变的，所以还是会命中缓存的，不会重新获取资源的，最后就推出了 Etag，通过对比资源内容的来判断是否修改。

HTTP 缓存整体流程图

强缓存优先级高于协商缓存

HTTP 缓存整体流程图

参考文章：

从未如此简单：5 分钟搞懂 HTTP 缓存机制

网络

#HTTP

如何优化构建速度上一篇

React 批处理机制下一篇