实际上造成此问题的核心还是请求并发太大(实际的场景也是这样的,有一个大量的图片现实服务)
环境说明
一般大家部署nginx (openresty)的时候都会开启keepalive_timeout的,当前版本默认是75s,我们使用了65s
可选的优化方法
-
- 禁用http2
如果搜索相关问题,会看到禁用http2之后错误消失了,此问题就是http2的,禁用应该就没有了,因为是图片服务,我们是希望使用http2
的多路复用,提高图片现实的速度,所以此方法先放弃了 - 加大http2_max_concurrent_streams
默认为128 但是经过测试之后还是没有解决,此问题依然很明显 (尝试过调整不同的参数,500,1000) - 调整http2_max_requests (1.19.7 之后修改为了keepalive_requests) 1.19.10 之前的版本默认参数为100
因为我们使用的openresty 1.19.9.1 (nginx 版本1.19.9)所以直接修改keepalive_requests 为1000
经过测试问题缓解,基本可以算是100%解决,服务比较稳定,此参数应该结合实际进行调整修改
说明
以上只是在解决碰到问题的一些方法尝试,理论上对于大并发场景,大家基于nginx http2 都会存在类似的问题,可以参考
多看看nignx 的changes还是很有用的(出现问题官方文档应该经常翻),openresty 也是一样的,目前openresty1.21.4 rc1 已经发布了,期待ga,对于nginx的配置还是应该结合实际业务场景进行调整优化,没有通用的配置,只有不断优化的参数,http2 协议是复杂的,http3 更加复杂,了解下相关的协议还是很有用的,至少我们排错解决问题会快很多