详解压测中出现的 nginx 502 no live upstreams 错误
详解压测中出现的 nginx 502 no live upstreams 错误
在一次压测过程中,发现随着并发用户量的增加,压测客户端收到错误请求越来越多,Nginx 返回大量 502 Bad Gateway
错误。
以此次压测为契机,让我们有机会探讨高并发环境下可能出现的问题,本文借助 nginx 和 Linux 内核源码,分析产生 502 错误码的原因,并提出相应解决办法,为今后解决类似问题提供思路和参考。
背景和现象
项目部署在三台腾讯云服务器上,其中两台部署了 web 服务,运行在 docker 里,另一台在宿主机上部署了 Nginx,用来反代两台应用服务器。
机器配置:
系统: CentOS 7.5.1804
CPU: 2x8 Core 2.4 GHz
内存:32G
硬盘:50G + 500G
压测机在同一网段的另一台机器上,压测启动时,只压部署 Nginx 的机器。
从后台日志看,预测服务的响应时间大概在 2ms 左右,平稳的 TPS 在 2600 左右,压测一段时间后,错误率开始上升,TPS 发生抖动。
具体看附件中的内容。
xnathan.com-详解压测中出现的 nginx 502 no live upstreams 错误.pdf
目录 返回
首页