下载APP
登录
关闭
讲堂
算法训练营
Python 进阶训练营
企业服务
极客商城
客户端下载
兑换中心
渠道合作
推荐作者
当前播放: 95 | 上游出现失败时的容错方案
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看

Nginx核心知识100讲

共155讲 · 155课时,约1300分钟
18541
免费
01 | 课程综述
免费
02 | Nginx适用于哪些场景?
免费
03 | Nginx出现的历史背景
免费
04 | 为什么用Nginx:它的 5 ...
免费
05 | Nginx的四个主要组成部分
06 | Nginx的版本发布历史
07 | 选择哪一个Nginx发行版本...
08 | 编译出适合自己的Nginx
09 | Nginx配置文件的通用语法...
10 | Nginx命令行及演示:重载...
11 | 用Nginx搭建一个可用的静...
12 | 用Nginx搭建一个具备缓存...
13 | 用GoAccess实现可视化并实...
14 | 从网络原理来看SSL安全协...
15 | 对称加密与非对称加密各自...
16 | SSL证书的公信力是如何保...
17 | SSL协议握手时Nginx的性能...
18 | 用免费SSL证书实现一个HTT...
19 | 基于OpenResty用Lua语言...
20 | Nginx的请求处理流程
21 | Nginx的进程结构
22 | Nginx的进程结构实例演示
23 | 使用信号管理Nginx的父子...
24 | reload重载配置文件的真相
25 | 热升级的完整流程
26 | 优雅地关闭worker进程
27 | 网络收发与Nginx事件间的...
28 | Nginx网络事件实例演示
29 | Nginx的事件驱动模型
30 | epoll的优劣及原理
31 | Nginx的请求切换
32 | 同步&异步、阻塞&非阻塞...
33 | Nginx的模块究竟是什么?
34 | Nginx模块的分类
35 | Nginx如何通过连接池处理...
36 | 内存池对性能的影响
37 | 所有worker进程协同工作的...
38 | 用好共享内存的工具:Slab...
39 | 哈希表的max_size与bucke...
40 | Nginx中最常用的容器:红...
41 | 使用动态模块来提升运维效...
免费
42 | 第三章内容介绍
43 | 冲突的配置指令以谁为准?
44 | Listen指令的用法
免费
45 | 处理HTTP请求头部的流程
46 | Nginx中的正则表达式
47 | 如何找到处理请求的server...
48 | 详解HTTP请求的11个阶段
49 | 11个阶段的顺序处理
50 | postread阶段:获取真实客...
51 | rewrite阶段的rewrite模块...
52 | rewrite阶段的rewrite模块...
53 | rewrite阶段的rewrite模块...
54 | find_config阶段:找到处...
55 | preaccess阶段:对连接做...
56 | preaccess阶段:对请求做...
57 | access阶段:对ip做限制的...
58 | access阶段:对用户名密码...
59 | access阶段:使用第三方做...
60 | access阶段的satisfy指令
61 | precontent阶段:按序访问...
62 | 实时拷贝流量:precontent...
63 | content阶段:详解root和a...
64 | static模块提供的3个变量
65 | static模块对url不以斜杠...
66 | index和autoindex模块的用...
67 | 提升多个小文件性能的conc...
68 | access日志的详细用法
69 | HTTP过滤模块的调用流程
70 | 用过滤模块更改响应中的字...
71 | 用过滤模块在http响应的前...
72 | Nginx变量的运行原理
73 | HTTP框架提供的请求相关的...
74 | HTTP框架提供的其他变量
75 | 使用变量防盗链的referer...
76 | 使用变量实现防盗链功能实...
77 | 为复杂的业务生成新的变量...
78 | 通过变量指定少量用户实现...
79 | 根据IP地址范围的匹配生成...
80 | 使用变量获得用户的地理位...
81 | 对客户端使用keepalive提...
82 | 反向代理与负载均衡原理
83 | 负载均衡策略:round-rob...
84 | 负载均衡哈希算法:ip_has...
85 | 一致性哈希算法:hash模块
86 | 最少连接算法以及如何跨wo...
87 | upstream模块提供的变量
88 | proxy模块处理请求的流程
89 | proxy模块中的proxy_pas...
90 | 根据指令修改发往上游的请...
91 | 接收用户请求包体的方式
92 | 与上游服务建立连接
93 | 接收上游的响应
94 | 处理上游的响应头部
95 | 上游出现失败时的容错方案
96 | 对上游使用SSL连接
97 | 用好浏览器的缓存
98 | Nginx决策浏览器过期缓存...
99 | 缓存的基本用法
100 | 对客户端请求的缓存处理...
101 | 接收上游响应的缓存处理...
102 | 如何减轻缓存失效时上游...
103 | 及时清除缓存
104 | uwsgi、fastcgi、scgi指...
105 | memcached反向代理的用法
106 | 搭建websocket反向代理
107 | 用分片提升缓存效率
108 | open file cache提升系...
109 | HTTP/2协议介绍
110 | 搭建HTTP/2服务并推送资...
111 | gRPC反向代理
112 | stream四层反向代理的7个...
113 | proxy protocol协议与r...
114 | 限并发连接、限IP、记日...
115 | stream四层反向代理处理S...
116 | stream_preread模块取出S...
117 | stream proxy四层反向...
118 | UDP反向代理
119 | 透传IP地址的3个方案
120 | 性能优化方法论
121 | 如何高效使用CPU
122 | 多核间的负载均衡
免费
123 | 控制TCP三次握手参数
免费
124 | 建立TCP连接的优化
125 | 滑动窗口与缓冲区
126 | 优化缓冲区与传输效率
127 | 慢启动与拥塞窗口
128 | TCP协议的keepalive功能
129 | 减少关闭连接时的time_wa...
130 | lingering_close延迟关闭...
131 | 应用层协议的优化
免费
132 | 磁盘IO的优化
133 | 减少磁盘读写次数
134 | 零拷贝与gzip_static模...
135 | 用tcmalloc优化内存分配
136 | 使用Google PerfTools分...
137 | 使用stub_status模块监控...
138 | 第三方模块源码的阅读
139 | Nginx的启动流程
140 | HTTP第三方模块的初始化
141 | if指令是邪恶的吗?
142 | 解读Nginx的核心转储文件
143 | 通过debug日志定位问题
144 | OpenResty概述
145 | OpenResty中的Nginx模块...
146 | 如何在Nginx中嵌入Lua代...
147 | OpenResty中Lua与C代码...
148 | 获取、修改请求与响应的S...
149 | 工具类型的SDK
150 | 同步且非阻塞的底层SDK:...
151 | 基于协程的并发编程SDK
152 | 定时器及时间相关的SDK
153 | share.DICT基于共享内存...
154 | 子请求的使用方法
155 | 基于OpenResty的WAF防火...

精选留言(12)

  • 2019-01-22
    老师,如果用淘宝的 tengine 的 ngx_http_upstream_check_module 模块,他的默认规则是 check interval=3000 rise=2 fall=5 timeout=1000 type=tcp,也就是 每3秒钟检查一次,累计5次失败,就标记服务器为 down 剔除节点。我想问这种情况下,如果一个上游服务器出了问题,在把有问题的节点标记为 down 之前,是不是还是有 15s 的报错,

    作者回复: 这个模块我没有用过,不清楚它是否屏蔽了next_upstream指令,Nginx官方提供的next_upstream指令是可以在一台server出错时,及时的转换到下一个server返回,使客户端能够得到正确响应的。

    3
  • 2019-01-08
    测试了一把,需要在upstream 中的每一条后端记录上添加这个指标 max_fails=1 fail_timeout=60s。然后可以实现异常后自动将其摘除60s。

    可以实现自动检测的 貌似可以用淘宝的模块nginx_upstream_check_module-master 实现

    作者回复: 淘宝的模块可以定期通过心跳检查上游,与本节课介绍方式不太一样:-)

    1
  • 2019-01-08
    nginx 默认的proxy_next_upstream 应该是配置了error和timeout,max_fails=1 fail_timeout=10s。这样如果后端的设备不是全部故障的话,应该不会出现异常的页面吧。

    但是我这里使用了缓存后,就不会自动切换了,不知为何,配置如下。
    proxy_cache_path /home/yum_cache/ levels=1:2 keys_zone=cache1:1024m inactive=1d max_size=30g;

    upstream "yumproxy" {
         server 192.168.1.10:80;
         server 192.168.2.10:80 backup;
    }

    location ~ \.(php|xml)$ {
       proxy_set_header Host $host;
       proxy_set_header X-Forwarded-For $remote_addr;
       proxy_pass http://yumproxy;
       proxy_cache cache1;
       proxy_cache_key $host$uri$is_args$args;
       access_log logs/cache.log main;
       proxy_cache_valid 200 304 301 302 1m;
       #在此指定时间过期后,会主动去源服务器更新数据信息
       proxy_cache_valid any 0s;
    }

    location / {
         proxy_pass http://yumproxy;
    }

    根据这个配置,如果主节点异常了,理论上backup的节点应该会被直接访问到,但是当我把主节点停掉的时候,再访问这个缓存节点的时候,就会出现502的错误。


    展开

    作者回复: 你用的是哪个版本的Nginx?我根据你的配置,在我的服务器上修改后,发现主节点异常后仍然正常跳到backup节点,没有收到502。
    我用的是最新的Nginx版本。

    1
  • 老师你好,如果配置了ngx_http_upstream_module模块的upstream,nginx请求到后端rs集群不可用的节点时,请求就会被转发到下一正常节点,还需要配置 ngx_http_proxy_module模块的proxy_next_upstream指令吗?这两者的功能有什么区别呢?

    作者回复: 其实upstream默认自带next_upstream功能,各反向代理模块使用了它,并通过proxy_next_upstream这样的指令暴露出来了。
    所以,proxy_next_upstream 的默认配置很重要,例如:Default:     proxy_next_upstream error timeout; 你可以看到,它默认是开启的。

  • 2019-07-24
    老师还请教下,我用淘宝的tengine 测试在默认情况下出现一次超时,nginx认为服务不可用,我把不可用时间修改为1分钟,在这一分钟内,健康检查是3秒一次,成功的阀值为1,但是在一分钟内该机器还是不可用,没有看到流量进来,只有过了一分钟在有流量过来,我想问老师的是,这个healthcheck和nginx自身的容灾是独立的吗?谢谢
  • 2019-06-28
    老师请问下,nginx upstream server不可用是由不成功的请求次数max_fails(默认是1)即1次就不可用,不可用的时间是fail_timeout(默认是10秒)参数决定的,但是什么情况下算不成功的请求呢,官方文档说是proxy_next_upstream 来决定的,proxy_next_upstream 定义了这几种错误,error | timeout | invalid_header | http_500 | http_502 | http_503 | http_504 | http_403 | http_404 | http_429 ,默认是error | timeout,即请求出现这两种情况时认为是不成功的请求,则找next server,如next server也不可用,那应该找backup了,但是如果proxy_next_upstream 配为off,是不是next server都不找了,直接到backup了,老师我这样理解对不,谢谢
    展开

    作者回复: 不是,off后backup也不会找,请求失败

  • 2019-06-16
    老师请问下nginx链接后端服务出现110 链接超时,有什么方法可以排查补,后端服务正常,但nginx不定期出现链接超时,链接超时时间都改为90秒了,超时的包也不好抓到,请问老师还有什么好办法不。谢谢了

    作者回复: 抓包从网络上找下原因吧。用tcpdump抓包,在wireshark在分析,基于会话和图标,基于相对时间,很容易看出到底是握手时缺了哪一个报文。可以参考我的《Web协议详解与抓包实战》第37课。

  • 2019-03-23
    测试环境和生产环境Nginx版本都为1.14
  • 2019-03-23
    老师,我今天遇到一个问题,我们生产环境的Nginx,upstream里面配置了两个上游服务,当其中一个上游服务,被stop之后,此上游服务器已经没有侦听此端口了,Nginx依然将请求转发至此故障节点,并直接给客户端响应502,而且是没两个请求,就有一个请求502.

    我特意测试过,在我搭建的测试环境,不对nginx做任何显示配置的情况下,nginx也会自动将请求转发至下一个后端节点处理,而不会返回502,这是nginx默认对reset错误的处理方法,我比对了生产的配置,并拿到测试环境测试,并不能在测试环境重现问题。

    生产的问题还没有得到解决,不知道老师是否能提供意见建议?
    展开

    作者回复: 似乎是proxy next upstream没有配对?

  • 2019-01-30
    陶老师,如果后端服务器出现问题,但是后来又恢复正常了,请求通过轮询还会再打到这台机器吗?这个检查后端机器的策略是什么呢?

    作者回复: 你配置了fail_timeout吗?认为上游服务不可用后,在fail_timeout秒内都不会再访问,fail_timeout秒后继续原策略。fail_timeout默认是10秒。

  • 2019-01-29
    应该是 proxy_next_upstream
  • 2019-01-29
    我们现在的生产环境架构就是多机的NGINX集群 next_proxy_upstream 很适合做对上游服务器的容错 让用户体验更好👍🏻