极客时间-轻松学习，高效学习-极客邦

我来也

2019-02-22

[D40打卡]
我之前理解的网络延迟分三部分：客户端到服务端，服务端逻辑处理，服务端到客户端到耗时。

其中服务端逻辑处理的耗时是跟自身程序有关的，另外两个耗时跟宽带服务提供商有关，想更短的耗时就得加钱：选更优的线路或者在靠近客户端的地方加入口。

目前我们线上程序是可以推算出单次响应的时间的，因为在出入口的地方有记录。不管中间经过了多少服务的处理，都可以算出总的耗时。

我们在客户端中也加了汇报功能，在客户端的某些消息中会汇报客户端实际发送请求->收到服务端响应的时间差。这样便于我们确认客户端的网络状况。

从本文中，第一次见到了 Nagle 算法。也知道了服务端关闭icmp时怎么用tcp/udp测试网络延迟。

文中的内容也是跌宕起伏，分析着怎么还是客户端的问题，客户端访问另外一个服务还是好的。原来是服务端程序也有问题，一个巴掌拍不响。😂

展开

作者回复: 😊谢谢分享你的经验



 6
Christmas

2019-03-04

以前经常看到tcp no delay的socket设置，一直不求甚解，这次终于懂了，nagle算法



 3
Andylee

2019-02-22

我记得之前碰到的延迟ack是200ms，这个是可以配置的吗？

作者回复: 看系统的，据我所知，只有RHEL可以通过/proc/sys/net/ipv4/tcp_delack_min修改（默认40ms），而其他发行版都不支持。



 3
Linuxer

2019-02-22

案例中能设置客户端的TCP_QUICKACK解决吗？

作者回复: 嗯，只是客户端有可能在用户那儿，可能无法控制这些选项



 2
微微

2019-10-21

遇到一个问题，backlog设置的很大，有22w，但是用ss -ltn命令查看这个监听端口的Send-Q和Recv-Q都是0，但是用命令netstat -s|egrep "listen|LISTEN"的溢出值一直在上升，统计这个端口的连接数还不到5000，请问可能会是什么原因？

 2

 1
大坏狐狸

2019-05-27

额第二次居然curl不通了。。18.04 的防火墙是ufw ,需要ufw allow 80/tcp

作者回复: 👍 谢谢分享



 1
Maxwell

2019-03-24

为什么执行strace -f wrk --latency -c 100 -t 2 --timeout 2 http://192.168.126.136:8080/，输出结果中并没有TCP_NODELAY配置选项呢？

作者回复: 是不是还有其他报错？



 1
青石

2019-03-19

网上查了Nagle算法的定义：任意时刻，最多只能有一个未被确认的小段。所谓“小段”，指的是小于MSS尺寸的数据块，所谓“未被确认”，是指一个数据块发送出去后，没有收到对方发送的ACK确认该数据已收到。

对比80端口和8080端口的报文，80端口的报文中，响应消息再发送完header后立刻发送body部分；8080端口的报文，响应消息再发送完header后，需要获得ACK响应后，才会发送body部分。

8080端口报文中server端在获得到ACK响应后才发送body部分，就是因为Nagle算法必须确认这个数据块被收到的原因。client在40ms后发送ACK是因为客户端没有开启TCP_QUICKACK的缘故。

请问老师，这样理解，对吗？

展开

作者回复: 嗯



 1
楚

2019-02-28

你好，我在网络编程中遇到一个问题，
我们用go语言做的服务调用其他HTTP服务器，发现HTTP请求中卡住，概率非常低。
然后我看了发现write，返回eagain，然后就等待epoll通知描述符是否可用，这个时候发现等了很久很久都不可用。netstata看了下，TCP写buffer有数据但是没有满，等了很久也貌似发生不出去，有重传，但是还是传不出去。直接达到rto次数内核中断连接。
我们只能将rto改很小让内核中断连接。
请问这种情况一般都是由什么原因引起的呢？

展开

作者回复: 这个因素比较多，RTO超时说明已经发生来重传，根源上还是要看为什么会发生重传，比如是否有丢包、是否超出了内核中的资源限制或者对端是否有类似的问题等等。这些最好两端抓包对比分析



 1
怀特

2019-02-22

traceroute 会在路由的每一跳发送三个包，并在收到响应后，输出往返延时。如果无响应或者响应超时（默认 5s），就会输出一个星号。
----这个地方，还有些不明白，希望老师能在这里再解释几句

作者回复: 就是说星号表示没有收到这一跳的响应



 1
HelloTalk

2019-12-29

为什么 TCP Flows 那个图里面的 “第一次请求和响应” 的第一个client->server是 PSH+ACK的报文呢？

我感觉子一个报文应该是纯packet才对阿，后面客户端回的报文才是 PSH+ACK




Magic Star Trace

2019-08-25

请问：物理机centos 7 ，kvm 上虚拟机丢包不稳定是什么问题导致的呢？
time 延迟很不稳定

作者回复: 用本文的思路分析一下，看看有什么发现？




阳光梦

2019-06-24

您好，请教下。我通过客户端直接访问服务器，平均响应延迟是30ms，经过nginx代理响应延迟是200ms，我使用的ngx+lua，业务逻辑是先查询worker进程的缓存，没有再查redis，再没有查mysql，现在lua层面可以优化的已经优化了，平均响应延迟还是170ms,不知道通过什么工具能定位具体哪里导致响应延迟慢呢？谢谢！

作者回复: 试试动态追踪（专栏第50、51篇）怎么样？




坤丰

2019-05-15

不考虑磁盘问题，tcpdump 长期在生产环境打开，会有什么不良的影响吗？会影响到网络性能吗？如何去评估这样的问题

作者回复: 会的，不推荐长期开着




skye

2019-05-06

那nagle算法用在什么情况下呢？




大坏狐狸

2019-04-11

开始懵了。setsocket那里没找到。。不过确实nginx的那个nodeplay 为off




如果

2019-04-08

DAY40，打卡




楚

2019-03-06

文中没有说过有什么方法。而且我这是抓包根本看不出什么。只看见重传15次后连接断开。
我想请教的是，一般什么原因导致重传这么多次还是没有重传成功呢？
write buffer一直有数据且大小不变，代表数据一直发不出去。
而TCP心跳在有数据在write buffer情况下是不会发生心跳的。




科学Jia

2019-03-06

老师这个案例非常好，受益匪浅，让我决心好好再温习下tcp的基础知识。还是基础最重要。




楚

2019-03-05

你好，但是每次出问题都要等到重传15次。而且write buffer都不变。
应该不是简单超时吧。

作者回复: 嗯，可以用文中的方法分析看看



