极客时间-轻松学习，高效学习-极客邦

Keep-Moving

2019-09-23

allreads = {0, 3};
老师，这一步是怎么实现的？没看出来

作者回复: 逐个解释一下：
1.FD_ZERO(&allreads);
所有的位置设置为0；

2. FD_SET(0, &allreads);
将描述字0的对应位置设置为1；

3.FD_SET(socket_fd, &allreads);
将监听套接字的对应位置设置为1。

这样就得到了allreads = {0, 3}。

 4

 4
莫珣

2019-09-23

我有些疑问，select的FD数组大小默认是1024，但是Linux的文件描述符大小一定不是1024，假设现在使用ulimit将一个进程可以打开的文件数设置成了65535，那么大于1024的文件描述符怎么加到FD数组中去呢，如果按照文本里说的，文件描述符代表数组下标的话不就加不进去了？

第二个问题，套接字有两个属性，接收低水位线和发送低水位线，当接收缓冲区中待接收的字节数大于接收低水位线，一个可读事件产生，那么如果永远都不能达到接收低水位线呢？

作者回复: 第一个问题，我理解是加不进去的，你不妨设计一个程序验证一下。

第二个问题，首先，这个值是可以调整的，我记得默认值即使1个byte，也就是说有数据就可以感知到；第二，如果一直达不到接收watermark，我理解不是一个正常的网络交互过程，正常的网络交互肯定是像流一样，不断有数据接收。

 1

 4
安排

2019-09-23

第一道：可以，就绪条件是有数据可读(检测可读事件)。是否可以监测可写事件不太清楚，没有实验过。

第二道：不一定需要传入，那样的话内核中for循环需要遍历整个集合，效率低。传入基数可以减小遍历范围，提高效率。

当然，api既然设计成这样了，那肯定需要传入一个数了。



 4
无名

2019-11-04

对于套接字可写状态中说的：套接字发送缓冲区足够大，怎么样算足够大呢？

作者回复: 实际上，只要有一个字节可以被写入，就是状态可写的。



 2
无名

2019-09-27

size_t rt = write(socket_fd, send_line, strlen(send_line));
if (rt < 0) {
error(1, errno, "write failed ");
}
这个代码中有错吧，应该将size_t改为sszie_t，size_t为unsigned long，这样错误-1被转换了。

作者回复: 是的，感谢指出。



 2
godtrue

2019-11-24

1：I/O 多路复用的设计初衷就是解决这样的场景，把标准输入、套接字等都看做 I/O 的一路，多路复用的意思，就是在任何一路 I/O 有“事件”发生的情况下，通知应用程序去处理相应的 I/O 事件，这样我们的程序就变成了“多面手”，在同一时刻仿佛可以处理多个 I/O 事件。
2：select 函数就是这样一种常见的 I/O 多路复用技术，使用 select 函数，通知内核挂起进程，当一个或多个 I/O 事件发生后，控制权返还给应用程序，由应用程序进行 I/O 事件的处理。

int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);

返回：若有就绪描述符则为其数目，若超时则为 0，若出错则为 -1

在这个函数中，maxfd 表示的是待测试的描述符基数，它的值是待测试的最大描述符加 1。
紧接着的是三个描述符集合，分别是读描述符集合 readset、写描述符集合 writeset 和异常描述符集合 exceptset，这三个分别通知内核，在哪些描述符上检测数据可以读，可以写和有异常发生。
三个描述符集合中的每一个都可以设置成空，这样就表示不需要内核进行相关的检测。
timeout设置成不同的值，会有不同的可能：
第一个可能是设置成空 (NULL)，表示如果没有 I/O 事件发生，则 select 一直等待下去。
第二个可能是设置一个非零的值，这个表示等待固定的一段时间后从 select 阻塞调用中返回。
第三个可能是将 tv_sec 和 tv_usec 都设置成 0，表示根本不等待，检测完毕立即返回。这种情况使用得比较少。

3：内核通知我们套接字有数据可以读了，使用 read 函数不会阻塞。
内核通知我们套接字可以往里写了，使用 write 函数就不会阻塞。

读了几遍，感觉还是没有抓住核心，所以，就将文中的要点摘录下来。
对IO多路复用的大概理解是，通过select函数去监听一组文件描述符，如果有事件就绪就交给应用程序去做对应的处理。

展开

作者回复: 总结得已经很到位了呀



 1
我也曾是少年

2019-10-20

老师，我看了一部分开源代码，golang的，我发现大多数有名的项目他们并发写套接字的时候，都是用一个阻塞对列，既向一个没有容量的channel中写，只有接收端接了，发送端才会继续往下面走，我觉得别人这么做肯定是有原因的，但是我摸不透，所以将这问题定位到并发写套接字上，不知老师对这问题怎么看

 2

 1
skye

2020-01-08

用select做多路复用，如果不用多线程，其中一路阻塞或者死锁了，那其它路就无法处理了，所以单线程处理的前提时没有阻塞和死锁，这样理解对吗？

作者回复: 我明白你想表达的是select之后处理事件的时候可能会阻塞，导致select不到其他事件，这点理解是对的。

至于单线程处理是不是一定没有阻塞(死锁我不太明白这里指的是具体什么情况)，我倒觉得不一定，当然，非阻塞效果可能更好一些。




麻雀

2019-12-30

您好，
第一，想问下select是不是能够在处理数据的同时继续轮询（监听）是否有新的套接字来到，它的内部是不是多线程呢？因为accept就是因为单线程在处理数据时，不能对这段时间内到来的套接字进行监听。
第二，FD_SET它是一个unsigned long数组，那么它怎么实现Bitmap，只是对数组的每个元素例如fd_set[10]对文件描述符为10的套接字来数据的时候设置为1吗？

作者回复: 第一，是可以的。这个机制是操作系统实现的，你可以把操作系统理解成一个"巨大"的无限循环处理器，无论是有数据需要读写，还是有新的套接字连接达到，这个巨大的无限循环处理器都是可以快速感知到(通过各种软硬件机制，比如中断)，这样你就可以明白，它的内部并不是多线程实现的。

第二，你的理解是正确的，就是对每个位来设置0或者1。




zhang

2019-12-18

问一个关于writefds的问题。有两个线程，以及一块要发送的内存buffer。第一个线程是创建了socket，设置为none blocking，并在select监听，代码类似select(max_fd+1, &read_fds, &write_fds, NULL, NULL)，在监听到writefds中if(FD_ISSET(client.sd, &write_fds))，从内存buffer中取出数据发送出去。第二个线程写入了一些字节到内存buffer，但怎么唤醒第一个线程还处于阻塞的select？
我试验第二个线程写入字节到内存buffer后调用FD_ZERO(&write_fds);FD_SET(client.sd, &write_fds);。第一个线程的if(FD_ISSET(client.sd, &write_fds)) { processSendRingBuf(); FD_ZERO(&write_fds); }。但并没有唤醒select。

展开

作者回复: 我刚刚回答了。这个时候需要使用管道或者socketpair来做。

 2


zmysang

2019-11-18

为什么描述字集合{0,1,4}，对应的 maxfd 是 5，而不是 4，就比较方便了。因为这个向量对应的是下面这样的：a[4],a[3],a[2],a[1],a[0]，待测试的描述符个数显然是 5。
请问老师这里的意思是假设待检测的描述字集合是{0，100}，那么实际上select函数会判断0-100这101个fd中值为1的fd,然后对其检测吗？

作者回复: 是的。




打奥特曼的小怪兽

2019-11-06

关于 FD_SET() 函数，debug看了下内存结构，{0,3} 如果设置了，实际上存储的是 2^0 + 2^3 = 9,并不会像图示的在每个位置上设置1。

作者回复: 我的意思就是00001001，在bit位上设置为1, 转换为10进制就是9。




GeekAmI

2019-10-25

问题2：没有看过源码，猜测应该有循环挂载描述符对应事件的过程。如果不传的话，可能只能按照最大的循环了(1024)，作为系统函数，执行效率需要优化到极致...




gogo

2019-09-27

老师我问两个基础问题啊:

1. 实际上，很多系统是用一个整型数组来表示一个描述字集合的，一个 32 位的整型数可以表示 32 个描述字，例如第一个整型数表示 0-31 描述字，第二个整型数可以表示 32-63 描述字，以此类推。

意思是: int num;
              int arr[num];
              arr[0] 表示0～31描述字
              arr[1] 表示32～63描数字
              ……
             arr[num-1] 表示 nun-1*32 ~ num-1*32 + 1描述字
这样吗？

2. 这个时候再来理解为什么描述字集合{0,1,4}，对应的 maxfd 是 5，而不是 4，就比较方便了。

因为这个向量对应的是下面这样的：


a[4],a[3],a[2],a[1],a[0]
复制代码

待测试的描述符个数显然是 5，而不是 4。

三个描述符集合中的每一个都可以设置成空，这样就表示不需要内核进行相关的检测。

这里的意思是 a[0] = NULL a[1] = NULL a[4] = NULL
是这个意思吗？

展开

作者回复: 是的，应该是a[0]=0,a[1]=0，全部置为0.




传说中的成大大

2019-09-24

第一问我记得管道是写了以后必须要等待对方读走才可以继续进行写操作,所以可以用select进行检测的
第二问要从怎么存储描述符集合当做的描述符来理解, 利用数组下标随机访问的特性,来提高运行效率,毕竟是内核运行的




Better me

2019-09-23

比如现在的 select 待测试的描述符集合是{0,1,4}，那么 maxfd 就是 5。这个不太懂，老师能在解释下吗

作者回复: maxfd表示的是"个数"，比如这里{0,1,4}，它对应的个数应用是5。就像一个大小为5的数组，每个数组元素的下标分别是{0,1,2,3,4}，数组的"个数"是4+1=5。

 2


向东

2019-09-23

32位整数，那么该数组的第一个元素对应于描述字0~31，第二个元素对应于描述字32~63，依此类推。没读懂，解答一下？多谢🙏

作者回复: 32位整数，一共有32个bit位，每个bit位可以表示两种状态，0或者1，如果开启检测就将bit设置为1，否则设置为0。像下面这样：
00000000 00000000 00000000 10010010

这个32bit分别表示了描述字7，4和1设置为1，其他的设置为0。这里表示的对应描述字0-31。




Linuxer

2019-09-23

第二题是为了减少检测的范围吧

 1

