• Keep-Moving
    2019-09-23
    allreads = {0, 3};
    老师,这一步是怎么实现的?没看出来

    作者回复: 逐个解释一下:
    1.FD_ZERO(&allreads);
    所有的位置设置为0;
      
    2. FD_SET(0, &allreads);
    将描述字0的对应位置设置为1;
      
    3.FD_SET(socket_fd, &allreads);
    将监听套接字的对应位置设置为1。

    这样就得到了allreads = {0, 3}。

     4
     4
  • 莫珣
    2019-09-23
    我有些疑问,select的FD数组大小默认是1024,但是Linux的文件描述符大小一定不是1024,假设现在使用ulimit将一个进程可以打开的文件数设置成了65535,那么大于1024的文件描述符怎么加到FD数组中去呢,如果按照文本里说的,文件描述符代表数组下标的话不就加不进去了?

    第二个问题,套接字有两个属性,接收低水位线和发送低水位线,当接收缓冲区中待接收的字节数大于接收低水位线,一个可读事件产生,那么如果永远都不能达到接收低水位线呢?

    作者回复: 第一个问题,我理解是加不进去的,你不妨设计一个程序验证一下。

    第二个问题,首先,这个值是可以调整的,我记得默认值即使1个byte,也就是说有数据就可以感知到;第二,如果一直达不到接收watermark,我理解不是一个正常的网络交互过程,正常的网络交互肯定是像流一样,不断有数据接收。

     1
     4
  • 安排
    2019-09-23
    第一道:可以,就绪条件是有数据可读(检测可读事件)。是否可以监测可写事件不太清楚,没有实验过。

    第二道:不一定需要传入,那样的话内核中for循环需要遍历整个集合,效率低。传入基数可以减小遍历范围,提高效率。

    当然,api既然设计成这样了,那肯定需要传入一个数了。
    
     4
  • 无名
    2019-11-04
    对于套接字可写状态中说的:套接字发送缓冲区足够大,怎么样算足够大呢?

    作者回复: 实际上,只要有一个字节可以被写入,就是状态可写的。

    
     2
  • 无名
    2019-09-27
    size_t rt = write(socket_fd, send_line, strlen(send_line));
    if (rt < 0) {
         error(1, errno, "write failed ");
     }
    这个代码中有错吧,应该将size_t改为sszie_t,size_t为unsigned long,这样错误-1被转换了。

    作者回复: 是的,感谢指出。

    
     2
  • godtrue
    2019-11-24
    1:I/O 多路复用的设计初衷就是解决这样的场景,把标准输入、套接字等都看做 I/O 的一路,多路复用的意思,就是在任何一路 I/O 有“事件”发生的情况下,通知应用程序去处理相应的 I/O 事件,这样我们的程序就变成了“多面手”,在同一时刻仿佛可以处理多个 I/O 事件。
    2:select 函数就是这样一种常见的 I/O 多路复用技术,使用 select 函数,通知内核挂起进程,当一个或多个 I/O 事件发生后,控制权返还给应用程序,由应用程序进行 I/O 事件的处理。

    int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);

    返回:若有就绪描述符则为其数目,若超时则为 0,若出错则为 -1

    在这个函数中,maxfd 表示的是待测试的描述符基数,它的值是待测试的最大描述符加 1。
    紧接着的是三个描述符集合,分别是读描述符集合 readset、写描述符集合 writeset 和异常描述符集合 exceptset,这三个分别通知内核,在哪些描述符上检测数据可以读,可以写和有异常发生。
    三个描述符集合中的每一个都可以设置成空,这样就表示不需要内核进行相关的检测。
    timeout设置成不同的值,会有不同的可能:
    第一个可能是设置成空 (NULL),表示如果没有 I/O 事件发生,则 select 一直等待下去。
    第二个可能是设置一个非零的值,这个表示等待固定的一段时间后从 select 阻塞调用中返回。
    第三个可能是将 tv_sec 和 tv_usec 都设置成 0,表示根本不等待,检测完毕立即返回。这种情况使用得比较少。

    3:内核通知我们套接字有数据可以读了,使用 read 函数不会阻塞。
    内核通知我们套接字可以往里写了,使用 write 函数就不会阻塞。

    读了几遍,感觉还是没有抓住核心,所以,就将文中的要点摘录下来。
    对IO多路复用的大概理解是,通过select函数去监听一组文件描述符,如果有事件就绪就交给应用程序去做对应的处理。
    展开

    作者回复: 总结得已经很到位了呀

    
     1
  • 我也曾是少年
    2019-10-20
    老师,我看了一部分开源代码,golang的,我发现大多数有名的项目他们并发写套接字的时候,都是用一个阻塞对列,既向一个没有容量的channel中写,只有接收端接了,发送端才会继续往下面走,我觉得别人这么做肯定是有原因的,但是我摸不透,所以将这问题定位到并发写套接字上,不知老师对这问题怎么看
     2
     1
  • skye
    2020-01-08
    用select做多路复用,如果不用多线程,其中一路阻塞或者死锁了,那其它路就无法处理了,所以单线程处理的前提时没有阻塞和死锁,这样理解对吗?

    作者回复: 我明白你想表达的是select之后处理事件的时候可能会阻塞,导致select不到其他事件,这点理解是对的。

    至于单线程处理是不是一定没有阻塞(死锁我不太明白这里指的是具体什么情况),我倒觉得不一定,当然,非阻塞效果可能更好一些。

    
    
  • 麻雀
    2019-12-30
    您好,
    第一,想问下select是不是能够在处理数据的同时继续轮询(监听)是否有新的套接字来到,它的内部是不是多线程呢?因为accept就是因为单线程在处理数据时,不能对这段时间内到来的套接字进行监听。
    第二,FD_SET它是一个unsigned long数组,那么它怎么实现Bitmap,只是对数组的每个元素例如fd_set[10]对文件描述符为10的套接字来数据的时候设置为1吗?

    作者回复: 第一,是可以的。这个机制是操作系统实现的,你可以把操作系统理解成一个"巨大"的无限循环处理器,无论是有数据需要读写,还是有新的套接字连接达到,这个巨大的无限循环处理器都是可以快速感知到(通过各种软硬件机制,比如中断),这样你就可以明白,它的内部并不是多线程实现的。

    第二,你的理解是正确的,就是对每个位来设置0或者1。

    
    
  • zhang
    2019-12-18
    问一个关于writefds的问题。有两个线程,以及一块要发送的内存buffer。第一个线程是创建了socket,设置为none blocking,并在select监听,代码类似select(max_fd+1, &read_fds, &write_fds, NULL, NULL),在监听到writefds中if(FD_ISSET(client.sd, &write_fds)),从内存buffer中取出数据发送出去。第二个线程写入了一些字节到内存buffer,但怎么唤醒第一个线程还处于阻塞的select?
    我试验第二个线程写入字节到内存buffer后调用FD_ZERO(&write_fds);FD_SET(client.sd, &write_fds);。第一个线程的if(FD_ISSET(client.sd, &write_fds)) { processSendRingBuf(); FD_ZERO(&write_fds); }。但并没有唤醒select。
    展开

    作者回复: 我刚刚回答了。这个时候需要使用管道或者socketpair来做。

     2
    
  • zmysang
    2019-11-18
    为什么描述字集合{0,1,4},对应的 maxfd 是 5,而不是 4,就比较方便了。因为这个向量对应的是下面这样的:a[4],a[3],a[2],a[1],a[0],待测试的描述符个数显然是 5。
    请问老师这里的意思是假设待检测的描述字集合是{0,100},那么实际上select函数会判断0-100这101个fd中值为1的fd,然后对其检测吗?

    作者回复: 是的。

    
    
  • 打奥特曼的小怪兽
    2019-11-06
    关于 FD_SET() 函数,debug看了下内存结构,{0,3} 如果设置了,实际上存储的是 2^0 + 2^3 = 9,并不会像图示的在每个位置上设置1。

    作者回复: 我的意思就是00001001,在bit位上设置为1, 转换为10进制就是9。

    
    
  • GeekAmI
    2019-10-25
    问题2:没有看过源码,猜测应该有循环挂载描述符对应事件的过程。如果不传的话,可能只能按照最大的循环了(1024),作为系统函数,执行效率需要优化到极致...
    
    
  • gogo
    2019-09-27
    老师 我问两个基础问题啊:

    1. 实际上,很多系统是用一个整型数组来表示一个描述字集合的,一个 32 位的整型数可以表示 32 个描述字,例如第一个整型数表示 0-31 描述字,第二个整型数可以表示 32-63 描述字,以此类推。

    意思是: int num;
                  int arr[num];
                  arr[0] 表示0~31描述字
                  arr[1] 表示32~63描数字
                  ……
                 arr[num-1] 表示 nun-1*32 ~ num-1*32 + 1描述字
    这样吗?

    2. 这个时候再来理解为什么描述字集合{0,1,4},对应的 maxfd 是 5,而不是 4,就比较方便了。

    因为这个向量对应的是下面这样的:

        
    a[4],a[3],a[2],a[1],a[0]
    复制代码

    待测试的描述符个数显然是 5, 而不是 4。

    三个描述符集合中的每一个都可以设置成空,这样就表示不需要内核进行相关的检测。

    这里的意思是 a[0] = NULL a[1] = NULL a[4] = NULL
    是这个意思吗?

    展开

    作者回复: 是的,应该是a[0]=0,a[1]=0,全部置为0.

    
    
  • 传说中的成大大
    2019-09-24
    第一问 我记得管道是写了以后必须要等待对方读走才可以继续进行写操作,所以可以用select进行检测的
    第二问 要从怎么存储描述符集合当做的描述符来理解, 利用数组下标随机访问的特性,来提高运行效率,毕竟是内核运行的
    
    
  • Better me
    2019-09-23
    比如现在的 select 待测试的描述符集合是{0,1,4},那么 maxfd 就是 5。这个不太懂,老师能在解释下吗

    作者回复: maxfd表示的是"个数",比如这里{0,1,4},它对应的个数应用是5。就像一个大小为5的数组,每个数组元素的下标分别是{0,1,2,3,4},数组的"个数"是4+1=5。

     2
    
  • 向东
    2019-09-23
    32位整数,那么该数组的第一个元素对应于描述字0~31,第二个元素对应于描述字32~63,依此类推。 没读懂,解答一下?多谢🙏

    作者回复: 32位整数,一共有32个bit位,每个bit位可以表示两种状态,0或者1,如果开启检测就将bit设置为1,否则设置为0。像下面这样:
    00000000 00000000 00000000 10010010

    这个32bit分别表示了描述字7,4和1设置为1,其他的设置为0。这里表示的对应描述字0-31。

    
    
  • Linuxer
    2019-09-23
    第二题是为了减少检测的范围吧
     1
    
我们在线,来聊聊吧