• Milittle
    2019-05-10
    刘老师,您好,您可以把文档中给出的代码文件定位给出来么,一般在对应看源码的时候,很难定位到老师给的代码点的对应源码文件,谢谢老师~老师讲的真的让我把多年的零散知识可以连贯起来,然后理解的更加透彻,但是也会有不太理解的地方,再次感谢。这个课很值得~。
    总结以下进程和线程的异同点:
    1. 进程有独立的内存空间,比如代码段,数据段。线程则是共享进程的内存空间。
    2. 在创建新进程的时候,会将父进程的所有五大数据结构复制新的,形成自己新的内存空间数据,而在创建新线程的时候,则是引用进程的五大数据结构数据,但是线程会有自己的私有(局部)数据,执行栈空间。
    3. 进程和线程其实在cpu看来都是task_struct结构的一个封装,执行不同task即可,而且在cpu看来就是在执行这些task时候遵循对应的调度策略以及上下文资源切换定义,包括寄存器地址切换,内核栈切换,指令指针寄存器的地址切换。所以对于cpu而言,进程和线程是没有区别的。
    4. 进程创建的时候直接使用系统调用fork,进行系统调用的链路走,从而进入到_do_fork去创建task,而线程创建在调用_do_fork之前,还需要维护pthread这个数据结构的信息,初始化用户态栈信息。
    自己就能意识到这几点,如果有理解不到位,或者不全面的地方,还请老师给予指点,谢谢老师。
    展开
    
     16
  • why
    2019-05-14
    - 线程的创建
    - 线程是由内核态和用户态合作完成的, pthread_create 是 Glibc 库的一个函数
    - pthread_create 中
    1. 设置线程属性参数, 如线程栈大小
    2. 创建用户态维护线程的结构, pthread
    3. 创建线程栈 allocate_stack
        - 取栈的大小, 在栈末尾加 guardsize
        - 在进程堆中创建线程栈(先尝试调用 get_cached_stack 从缓存回收的线程栈中取用)
        - 若无缓存线程栈, 调用 `__mmap` 创建
        - 将 pthread 指向栈空间中
        - 计算 guard 内存位置, 并设置保护
        - 填充 pthread 内容, 其中 specific 存放属于线程的全局变量
        - 线程栈放入 stack_used 链表中(另外 stack_cache 链表记录回收缓存的线程栈)
    4. 设置运行函数, 参数到 pthread 中
    5. 调用 create_thread 创建线程
        - 设置 clone_flags 标志位, 调用 `__clone`
        - clone 系统调用返回时, 应该要返回到新线程上下文中, 因此 `__clone` 将参数和指令位置压入栈中, 返回时从该函数开始执行
    6. 内核调用 `__do_fork`
        - 在 copy_process 复制 task_struct 过程中, 五大数据结构不复制, 直接引用进程的
        - 亲缘关系设置: group_leader 和 tgid 是当前进程; real_parent 与当前进程一样
        - 信号处理: 数据结构共享, 处理一样
    7. 返回用户态, 先运行 start_thread 同样函数
        - 在 start_thread 中调用用户的函数, 运行完释放相关数据
        - 如果是最后一个线程直接退出
        - 或调用 `__free_tcb` 释放 pthread 以及线程栈, 从 stack_used 移到 stack_cache 中
    展开
     1
     11
  • jacy
    2019-08-01
    pstree -apl pid看进程树
    pstack pid 看栈

    作者回复: 赞

    
     4
  • 徐凯
    2019-05-10
    "将这个线程栈放到 stack_used 链表中,其实管理线程栈总共有两个链表,一个是 stack_used,也就是这个栈正被使用;另一个是 stack_cache,就是上面说的,一旦线程结束,先缓存起来,不释放,等有其他的线程创建的时候,给其他的线程用。" 这一段是线程池的意思么 如果是的话 既然内部已经有这个设计 我们有时候还要在程序中自己去设计一个呢?

    作者回复: 内核没有线程池的概念,把线程弄一个池子,是业务层做的。这里只是内核栈的复用。

    
     3
  • why
    2019-05-14
    老师, 多线程的内核栈是共享的吗, 会不会出现问题?

    作者回复: 不共享,进了内核都是单独的任务了

    
     2
  • nora
    2019-05-18
    之前总是认为线程和进程都占用了内核的taskstruct 认为实际上线程进程没啥区别,这篇文章真是醍醐灌顶啊,谢谢老师。

    作者回复: 赞,加油

    
     1
  • lfn
    2019-05-10
    所以,线程局部变量其实是存储在每个线程自己的用户栈里咯?

    作者回复: 是的

    
     1
  • 周佳
    2020-01-13
    老师好,这里线程创建后的调度是否是和进程创建后的调度一样的逻辑呢?
    
    
  • neohope
    2019-12-10
    关于clone_flags标志位的含义,可以参考一下这里http://man7.org/linux/man-pages/man2/clone.2.html

    If CLONE_THREAD is set, the child is placed in the same thread group as the calling process.
    When a clone call is made without specifying CLONE_THREAD, then the resulting thread is placed in a new thread group whose TGID is the same as the thread's TID. This thread is the leader of the new thread group.

    If CLONE_PARENT is set, then the parent of the new child (as returned by getppid(2)) will be the same as that of the calling process.
    If CLONE_PARENT is not set, then (as with fork(2)) the child's parent is the calling process.
    展开
    
    
  • garlic
    2019-10-12
    进程线程查看命令:ps,top,pidstat,pstree
    函数栈查看打印命令:
     pstack
    jstack (java)
    gdb (C/C++/go)
    kill -SIGQUIT [pid] (go)

    相关API:

    C:
    glibc backtrace
    Boost stacktrace
    libunwind

    Java:
    getStackTrace;

    go:
    panic
    debug.PrintStack
    pprof.Lookup("goroutine").WriteTo
    runtime.Stack

    python
    traceback objects
    StackSummary Objects
     笔记链接 https://garlicspace.com/?p=1678&preview=true
    展开
    
    
  • kdb_reboot
    2019-09-28
    三刷: 感觉应该讲清楚这一点,"角色划分"
    内核态是用来管理的,用户态是提供给用户用的
    这才有了为什么要两个模式来回切换, 以及,真正调度,是内核态来做的,而用户态执行是用户态自己做,这才有了单独的线程栈
    内存模型也很重要

    另外想请教个问题:从上下文来理解, 所以说,主线程的栈是用整个用户空间的栈?子线程的栈在进程的堆里面?
    展开
    
    
  • 空格
    2019-09-18
    不知道我的理解对不对?线程fork后内核态会创建task_struct,之后还是会尝试wakeup_preempt_entity,然后之后接受调度,调度成功后才会在用户态执行start_thread方法?不知道我这个理解对不对?
    
    
  • tuyu
    2019-08-26
    老师, 我最近在看k8s专栏, docker的原理是使用clone的namespace参数, 所以容器的创建, 实际上是线程的创建吗

    作者回复: 在容器那一节会讲的,clone有个特殊的参数操作namespace。其实clone和fork底层调用的是差不多的

    
    
  • kdb_reboot
    2019-08-21
    老师你终于出现了;还是之前那个问题,我现在进度比较慢,只把进程管理子系统看完了,看了一个多月,看了鸟哥私房菜 apue ulk lkd 内核代码 libc 还有你的专栏。因为进度太慢了 我的问题是后面老师还会关注这个专栏吗,或者有什么方法可以一起讨论或者联系到老师? 比如微信群或者邮箱?我做驱动开发,我感觉你的专栏完全就是为我而写的;)

    作者回复: 会关注这个专栏的

    
    
  • kdb_reboot
    2019-07-29
    跟到这一篇了,前面几篇概念感觉都是为最后这两篇作铺垫

    作者回复: 跟着系统调用,比较容易理解

    
    
  • windcaller
    2019-07-08
    pstack
    ulimit -a

    作者回复: 赞

    
    
  • youyui
    2019-06-19
    线程要进行上下文切换应该有各自的内核栈吧,那内核栈在哪里创建的?

    作者回复: fork的时候

    
    
  • humor
    2019-05-30
    老师之前说过进程默认会有一个主线程,意思是在创建进程的时候也会同时创建一个线程吗?

    作者回复: 不会,这个进程的task_struct就代表这个线程

     1
    
  • WL
    2019-05-14
    请问一下老师为什么栈的结构是栈底是高地址栈顶是低地址呢,为什么不是反过来的呢?

    作者回复: 约定

    
    
  • 六月星空2011
    2019-05-13
    这里应该说的是线程栈的内存空间不释放,后续创建线程的时候直接复用内存空间,而不是线程池的概念。

    作者回复: 内核的数据结构是复用的

    
    
我们在线,来聊聊吧