极客时间-轻松学习，高效学习-极客邦

Milittle

2019-05-10

刘老师，您好，您可以把文档中给出的代码文件定位给出来么，一般在对应看源码的时候，很难定位到老师给的代码点的对应源码文件，谢谢老师~老师讲的真的让我把多年的零散知识可以连贯起来，然后理解的更加透彻，但是也会有不太理解的地方，再次感谢。这个课很值得~。
总结以下进程和线程的异同点：
1. 进程有独立的内存空间，比如代码段，数据段。线程则是共享进程的内存空间。
2. 在创建新进程的时候，会将父进程的所有五大数据结构复制新的，形成自己新的内存空间数据，而在创建新线程的时候，则是引用进程的五大数据结构数据，但是线程会有自己的私有（局部）数据，执行栈空间。
3. 进程和线程其实在cpu看来都是task_struct结构的一个封装，执行不同task即可，而且在cpu看来就是在执行这些task时候遵循对应的调度策略以及上下文资源切换定义，包括寄存器地址切换，内核栈切换，指令指针寄存器的地址切换。所以对于cpu而言，进程和线程是没有区别的。
4. 进程创建的时候直接使用系统调用fork，进行系统调用的链路走，从而进入到_do_fork去创建task，而线程创建在调用_do_fork之前，还需要维护pthread这个数据结构的信息，初始化用户态栈信息。
自己就能意识到这几点，如果有理解不到位，或者不全面的地方，还请老师给予指点，谢谢老师。

展开



 16
why

2019-05-14

- 线程的创建
- 线程是由内核态和用户态合作完成的, pthread_create 是 Glibc 库的一个函数
- pthread_create 中
1. 设置线程属性参数, 如线程栈大小
2. 创建用户态维护线程的结构, pthread
3. 创建线程栈 allocate_stack
    - 取栈的大小, 在栈末尾加 guardsize
    - 在进程堆中创建线程栈(先尝试调用 get_cached_stack 从缓存回收的线程栈中取用)
    - 若无缓存线程栈, 调用 `__mmap` 创建
    - 将 pthread 指向栈空间中
    - 计算 guard 内存位置, 并设置保护
    - 填充 pthread 内容, 其中 specific 存放属于线程的全局变量
    - 线程栈放入 stack_used 链表中(另外 stack_cache 链表记录回收缓存的线程栈)
4. 设置运行函数, 参数到 pthread 中
5. 调用 create_thread 创建线程
    - 设置 clone_flags 标志位, 调用 `__clone`
    - clone 系统调用返回时, 应该要返回到新线程上下文中, 因此 `__clone` 将参数和指令位置压入栈中, 返回时从该函数开始执行
6. 内核调用 `__do_fork`
    - 在 copy_process 复制 task_struct 过程中, 五大数据结构不复制, 直接引用进程的
    - 亲缘关系设置: group_leader 和 tgid 是当前进程; real_parent 与当前进程一样
    - 信号处理: 数据结构共享, 处理一样
7. 返回用户态, 先运行 start_thread 同样函数
    - 在 start_thread 中调用用户的函数, 运行完释放相关数据
    - 如果是最后一个线程直接退出
    - 或调用 `__free_tcb` 释放 pthread 以及线程栈, 从 stack_used 移到 stack_cache 中

展开

 1

 11
jacy

2019-08-01

pstree -apl pid看进程树
pstack pid 看栈

作者回复: 赞



 4
徐凯

2019-05-10

"将这个线程栈放到 stack_used 链表中，其实管理线程栈总共有两个链表，一个是 stack_used，也就是这个栈正被使用；另一个是 stack_cache，就是上面说的，一旦线程结束，先缓存起来，不释放，等有其他的线程创建的时候，给其他的线程用。" 这一段是线程池的意思么如果是的话既然内部已经有这个设计我们有时候还要在程序中自己去设计一个呢？

作者回复: 内核没有线程池的概念，把线程弄一个池子，是业务层做的。这里只是内核栈的复用。



 3
why

2019-05-14

老师, 多线程的内核栈是共享的吗, 会不会出现问题?

作者回复: 不共享，进了内核都是单独的任务了



 2
nora

2019-05-18

之前总是认为线程和进程都占用了内核的taskstruct 认为实际上线程进程没啥区别，这篇文章真是醍醐灌顶啊，谢谢老师。

作者回复: 赞，加油



 1
lfn

2019-05-10

所以，线程局部变量其实是存储在每个线程自己的用户栈里咯？

作者回复: 是的



 1
周佳

2020-01-13

老师好，这里线程创建后的调度是否是和进程创建后的调度一样的逻辑呢？




neohope

2019-12-10

关于clone_flags标志位的含义，可以参考一下这里http://man7.org/linux/man-pages/man2/clone.2.html

If CLONE_THREAD is set, the child is placed in the same thread group as the calling process.
When a clone call is made without specifying CLONE_THREAD, then the resulting thread is placed in a new thread group whose TGID is the same as the thread's TID. This thread is the leader of the new thread group.

If CLONE_PARENT is set, then the parent of the new child (as returned by getppid(2)) will be the same as that of the calling process.
If CLONE_PARENT is not set, then (as with fork(2)) the child's parent is the calling process.

展开




garlic

2019-10-12

进程线程查看命令：ps，top，pidstat，pstree
函数栈查看打印命令：
pstack
jstack (java)
gdb (C/C++/go)
kill -SIGQUIT [pid] (go)

相关API:

C:
glibc backtrace
Boost stacktrace
libunwind

Java:
getStackTrace;

go:
panic
debug.PrintStack
pprof.Lookup("goroutine").WriteTo
runtime.Stack

python
traceback objects
StackSummary Objects
笔记链接 https://garlicspace.com/?p=1678&preview=true

展开




kdb_reboot

2019-09-28

三刷: 感觉应该讲清楚这一点,"角色划分"
内核态是用来管理的,用户态是提供给用户用的
这才有了为什么要两个模式来回切换, 以及,真正调度,是内核态来做的,而用户态执行是用户态自己做,这才有了单独的线程栈
内存模型也很重要

另外想请教个问题:从上下文来理解, 所以说,主线程的栈是用整个用户空间的栈?子线程的栈在进程的堆里面?

展开




空格

2019-09-18

不知道我的理解对不对？线程fork后内核态会创建task_struct，之后还是会尝试wakeup_preempt_entity，然后之后接受调度，调度成功后才会在用户态执行start_thread方法？不知道我这个理解对不对？




tuyu

2019-08-26

老师, 我最近在看k8s专栏, docker的原理是使用clone的namespace参数, 所以容器的创建, 实际上是线程的创建吗

作者回复: 在容器那一节会讲的，clone有个特殊的参数操作namespace。其实clone和fork底层调用的是差不多的




kdb_reboot

2019-08-21

老师你终于出现了；还是之前那个问题，我现在进度比较慢，只把进程管理子系统看完了，看了一个多月，看了鸟哥私房菜 apue ulk lkd 内核代码 libc 还有你的专栏。因为进度太慢了我的问题是后面老师还会关注这个专栏吗，或者有什么方法可以一起讨论或者联系到老师？比如微信群或者邮箱？我做驱动开发，我感觉你的专栏完全就是为我而写的；）

作者回复: 会关注这个专栏的




kdb_reboot

2019-07-29

跟到这一篇了,前面几篇概念感觉都是为最后这两篇作铺垫

作者回复: 跟着系统调用，比较容易理解




windcaller

2019-07-08

pstack
ulimit -a

作者回复: 赞




youyui

2019-06-19

线程要进行上下文切换应该有各自的内核栈吧，那内核栈在哪里创建的？

作者回复: fork的时候




humor

2019-05-30

老师之前说过进程默认会有一个主线程，意思是在创建进程的时候也会同时创建一个线程吗？

作者回复: 不会，这个进程的task_struct就代表这个线程

 1


WL

2019-05-14

请问一下老师为什么栈的结构是栈底是高地址栈顶是低地址呢，为什么不是反过来的呢？

作者回复: 约定




六月星空2011

2019-05-13

这里应该说的是线程栈的内存空间不释放，后续创建线程的时候直接复用内存空间，而不是线程池的概念。

作者回复: 内核的数据结构是复用的



