• 任鹏斌 置顶
    2019-04-28
    第一次读这篇放弃了,第二次花了40分钟对着图看懂了,原来所谓看懂都是借口

    作者回复: 赞

     1
     23
  • why
    2019-04-17
    - 写代码
    - 编译成 ELF 格式的二进制文件, 有三种格式(可重定位 .o 文件; 可执行文件; 共享对象文件 .so)
    - 可重定位 .o 文件(ELF 第一种格式)
        - .h + .c 文件, 编译得到**可重定位** .o 文件
        - .o 文件由: ELF 头, 多个节(section), 节头部表组成(每个节有一项纪录); 节表的位置和纪录数由 ELF 头给出.
        - .o 文件只是程序部分代码片段
        - .rel.text 和 .rel.data 标注了哪些函数/数据需要重定位
        - 要函数可被调用, 要以库文件的形式存在, 最简单是创建静态链接库 .a 文件(Archives)
        - 通过 ar 创建静态链接库, 通过 gcc 提取库文件中的 .o 文件, 链接到程序中
        - 链接合并后, 就可以定位到函数/数据的位置, 形成可执行文件
    - 可执行文件(ELF 第二种格式)
        - 链接合并后, 形成可执行文件
        - 同样包含: ELF 头, 多个节, 节头部表; 另外还有段头表(包含段的描述, p_vaddr 段加载到内存的虚拟地址)
        - ELF 头中有 e_entry , 指向程序入口的虚拟地址
    - 共享对象 .so 文件(ELF 第三种格式)
        - 静态链接库合并进可执行文件, 多个进程不能共享
        - 动态链接库-链接了动态链接库的程序, 仅包含对该库的引用(且只保存名称)
        - 通过 gcc 创建, 通过 gcc 链接
        - 运行时, 先找到动态链接库(默认在 /lib 和 /usr/lib 找)
        - 增加了 .interp 段, 里面是 ld_linux.so (动态链接器)
        - 增加了两个节 .plt(过程链接表)和 .got.plt(全局偏移表)
        - 一个动态链接函数对应 plt 中的一项 plt[x], plt[x] 中是代理代码, 调用 got 中的一项 got[y]
        - 起始, got 没有动态链接函数的地址, 都指向 plt[0], plt[0] 又调用 got[2], got[2]指向 ld_linux.so
        - ld_linux.so 找到加载到内存的动态链接函数的地址, 并将地址存入 got[y]
    - 加载 ELF 文件到内存
        - 通过系统调用 exec 调用 load_elf_binary
        - exec 是一组函数
            - 包含 p: 在 PATH 中找程序
            - 不包含 p: 需提供全路径
            - 包含 v: 以数字接收参数
            - 包含 l: 以列表接收参数
            - 包含 e: 以数字接收环境变量
    - 进程树
        - ps -ef: 用户进程不带中括号, 内核进程带中括号
        - 用户进程祖先(1号进程, systemd); 内核进程祖先(2号进程, kthreadd)
        - tty ? 一般表示后台服务
    展开
     1
     44
  • 上善若水
    2019-04-17
    看到程序的编译链接和库的东西,我感觉很熟悉,我就想到了之前看的一本特别好的书,推荐一下《程序员的自我修养-链接、装载和库》,这本书讲的十分不错,之前毕业时我看过,读了好几遍,然后在做项目过程中给intel移植android系统到x86_64位cpu上时通过elf等知识解决了好几个bug,感觉很有成就感。

    作者回复: 这本书很赞

     1
     29
  • MJ
    2019-04-17
    理论不扎实,有点懵,老师可否推荐入门书籍,课下先补补

    编辑回复: 你可以列出来哪里不懂,老师来加餐帮你们补齐。

     2
     17
  • 亮亮
    2019-04-17
    讲的真好
    
     7
  • kdb_reboot
    2019-07-08
    这篇很赞,看懂了plt和got, 这篇文章堪比<<程序员的自我修养>>啊~

    作者回复: 赞

    
     4
  • William
    2019-04-17
    老师更多提供一个全局的视图,具体细节可以看经典的CSAPP,链接的过程讲了整整一大章。

    作者回复: 是的,是的

    
     4
  • Nick
    2019-04-28
    下面process.c中的代码有错误,判断child_pid返回值没有判断其值小于0的情况,应该是 if(pid_child > 0) {return pid_child;} else if (pid_child == 0) {execvp(program, arg_list); abort();} else if(pid_child < 0) {/*return errno */;}
    #include <stdio.h>
    #include <stdlib.h>
    #include <sys/types.h>
    #include <unistd.h>


    extern int create_process (char* program, char** arg_list);


    int create_process (char* program, char** arg_list)
    {
        pid_t child_pid;
        child_pid = fork ();
        if (child_pid != 0)
            return child_pid;
        else {
            execvp (program, arg_list);
            abort ();
        }
    展开
     2
     3
  • 四月长安
    2019-04-18
    请问老师,不是所有进程的祖宗进程都是0号进程吗

    作者回复: 0号进程不是一个实实在在可以看到的进程

    
     3
  • Dylan
    2020-01-23
    开始刷第二遍,每一次都有新收获~~十年前开始啃Linux源代码,结合着《程序员自我修养》和《深入理解Linux内核》,一直认为理解底层这些东西才是最酷的,管他什么区块链,人工智能,还是5G
    
     2
  • coldpark
    2019-10-07
    一上来就讲linux源码是不是太难了?是不是应该先讲一些操作系统原理?
    
     2
  • 贺荣伟
    2019-05-05
    老师讲得太棒了,非常详细,非常认真,值得我们反复研读,下次打印出来文稿,放在书包里,地铁通勤路上拿出来阅读,哈哈

    作者回复: 赞

     1
     2
  • 宋伟
    2019-04-24
    感觉之前的linux都白学了
    
     2
  • cugphoenix
    2019-04-22
    子进程都是由父进程fork出来的,fork出来之后就和父进程无关了吧?也就是父进程执行结束后,子进程还能一直存在?

    作者回复: 能一直存在

     1
     2
  • 安排
    2019-04-17
    bash的父进程是pts?这个pts不是一个进程吧,不是一个伪终端吗?我觉得bash的父进程是sshd。

    作者回复: 伪终端也是进程呀

    
     2
  • 绿茶
    2019-07-01
    基本流程明白了,回头自己实践一下,提到的工具也试试,反反复复把这一篇打开了好几次,终于看完了

    作者回复: 加油,可能很多节都要看好几次

    
     1
  • 张阳
    2019-06-17
    没看明白 libdynamicprocess.so 最初是谁加载到内存里的?

    作者回复: 专门用于加载的那个so

     2
     1
  • 超超
    2019-05-28
    execvp函数传入的参数有误,第二个入参中不应该有"ls",它放在第一个参数中就可以了。

    作者回复: 可以有的,代码可以运行一下,这里面的代码我都运行过,都是对的

     1
     1
  • Sharry
    2019-05-15
    #### so 的编译
    动态链接库 .so 文件格式也是 ELF 类型的, 比起 .o 文件, 多了两个 section
    ```
    Section Headers:
      [Nr] Name Type Address Offset
           Size EntSize Flags Link Info Align
      ......
      [ 9] .plt PROGBITS 0000000000000530 00000530
           0000000000000010 0000000000000010 AX 0 0 16
      ......
      [19] .got PROGBITS 0000000000200fd8 00000fd8
           0000000000000028 0000000000000008 WA 0 0 8
    ```
    - .plt: 过程链接表(Procedure Linkage Table, PLT)
      - 用作占位符
    - .got.plt: 全局偏移量(Global Offset Table, GOT)
      - 存储 so 库加载到内存后真正的地址

    #### 可执行文件的编译
    当代码与动态链接库编译成可执行文件时其生成文件依旧是 elf 格式的
    ```
    Section Headers:
      [Nr] Name Type Address Offset
           Size EntSize Flags Link Info Align
      [ 0] NULL 0000000000000000 00000000
           0000000000000000 0000000000000000 0 0 0
      [ 1] .interp PROGBITS 0000000000400238 00000238
           000000000000001c 0000000000000000 A 0 0 1
           0000000000000018 0000000000000008 WA 0 0 8
      ......
    ```

    - .interp: 动态连接器 lb-linux.so, 用于运行时进行地址回填操作

    #### 可执行文件的执行
    可执行文件中的 so 库文件函数调用使用, PLT[x] 代替, 当运行时遇到 PLT[x] 代码时
    - 通过GOT[x] 中获取函数真正的地址
      - 若 GOT[x] 中的地址不存在, 这说明这个动态库还没有加载到内存
      - 此时会通过动态链接器 lb-linux.so 将函数所在的 so 库加载到内存
      - 向 GOT[x] 中回填函数地址, 下次便可以直接使用了
    - PLT[x] 便会根据函数地址执行 so 库中的函数
    展开
    
     1
  • 落石
    2019-04-19
    简单说下作为一只小白的心路历程。看到11章线程 --> 进程呢? --> 回忆上一章 --> C程序的编译链接及文件格式 --> 点开10章 --> 没错是进程了 --> 线程和进程的关系? 这两章学下来,感觉收获很多,非常感谢老师,后续会具体聊下线程和进程之间的区别么?之前的理解就是线程是进程的子集,但在网上搜了一下不止于此。老师可以简单聊下这个么?

    作者回复: 线程不是进程的子集。进程是项目,线程是项目的执行。项目包含资源,也会有一个默认主线程来执行这个项目,也可以创建多个线程来执行这个项目

    
     1
我们在线,来聊聊吧