#include
#include int g_val = 10;int main()
{pid_t id = fork();if(id == 0){//Childint cnt = 5;while(1){printf("I am child, pid = %d, ppid = %d, g_val = %d, &g_val = %p\n", getpid(), getppid(), g_val, &g_val); --cnt;if(cnt == 0){g_val = 30;}sleep(1);} }//Parentwhile(1){printf("I am parent, pid = %d, ppid = %d, g_val = %d, &g_val = %p\n", getpid(), getppid(), g_val, &g_val); sleep(1);} return 0;
}
可以看到,当子进程修改了g_val的值时,父子进程分别打印10和30,但是这两个的地址是一样的,也就是说同一块物理内存输出了两个不同的数值,但这怎么可能呢,这也恰恰说明了我们看到的地址是假的!
计算机运行时,内存中同时存在很多的进程,但每个进程都认为自己是独占内存的!在32位机器上,每个进程都认为这16G的内存全部属于自己,为了实现这一思想,于是每个进程PCB里都存在一个结构体指针struct mm_struct *mm
,该指针指向的结构体就是进程地址空间。
该结构体里存在众多指针,将16G内存划分为不同区域:数据区、代码区、栈区、堆区等等。每两个指针锁定一块区域。
//linux内核源代码
unsigned long start_code, end_code, start_data, end_data;
unsigned long start_brk, brk, start_stack;
unsigned long arg_start, arg_end, env_start, env_end;
实际上,每个程序在编译完之后,程序内部就有虚拟地址(一般称为逻辑地址),而页表中虚拟和物理地址的映射关系就是程序内部的逻辑地址和物理内存的地址。也就是说程序内部也是有“地址空间”的,进程里也有地址空间,这两个地址空间一一对应。
fork创建子进程时,子进程以父进程为模版,拷贝了PCB,但并没有拷贝程序的数据和代码,所以此时父子进程的两个PCB都指向同一个程序,而当子进程对g_val进行修改时,发生写时拷贝,产生变化的变量会在内存中重新拷贝一份,子进程对于g_val指向新拷贝的,父进程仍旧指向旧的,但是此时只是子进程指向的g_val的物理内存地址变化了,子进程页表中的虚拟地址并没有变化,所以会导致两个进程的虚拟地址相同,但虚拟地址映射的物理地址不同。