Process 정리
오타, 지적 환영입니다.
프로세스(Process)
쉽게 말하면 실행중인 프로그램이다.
디스크에 있는 프로그램이 메모리에 로드되면 프로세스가 된다.
여기서 말하는 프로그램이란 .exe
파일 같이 아직 실행되지 않은 명령어 집합체를 말한다.
1. 프로세스 문맥(Process Context)
- 여러 프로세스가 타이머 인터럽트에 의해 짧은 시간동안 CPU를 점유하며 서로 제어권을 넘겨주는 시분할 시스템 환경에 의해 나타남.
- 서로 제어권을 넘길때 어디까지 명령을 수행했는지, 상태에 대한 정보를 나타낼 필요가 있었음.
프로세스가 어떤 상태에서 수행되고 있는지 정확히 규명하기 위해 필요한 정보들.
프로세스 문맥은 하드웨어 문맥, 프로세스의 주소공간, 커널상의 문맥으로 나뉨.
- 하드웨어 문맥: PC(Program Counter)와 각종 레지스터에 저장하고 있는 값들.
Program Counter는 다음에 실행될 명령어의 주소를 가지고 있는 레지스터. 인텔에서는 IP(Instruction Pointer)로도 불림.
- 프로세스 주소공간: 코드, 데이터, 스택, 힙으로 구성된 프로세스만의 독자적 주소 공간.
코드는 프로그램의 코드가, 데이터는 전역변수 같은 데이터가, 스택에는 함수나 지역변수가 저장되어 있다.
- 커널상의 문맥: PCB(Process Control Block), Kernel Stack(커널상의 주소)를 말한다.
PCB는 밑에서 설명, Kernel Stack이란 간단하게 프로세스 자체에서 처리할 수 없는것들은 운영체제 부탁하는데 이를 시스템 콜이라고 부른다. 시스템 콜이 발생하면 PC는 커널의 Code를 가리키고 커널의 함수를 호출한다. 이때 각 프로세스마다 호출하는 Code를 관리하기 위해서 Kernel Stack을 갖게 됨. 따라서 해당 프로세스의 커널 스택의 값이 뭔지 필요하게 됨.
2. 프로세스의 상태
PCB를 알기 전에 프로세스 상태에 대해 알고 있어야한다.
Five-State Process Model
보통 우리는 이 모델을 가지고 설명을 많이한다.
시분할 시스템 환경에서 프로세스의 상태는 New, Ready, Running, Waiting, Terminated로 구분이 가능하다.
- New: 프로세스가 처음 생성된 단계, 메모리 할당 및 PCB와 스택 메모리 할당 및 초기화 등의 작업.
- Ready: 프로세스가 CPU에 할당되기를 기다리는 상태.
- Running: 프로세스가 할당되어 CPU를 잡고 명령을 수행중인 상태
- Waiting: 프로세스가 어떠한 이벤트가 발생하기를 기다리는 상태
- Terminated: 프로세스가 실행을 마치고 완전히 제거되진 않은 상태.
State Transitions
Dispatcher란 OS 프로그램의 일부로, 실행중인 프로그램을 중단하고 다른 프로그램을 실행시키도록 하는 프로그램이다.
- New -> Ready
OS가 Ready 단계로 넘어가길 허락(Admit)해야 넘어갈 수 있다.
이러한 이유로 메모리 자원 문제 및 CPU 문제가 있기 때문이다.
- Ready -> Running
Dispatcher가 대기하고 있는 프로그램 중 적절한 프로그램을 골라 Running 상태로 옮김.
- Running -> terminated
OS는 프로그램이 종료하게 되면 exit상태를 거쳐 terminated로 옮김.
- Running -> Ready
프로그램의 할당 시간이 길어지면 timeout이 걸려(interrupt) Ready상태로 돌아간다.
- Running -> Blocked
프로그램 실행중 I/O Request, 시스템콜 등 작업을 요청하면 Blocked상태로 변경하여 대기한다.
- Blocked -> Ready
기다리던 이벤트가 발생하면 Running이 아닌 Ready상태로 간다.
중기 스케줄러로 인해 Seven-State Process Model이라는것도 생겨났으니 참고하면 된다.
3. PCB(Process Control Block)
커널 Data영역에 있는 프로세스에 관한 정보들
- OS가 관리하는 정보: (1) 및 스케줄링 및 우선순위에 대한 정보를 가지고 있다.
Pointer: 프로세스를 큐에서 관리하기에 이를 나타내기 위한 포인터 Process state: 위에서 말한 Ready, Running 등 프로세스 상태 Process number(PID): 프로세스를 구별하기 위한 숫자.
PCB들은 메모리에 존재하고 상태에 따라 Ready Queue, Event Queue에서 관리 된다.
Ready Queue
Ready 상태에 있는 프로세스만 모아둔 큐를 말한다. - **Scheduler**가 Ready큐에서 최우선순위 프로세스를 선택. - 선택된 프로세스를 **Dispatch**해서 CPU가 실행한다.(Running)Blocked(Waiting or Event) Queue - 대기큐
Blocked상태에 있는 프로세스만 모아둔 큐 - 각각의 `Device driver`에 존재하는 큐 - 키보드, 디스크, 네트워크, 세마포어, 등에 대기큐가 존재한다. - 예를 들어 I/O함수 등을 호출하면 Blocked 상태가 되며 PCB를 해당 장치의 대기큐로 이동시킴. - 이벤트가 발생하면 Device driver내의 함수는 대기큐에서 해당 PCB를 찾고 대기큐에서 제거 후 Ready Queue로 넘김.(Ready)- CPU 수행 관련 하드웨어 값: (2)에 해당. 해당 프로세스가 어떤 값을 가지고 있었는지에 대한 정보
ProgramCounter: 다음에 실행될 명령어의 위치를 가리키는 레지스터 Registers: 프로세스 실행 중 사용된 레즈스터 값들 (Accumulator, Index register…)
- 메모리 관련: (3)에 해당. Code, Data, Stack의 위치 정보. 프로세스가 물리적으로 어디에 있는지 나타내는 위치정보.
- 파일 관련: (4)에 해당. 어떤 파일을 열어놨는지 등에 대한 정보
참고로 Blocked에 있는 프로세스를 찾을때 포트번호로 구별하여 PCB를 찾는다.
4. Context Switch
멀티 프로세스 환경에서 프로세스가 실행되다가 인터럽트가 발생해서 CPU를 한 프로세스에서 다른 프로세스로 넘겨주는 과정
운영체제는 CPU를 내어주는 A프로세스의 상태를 A프로세스의 PCB에 저장하고, CPU를 새롭게 얻는 B프로세스의 상태를 B프로세스의 PCB에서 읽어온다. CPU입장에서는 Context는 PCB이고, 이가 바뀌는것이 Context Switch다. 이는 OS 스케줄러에서 수행한다.
인터럽트나 시스템콜이 발생한다해서 반드시 Context Switch가 발생하는것은 아니다.
- Context Switch가 발생하지 않는 경우
프로세스A -> interrupt or system call -> kernelMode -> 프로세스A : Context Switch 없음.
- Context Switch가 발생하는 경우
프로세스A -> interrupt or I/O system call -> kernelMode -> Context Switch -> 프로세스B
Context Switch시 Cache memory flush라는 프로세스가 바뀔때 Cache를 초기화 시켜 오버헤드가 큼. 단점으로 캐시 히트가 줄어들고 초반 프로세스 작업 속도가 느려질 수 있다.
또한 Context Switch을 하는동안 CPU는 아무일을 하지 않는 시간이 발생하는데 이를 오버헤드라고 부름.
5. Process Management
시스템이 부팅된 후 최초 프로세스는 운영체제가 직접 생성, 그 이후로는 프로세스를 복제하여 생성하게 된다. 프로세스를 복제한 프로세스를 부모 프로세스 새롭게 생성된 프로세스를 자식 프로세스라고 한다.
각 프로세스는 PID로 구별되고, 자원은 운영체제로부터 할당받거나 부모와 공유한다.
fork()
fork()
라는 시스템콜은 새로운 프로세스를 생성한다.
fork()
를 통해 자식은 부모의 pid를 제외하고 그대로 복사한다. fork()
함수의 리턴값은 부모는 0보다 큰 수, 자식은 0을 갖는다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
static void ssu_charatatime(char *str) {
char *ptr;
int print_char;
setbuf(stdout, NULL);
for (ptr = str; (print_char = *ptr++) != 0;) {
putc(print_char, stdout);
usleep(10);
}
}
int main(int argc, char *argv[], char *envpp[]) {
pid_t pid;
if ((pid = fork()) == 0) {
ssu_charatatime("output from child\n");
} else if (pid > 0) {
ssu_charatatime("output from parent\n");
}
exit(0);
}
결과
6. Process Cooperating
프로세스는 동작 방식에 따라 2가지 방식으로 나뉜다. 먼저 독립적 프로세스(Independent Process)는 각자 주소 공간을 가지면서 수행되고 원칙적으로는 하나의 프로세스가 다른 프로세스의 수행에 영향을 미치지는 않는다.
협력 프로세스(Cooperating Process)는 IPC(InterProcess Communication)이라는 프로세스 협력 메커니즘을 통해 하나의 프로세스가 다른 프로세스 수행에 영향을 미칠 수 있다.
IPC에는 크게 두 모델이 있다.
공유 메모리(Shared Memory)
서로 다픈 프로세스 간에 일부 주소 공간을 공유.
위의 그림처럼 같은 공간을 사용하므로 일관성 문제가 생길 수 있다.
장점으로는 커널을 거치지 않기에 빠르다.
커널은 또 정리하는 편이 좋지만 여기서는 간단하게 fork()
라는 함수를 실행하면 OS자체에서 내부적으로 이 코드를 실행하기 위해 로직을 돌텐데 이때 도는 로직들은 커널공간에서 돈다고 생각하면 된다.
메시지 패싱(Message Passing)
커널을 통해 메시지를 주고 받는다. Context Switch가 발생하기에 속도가 느리지만, 커널이 기본 기능을 제공하기에 구현이 쉽고, 일관성 문제를 해결하기 쉽다.
- 기본적으로 Send/Receive 동작을 통해 교환한다.
1) Direct Communication
통신하는 프로세스의 이름을 명시적으로 표시해야한다.
때문에 서로 이름만 알면 된다. 이는 단점이 될 수도 있는데, 만약 프로세스의 이름을 변경해야한다면 연결되어 있는 모든 Send/Receive 프로세스를 바꿔줘야한다.
2) Indirect Dommunication
mailbox를 통해 메시지를 전달한다.
이 mailbox는 고유의 ID를 가지고 있고, 이 ID를 통해 연결된 프로세스들이 통신을 할 수 있다.
- Blocking send : 수신자(프로세스 or mailbox)가 메시지를 받을 때까지 발신자는 block 된다.
- Non-blocking send : 발신자가 메시지를 보내고 작업을 계속한다.
- Blocking receive : 수신자가 메시지를 받을 때까지 block 된다.
- Non-blocking receive : 수신자는 유효한 메시지 또는 null 메시지를 받는다.
프로세스끼리 통신할 때 파이프(Pipe)방식으로도 통신한다. 이는 단방향만 가능해서 양방향으로 통신하려면 두 개의 파이프가 필요하다.
이 파이프는 Anonymous 파이프와 named 파이프로 구분되는데 전자는 부모-자식 또는 공통의 부모를 갖는 프로세스끼리 통신이 가능하다. 후자는 그런 관계 없이 사용할 수 있다.
Reference
- https://velog.io/@zooneon/OS-Process-State#-dispatcher 프로세스 상태모델
- https://ws-pace.tistory.com/20 PCB 등
- https://rebro.kr/172 Context Switch
- https://bubble-dev.tistory.com/entry/CC-fork2 fork()