[Algorithm] 11. Graphs - Topological Sort
위상 정렬(Topological Sorting)
- 사이클이 없는 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것을 의미한다.
- 사이클이 없는 방향 그래프는 DAG 라고도 한다.
- 예를 들어 선수과목을 고려한 학습 순서 설정이 있을 수 있다.
- 전체 노드를 하나씩 나열하되 방향성에 거스르지 않도록 순차적으로 나열할 수 있도록 하는 것이 위상 정렬이다.
- 그래프 관련 자료구조에서 자주 등장하는 개념인 진입 차수와 진출 차수
- 진입차수(Indegree): 특정한 노드로 들어오는 간선의 개수
- 진출차수(Outdegree): 특정한 노드에서 나가는 간선의 개수
- 위상 정렬 알고리즘은 DFS 를 이용해서 구현할 수도 있고, 큐를 이용해서 구현할 수도 있다.
- 큐를 이용하는 위상 정렬 알고리즘의 동작 과정
- 진입차수가 0인 모든 노드를 큐에 넣는다.
-
큐가 빌 때까지 다음의 과정을 반복한다.
1) 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다.
2) 새롭게 진입차수가 0이 된 노드를 큐에 넣는다.
- 큐를 이용하는 위상 정렬 알고리즘의 동작 과정
- 결과적으로 각 노드가 큐에 들어온 순서가 위상 정렬을 수행한 결과와 같다.
- 위상 정렬을 수행할 그래프는 사이클이 없는 방향 그래프(DAG) 여야 한다.
- 만약 사이클이 존재한다면 그 사이클에 포함되어 있는 모든 노드는 진입차수가 1이상이 된다. 따라서 위 동작과정에서 사이클에 포함되어 있는 모든 노드는 큐에 들어갈 수 없어 위상 정렬을 수행할 수 없다.
- 따라서 사이클이 없는 방향 그래프에 대해서 위상정렬을 수행할 수 있다.
-
각 노드에 대해서 각각의 진입차수를 계산하고, 진입차수가 0인 모든 노드를 큐에 넣는다.
- 처음에는 노드 1이 진입차수가 0이므로 큐에 넣는다.
- 큐에서 노드 1을 꺼낸 뒤 노드 1에서 나가는 간선을 제거한다. 그리고 새롭게 진입차수가 0이 된 노드들을 큐에 삽입한다.
- 한 번의 스텝에서 여러 노드가 큐에 들어갈 수 있는데, 여러 개의 노드가 한번에 큐에 들어갈 때는 어떤 순서대로 큐에 넣어도 상관은 없지만 더 작은 번호의 노드가 우선적으로 들어간다고 가정할 수 있다.
- 위 과정을 큐가 빌 때까지 계속한다.
- 만약 새롭게 진입차수가 0이 된 노드가 없으면 그냥 넘어간다.
- 위상 정렬을 수행한 결과는 큐에 삽입된 전체 노드의 순서가 된다. 이는 전체 방향성에 어긋나지 않도록 각 노드를 차례대로 나열한 것과 동일하다.
위상 정렬의 특징
- 위상 정렬은 DAG(Direct Acyclic Graph, 순환하지 않는 방향 그래프, 사이클 없는 방향 그래프) 에 대해서만 수행할 수 있다.
- 위상 정렬에서는 여러 가지 답이 존재할 수 있다.
- 한 스텝에서 큐에 새롭게 들어가는 원소(새롭게 진입차수가 0이 된 노드)가 2개 이상인 경우가 있다면 여러가지 답이 존재한다.
- 그러나 큐에 들어가는 순서가 바뀌더라도 전체 정렬 결과에 있어서 오류는 없다.
- 모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있다.
- 사이클에 포함된 원소 중에서 어떠한 원소도 큐에 들어가지 못하기 때문이다. 따라서 모든 원소에 대해서 다 방문되기 전에 만약 큐가 빈다면 사이클이 존재해서 정렬을 수행할 수 없는 노드가 존재한다고 판단할 수 있다.
- 스택을 활용한 DFS 를 이용해서 위상 정렬을 수행할 수도 있다.
- 한 스텝에서 큐에 새롭게 들어가는 원소(새롭게 진입차수가 0이 된 노드)가 2개 이상인 경우가 있다면 여러가지 답이 존재한다.
위상 정렬 구현
from collections import deque
# 노드의 개수 v 와 간선의 개수 e
# 모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0] * (v+1)
# 각 노드에 연결된 간선 정보를 담기 위한 연결 리스트 초기화
graph = [[] for i in range(v+1)]
# 방향 그래프의 모든 간선 정보를 입력 받기
for _ in range(e):
a, b = map(int, input().split())
# 정점 a 에서 b 로 이동 가능
graph[a].append(b)
# 진입 차수를 1 증가
indegree[b] += 1
# 위상 정렬 함수
def topology_sort():
# 알고리즘 수행 결과를 담을 리스트
result = []
# 큐 기능을 위한 deque 라이브러리 사용
queue = deque()
# 처음 시작할 때는 진입차수가 0인 노드를 큐에 삽입
for i in range(1, v+1):
if indegree[i] == 0:
queue.append(i)
# 큐가 빌 때까지 반복
while queue:
# 큐에서 원소 꺼내기
now = queue.popleft()
# 큐에 들어간 순서가 전체 위상 정렬의 수행 결과와 동일하기 때문에 결과 리스트에 담기
result.append(now)
# 해당 원소와 연결된 노드들의 진입차수에서 1 빼기
for i in graph[now]:
indegree[i] -= 1
# 새롭게 진입차수가 0이 되는 노드를 큐에 삽입
if indegree[i] == 0:
queue.append(i)
# 위상 정렬을 수행한 결과 출력
for i in result:
print(i, end=' ')
topology_sort()
위상 정렬 알고리즘 성능 분석
- 위상 정렬을 위해 차례대로 모든 노드의 정보를 확인하며 각 노드에서 나가는 간선을 차례대로 제거해야 한다.
- 따라서 위상 정렬 알고리즘의 시간 복잡도는 $O(V+E)$ 이다.
- 위상 정렬 알고리즘 상에서 한 번 큐에 들어간 노드는 다시 큐에 들어가지 않기 때문에, 한 번 확인한 간선이 다시 제거되는 작업이 수행되지 않는다.
댓글 남기기