School/데이터베이스

회복과 병행제어

응엉잉 2022. 6. 13. 22:20

트랜잭션 : 병행제어와 회복작업의 기본 단위

회복 기법 : 데이터베이스를 장애로부터 복구하는 기법

병행 제어 기법 : 여러 사용자가 동시에 접근할 수 있도록 트랜잭션 수행을 통제하는 기법

 

01. 트랜잭션

1. 트랜잭션의 정의

하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아둔 것

= 작업 수행에 필요한 SQL 문들의 모임 (데이터베이스 변경하는 INSERT, DELETE, UPDATE 문의 실행)

논리적인 작업의 단위

장애 발생 시 복구작업이나 병행제어작업을 위한 단위

데이터베이스의 무결성과 일관성 보장을 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 정의하고 관리해야 함

 

EX01) 계좌이체 트랜잭션

2개의 UPDATE 문이 모두 정상적으로 실행되어야 함. 처리순서는 중요하지 않음

 

2. 트랜잭션의 특성

1) 원자성

트랜잭션의 연산들이 모두 실행되거나 하나도 실행되지 않아야 함 (all or nothing)

트랜잭션 수행 도중 장애 발생 -> 실행중이던 연산 처리를 모두 취소 -> 데이터베이스를 트랜잭션 작업 전 상태로 되돌려야

원자성 보장을 위해 장애발생시 회복 기능이 필요

 

2) 일관성

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함

EX) 계좌이체 트랜잭션을 실행하기 전과 실행 후의 계좌 잔액 합계는 10000원으로 동일해야 함

 

3) 격리성

수행중인 트랜잭션이 완료될 때까지는 다른 트랜잭션들이 중간연산결과에 해당되는 데이터에는 접근 불가능함

격리성의 보장을 위해서는 여러 트랜잭션이 동시에 수행되더라도 하나씩 순서대로 수행되는 것처럼 정확하고 일관된 결과를 얻을 수 있도록 제어하는 기능이 필요

 

4) 지속성

트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행결과는 영구적이어야 함

지속서으이 보장을 위해서는 트랜잭션 완료 후 발생하는 장애에 대한 회복기능 필요

3. 트랜잭션의 주요 연산

1) commit 연산

트랜잭션의 수행이 성공적으로 완료되었음을 선언하는 연산

commit 연산 실행시 트랜잭션의 수행 결과가 데이터베이스에 반영, 일관된 상태를 지속적으로 유지하게 됨

 

2) rollback 연산

트랜잭션의 수행이 실패했음을 선언하는 연산

rollback 연산 실행시 트랜잭션이 지금까지 실행된 연산의 결과가 취소됨

데이터베이스가 트랜잭션 수행 전의 일관된 상태로 돌아감

 

4. 트랜잭션의 상태

활동 상태 트랜잭션이 수행되기 시작하여 현재 수행중인 상태
부분완료 상태 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
완료 상태 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태
트랜잭션이 수행한 최종 결과를 데이터베이스에 반영, 데이터베이스가 새로운 일관된 상태가 되며 트랜잭션 종료
실패 상태 장애가 발생하여 트랜잭션의 수행이 중단된 상태
철회 상태 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태
지금까지 실행한 트랜잭션 연산을 모두 취소
-> 트랜잭션 수행 전의 데이터베이스 상태로 되돌리며 트랜잭션 종료

철회상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기됨

 

02. 장애와 회복

 

1. 장애

시스템이 제대로 동작하지 않는 상태

1) 트랜잭션 장애

의미 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태
원인 트랜잭션의 논리적 오류, 잘못된 데이터 입력, 시스템 자원의 과다 사용 요구, 처리 대상 데이터의 부재

2) 시스템 장애

의미 하드웨어의 결함으로 정상적 수행이 불가능한 상태
원인 하드웨어 이상으로 메인메모리에 저장된 정보가 손실, 교착상태 발생

3) 미디어 장애

의미 디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태
원인 디스크 헤드의 손상이나 고장

 

2. 데이터베이스를 저장하는 저장 장치의 종류

1) 휘발성 저장 장치

의미 장애 발생시 저장된 데이터 손실
메인메모리

2) 비휘발성 저장 장치

의미 장애가 발생해도 저장된 데이터가 손실되지 않음
단, 저장장치 자체에 이상이 생긴 경우(디스크 헤더 손상 등) 데이터 손실 일어날 수 있음
디스크, 자기테이프, CD/DVD

3) 안정 저장 장치

의미 비휘발성 저장 장치를 이용해 데이터 복사본 여러개를 만드는 방법
어떤 장애가 발생해도 데이터가 손시로디지 않고 데이터를 영구적으로 저장 가능

 

3. 트랜잭션 수행을 위해 필요한 데이터 이동 연산

1) 디스크 <-> 메인메모리

데이터베이스는 디스크(비휘발성 저장장치) 에 상주

트랜잭션이 데이터베이스의 데이터를 처리하기 위해 : 

데이터를 디스크에서 메인 메모리로 가져와 처리 (input) -> 처리한 결과를 디스크로 보냄 (output)

블록 : 데이터 이동 단위

input(x) 디스크 블록에 저장되어있는 데이터 x를 메인 메모리 버퍼 블록으로 이동
output(x) 매안 메모리 버퍼 블록에 있는 데이터 x를 디스크 블록으로 이동

 

2) 메인메모리 <-> 변수

응용프로그램이 트랜잭션의 수행을 지시 -> 메모리 버퍼 블록에 있는 데이터를 프로그램의 변수로 가져옴 (read)

-> 변수에 데이터 처리 결과를 저장 -> 변수를 메모리 버퍼 블록으로 옮김 (write)

read(x) 메인 메모리 버퍼 블록에 저장되어있는 데이터 x를 프로그램의 변수로 읽어옴
write(x) 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 x에 기록

회복

1. 정의

장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구

트랜잭션의 특성을 보장, 데이터베이스를 일관된 상태로 유지하기 위해서 필수적인 기능

회복 관리자 담당 (장애발생 탐지, 장애 탐지시 데이터베이스 복구 기능 제공)

 

 2. 데이터베이스 복사본 생성 방법 : 덤프와 로그

사전 데이터 저장 -> 회복을 위한 데이터베이스 복사본 생성

1) 덤프 : 데이터베이스 전체를 다른 저장장치에 주기적으로 복사

 

2) 로그 : 데이터베이스에서 변경 연산이 실행될때마다 데이터를 변경하기 이전값과 이후값을 별도 파일에 기록

 

3. 회복을 위한 기본 연산 : redo와 undo

redd(재실행) 가장 최근에 저장한 데이터베이스의 복사본을 가져온 로그를 이용
-> 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행
-> 장애 발생 직전의 데아터베이스 상태로 복구
undo(취소) 로그를 이용
-> 지금까지 실행된 모든 변경 연산을 취소
-> 데이터베이스를 원래 상태로 복구

* 변경중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우 주로 사용

 

4. 로그 파일

데이터 변경 이전 값과 변경 이후 값을 기록한 파일

레코드 단위로 트랜잭션 수행과 함께 기록

계좌이체 트랜잭션의 예시

5. 회복기법

1) 로그 회복 기법

1-1) 즉시 갱신 회복 기법

트랜잭션 수행 중 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영

장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록

 - 데이터 변경 연산이 실행되면 로그파일에 로그 레코드를 먼저 기록한 후 데이터베이스 변경 연산을 반영

장애발생시점에 따라 redo 나 undo 연산을 실행해 데이터베이스 복구

 

1 : T1이 완료되기 전 장애 발생 -> undo(T1) , 2 : T1은 완료 T2는 완료되기 전 장애 발생 -> undo(T2), redo(T1)

1-2) 지연 갱신 회복 기법

트랜잭션 수행 중 데이터 변경 연산의 결과를 로그에만 기록

트랜잭션 부분 완료 이후 로그에 기록된 내용을 이용 -> 데이터베이스에 한번에 반영

트랜잭션 수행 중에 장애 발생시 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지 가능

 - undo 연산은 필요 없고 redo 연산만 사용

 - 로그 레코드에는 변경 이후 값만 <T1, X, new_value> 형식으로 기록

2) 검사 시점 회복 기법

로그기록을 이용하되 일정 시간 간격으로 검사시점(check point)을 만듦

- 검사시점이 되면 모든 레코드를 로그 파일에 기록 -> 데이터 변경 내용을 데이터베이스에 반영 -> 검사시점을 표시하는 로그 레코드 ( <checkpoint L> ) 를 로그 파일에 기록

  * L : 현재 실행되고 있는 트랜잭션의 리스트

장애 발생시 가장 최근 검사 시점 이후의 트랜잭션을 대상으로 회복 작업 수행

= 가장 최근의 < checkpoint L > 로그 레코드 이후 기록에 대해서만 회복작업 수행

즉시갱신회복기법이나 지연갱신회복기법 이용

검사시점 이후로 작업 범위가 정해짐 -> 로그 전체를 대상으로 회복기법을 적용할 때 발생할 수 있는 비효율성의 문제 해결

 

3) 미디어 회복 기법

디스크에 발생할 수 있는 장애에 대비한 회복 기법

덤프(복사본) 이용

 - 전체 데이터베이스의 내용을 일정 주기마다 다른 안전한 저장장치에 복사

디스크 장애가 발생시 수행되는 회복 작업

-> 가장 최근에 복사해둔 덤프를 이용, 장애 발생 이전의 데이터베이스 상태로 복구, 필요한 경우 redo

 

03. 병행 수행과 병행 제어

1. 병행수행과 병행제어

1) 병행 수행

여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러개의 트랜잭션을 동시에 수행하는 것

인터리빙(여러 트랜잭션이 차례로 번갈아 수행되는 방식)으로 진행

 

2) 병행 제어 (동시성 제어)

병행 수행시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고, 정확한 수행결과 얻을 수 있도록 트랜잭션의 수행을 제어

 

2. 병행수행시 발생 가능한 문제점

"트랜잭션을 순차적으로 수행하지 않은것같은 결과는 다 문제임. 순차적으로 수행한거같은 결과를 원함"

1) 갱신 분실 : 변경연산결과가 데이터베이스에 반영되지 않는것

하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어씀 -> 변경 연산이 무효화

 

좌 : 다른 트랜잭션에 변경연산 전 결과가 반영 / 우 : 트랜잭션을 순차적으로 수행해서 문제 발생하지 않음

 2) 모순성

하나의 트랜잭션이 여러개 데이터에 대해 변경 연산을 실행할 때

일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산 -> 모순된 결과가 발생하는 것

트랜잭션 T1의 작업 도중 T2의 작업을 수행해서 문제 발생 / 순차적으로 하면 괜찮

3) 연쇄 복귀

트랜잭션 완료 전 장애가 발생 -> rollback 연산 수행시 :

장애발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경연산을 실행한 다른 트랜잭션에도 rollback 연산을 해줘야함

T1 완료 전 T1에서 장애가 발생한 경우

트랜잭션의 T1이 변경한 데이터 X를 가져가 연산을 수행한 트랜잭션 T2도 rollback 해야함

하지만 T2는 이미 완료되었기 때문에 rollback 불가능

-> 순차적으로 하면 문제 해결

 

3. 트랜잭션 스케줄

트랜잭션에 포함되어있는 연산들을 수행하는 순서

* 인터리빙 : 여러 트랜잭션이 차례로 번갈아 수행되는 방식

직렬 스케줄 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것
비직렬 스케줄 인터리빙 방식을 이용하여 트랜잭션들을 병행해서 수행시키는 것
직렬가능 스케줄 직렬 스케줄과 같이 정확한 결과를 생성하는 비직렬 스케줄

1) 직렬 스케줄

인터리빙 방식을 이용하지 않고 각 트랜잭셕 별로 연산들을 순차적으로 실행시키는 것

- 직렬 스케줄에 따라 트랜잭션이 수행되면 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행 -> 모순 없는 정확한 결과

- 다양한 직렬 스케줄이 만들어질 수 있고, 직렬 스케줄마다 데이터베이스에 반영되는 최종 결과가 다를 수 있음

(결과는 모두 정확)

- 각 트랜잭션을 독립적으로 수행하기 때문에 병행수행으로 볼 수 없음

 

2) 비직렬 스케줄

인터리빙 방식을 이용하셔 트랜잭션을 병행 수행하는 것

- 트랜잭션이 번갈아 연산을 실행 -> 하나의 트랜잭션 완료 전 다른 트랜잭션의 연산이 실행될 수 있음

- 비직렬 스케줄에 따라 병행 수행시 갱신분실, 모순성, 연쇄복귀 등의 문제가 발생할 수 있음 -> 결과 정확성 보장 어려움

- 다양한 비직렬 스케줄이 만들어질 수 있음 - 잘못된 결과를 생성하는 스케줄도 존재

잘된예시인데 실패할수도 있음

3) 직렬 가능 스케줄

직렬 스케줄에 따라 수행한과 같이 정확한 결과를 생성하는 비직렬 스케줄

비직렬 스케줄 중에서 수행 결과가 동일한 직렬 스케줄이 있는것

- 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있음

- 직렬 가능 스케줄인지 판단하는 것은 간단한 작업 X -> 직렬 가능성을 보장하는 병행 제어 기법을 사용하는게 일반적

 

4. 병행 제어 기법

병행수행하면서도 직렬 가능성을 보장하기 위한 기법

모든 트랜잭션에 대해 직렬 가능성이 보장되는 규약을 정의 -> 트랜잭션들이 이 규약을 따르도록 함

로킹기법이 대표적임

 

5. 로킹 기법

1) 원리와 방법

원리 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼때까지 다른 트랜잭션이 그 데이터에 접근하지 못하게 상호 배제
방법 병행수행되는 트랜잭션들이 같은 데이터에 동시에 접근하지 못하게 lock 과 unlock 연산 이용해서 제어
- lock : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
- unlock : 트랜잭션이 데이터에 대한 독점권을 반환하는 연산

2) 기본 로킹 규약

트랜잭션은 데이터에 접근하기 위해 (read 나 write 전에) 먼저 lock 연산을 실행 -> 독점권 획득

다른 트랜잭션에 의해 이미 lock 연산이 실행된 데이터에 대해 중복으로 lock 연산 실행 불가능

독점권을 획득한 데이터에 대한 모든 연산의 수행이 종료 -> 트랜잭션은 unlock 실행 -> 독점권 반납

 

3) 로킹 단위 :

lock 연산을 실행하는 대상 데이터의 크기

전체 데이터베이스부터 릴레이션, 투플, 속성까지도 가능

로킹단위 커질수록 병행성은 낮아지지만 제어 쉬움

로킹단위 작아질수록 제어 어렵지만 병행성 높아짐

 

4) 기본 로킹 규약의 효율성 높이기 :

트랜잭션들이 같은 데이터에 대해 동시에 read 연산을 실행하는 것을 허용

- lock 연산은 공용 lock 과 전용 lock 으로 구분

공용 lock " 데이터에 대한 사용권을 여러 트랜잭션이 동시에 가질 수 있음 "
트랜잭션이 데이터에 대한 공용 lock 실행
-> 해당 데이터에 read 연산은 실행 가능, write 연산 실행 불가능
다른 트랜잭션도 해당 데이터에 대해 공용 lock 연산 실행 가능
전용 lock " 전용 lock 연산을 실행한 트랜잭션만 해당 데이터에 대한 독점권을 가질 수 있음 "
트랜잭션이 해당 데이터에 전용 lock 연산 실행
-> 해당 데이터에 read 와 write 모두 실행 가능
다른 트랜잭션은 해당 데이터에 공용/전용 lock 모두 실행 불가능

<70 페이지 표 붙여넣기>

 

* 기본 로킹 규약으로 직렬 가능성이 보장되지 않는 스케줄 예시

트랜잭션 T1이 데이터 X에 대한 unlock 연산을 이른 시점에 수행 -> 트랜잭션 T2가 일관성 없는 데이터에 접근

-> 실행 결과가 같은 직렬 스케줄링이 없음

=> 2단계 로킹 규약 통해 해결 가능

 

5) 2단계 로킹 규약

의미 :트랜잭션의 직렬 가능성 보장을 위해 lock 과 unlock 수행 시점에 대한 새로운 규약을 추가한 것

방법 : 트랜잭션이 lock 과 unlock 연산을 확장단계와 축소단계로 나누어 실행

- 트랜잭션이 처음 수행 -> 확장단계 = lock 연산만 실행가능

- 트랜잭션은 첫번째 unlock 실행 이전에 필요한 모든 lock 연산을 실행해야 함

- unlock 연산 실행 -> 시 축소단계 = unlock 연산만 실행가능

모든 lock 작업이 첫번째 unlock 연산 전에 실행되었다면 2단계 로킹 규약을 준수했다고 볼 수 있음

 

6) 교착 상태

두 트랜잭션이 서로 상대가 독점하고 있는 데이터를 대상으로 unlock 연산이 실행되는 상태를 기다리며 트랜잭션 수행을 중단하고 있는 상태

교착상태가 발생하지 않도록 예방하거나, 발생시 빠르게 탐지해서 필요한 조치를 해줘야 함

'School > 데이터베이스' 카테고리의 다른 글

보안과 권한 관리  (0) 2022.06.13
정규화  (0) 2022.06.11
데이터베이스 언어 SQL_2  (0) 2022.06.11
SQL-SELECT 문  (0) 2022.04.18
관계 데이터 연산  (0) 2022.04.17