티스토리 뷰

반응형

 

트랜잭션

트랜잭션이란 하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것을 말한다.

*논리적 작업 단위

 

데이터베이스는 장애 발생 시 최대한 빠른 시간 내에 복구해야 한다.

트랜잭션은 장애 발생 시 복구 작업을 위한 중요한 단위로 사용된다.

 

 

🗨 트랜잭션의 특성

  1. 원자성
  2. 일관성
  3. 격리성
  4. 지속성

 

1️⃣ 원자성

트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식을 의미한다.

 

만약 트랜잭션을 수행하다가 장애가 발생한다면, 모두 취소하고 원상태로 되돌려야 한다.

원자성의 보장을 위해 장애 발생 시 회복 기능이 필요하다.

 

2️⃣ 일관성

트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함을 의미한다.

 

3️⃣ 격리성

수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음을 의미한다.

 

고립성이라고도 하는데, 일반적으로 여러 트랜잭션이 동시에 수행되지만 각 트랜잭션이 독립적으로 수행될 수 있도록 다른 트랜잭션의 중간 연산 결과에 서로 접근하지 못하게 한다.

 

4️⃣ 지속성

트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 영구적이어야 함을 의미한다.

 

지속성의 보장을 위해서는 장애 발생 시 회복 기능이 필요하다.

 

 

💨 4가지 특성을 보장하기 위해 필요한 기능

 

트랜잭션의 주요 연산

  • commit 연산

    트랜잭션의 수행이 성공적으로 수행되었음을 선언 (작업 완료)

  • rollback 연산

    트랜잭션을 수행하는 데 실패했음을 선언 (작업 취소)

 

 

📈 트랜잭션의 상태

트랜잭션은 아래 그림의 다섯 가지 상태 중 하나에 속하게 된다.

  • 활동 상태

    트랜잭션이 수행되기 시작하여 현재 수행 중인 상태

  • 부분 완료 상태

    트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태

  • 완료 상태

    트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태

  • 실패 상태

    장애가 발생하여 트랜잭션의 수행이 중단된 상태

  • 철회 상태

    트랜잭션의 수행 실패로 rollback 연산을 실행한 상태

 


 

장애

  • 트랜잭션 장애
  • 시스템 장애
  • 미디어 장애

 

트랜잭션 장애

트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태를 말한다.

 

🔌 원인

  • 트랜잭션의 논리적 오류
  • 잘못된 데이터 입력
  • 시스템 자원의 과다 사용 요구
  • 처리 대상 데이터의 부재

 

시스템 장애

하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태를 말한다.

 

🔌 원인

  • 하드웨어 이상으로 메인 메모리에 저장된 정보가 손실된 경우
  • 또는 교착 상태가 발생한 경우

 

미디어 장애

디스크 장치의 결함으로 디스크에 저장된 데이터베이스의 일부 혹은 전체가 손상된 상태를 말한다.

 

🔌 원인

  • 디스크 헤드의 손상
  • 고장

 

📬 트랜잭션의 수행을 위해 필요한 데이터 이동 연산

▪ 디스크와 메인 메인 메모리 간의 데이터 이동 연산 : input / output

▪ 메인 메모리와 프로그램 변수 간의 데이터 이동 연산 : read / write

input(X) : 디스크 블록에 저장되어 있는 데이터 X를 메인 메모리 버퍼 블록으로 이동시키는 연산

output(X) : 메인 메모리 버퍼 블록에 있는 데이터 X를 디스크 블록으로 이동시키는 연산

 

read(X) : 메인 메모리 버퍼 블록에 저장되어 있는 데이터 X를 프로그램의 변수로 읽어오는 연산

write(X) : 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 X에 기록하는 연산

 

 


 

🚑 회복

데이터베이스에 장애가 발생했을 때 장애가 발생하기 전의 모순이 없고 일관된 상태로 복구시키는 것으로 회복 관리자가 담당한다.

 

*회복 관리자

장애 발생을 탐지하고, 장애가 탐지되면 데이터베이스 복구 기능을 제공

 

 

🚑 회복을 위해 데이터베이스 복사본을 만드는 방법

  • 덤프

    데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법

  • 로그

    데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후의 값을 별도의 파일에 기록하는 방법

 

🚑 회복을 위한 기본 연산

  • redo (재실행)

    가장 최근에 저장한 데이터베이스 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 데이터베이스 상태로 복구

  • undo (취소)

    로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래의 상태로 복구

 

📋 로그 파일

데이터를 변경하기 이전의 값과 변경한 이후의 값을 기록한 파일이다.

 

 

 

🚑 회복 기법

 

🚑 즉시 갱신 회복 기법

트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영하는 기법

 

장애 발생 시점에 따라 redo나 undo 연산을 실행해 데이터베이스를 복구

 

 

🚑 지연 갱신 회복 기법

트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이 스에 한 번에 반영하는 기법

 

undo 연산은 필요 없고 redo 연산만 사용

 

 

🚑 검사 시점 회복 기법

로그 기록을 이용하되, 일정 시간 간격으로 검사 시점을 만들어 장애 발생 시 가장 최근 검사 시점 이후의 트랜잭션에만 회복 작업을 수행하는 기법

 

로그 전체를 대상으로 회복 기법을 적용할 때 발생할 수 있는 비효율성의 문제를 해결

 

 

🚑 미디어 회복 기법

 디스크에 발생할 수 있는 장애에 대비한 회복 기법

 

덤프(복사본) 이용

 

 


병행 제어

*병행 수행 시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 트랜잭션의 수행을 제어하는 것을 의미한다

 

*병행 수행

여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러 개의 트랜잭션을 동시에 수행하는 것을 의미

 

 

🔨 병행 수행의 문제

  1. 갱신 분실

    하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어 변경 연산이 무효화되는 것

  2. 모순성

    하나의 트랜잭션이 여러 개 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산함으로써 모순된 결과가 발생하는 것

  3. 연쇄 복귀

    트랜잭션이 완료되기 전 장애가 발생하여 rollback 연산을 수행하면, 장애 발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜 잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것

 

📲 트랜잭션 스케줄

트랜잭션에 포함되어 있는 연산들을 수행하는 순서를 말한다.

 

  • 직렬 스케줄
  • 비직렬 스케줄
  • 직렬 가능 스케줄

 

🎫 직렬 스케줄

인터리빙 방식을 이용하지 않고 각 트랜잭션 별로 연산들을 순차적으로 실행

 

특징

  • 직렬 스케줄에 따라 트랜잭션이 수행되면, 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행되므로 항상 모순이 없는 정확한 결과를 얻게 됨
  • 다양한 직렬 스케줄이 만들어질 수 있고, 직렬 스케줄마다 데이터베이스에 반영되는 최종 결과가 다를 수 있지만 직렬 스케줄의 결과는 모두 정확함
  • 각 트랜잭션을 독립적으로 수행하기 때문에 병행 수행으로 볼 수 없음

 

🎫 비직렬 스케줄

인터리빙 방식을 이용하여 트랜잭션을 병행 수행

 

특징

  • 트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 실행될 수 있음
  • 비직렬 스케줄에 따라 병행 수행하면 갱신 분실, 모순성, 연쇄 복귀 등의 문제가 발생할 수 있어 결과의 정확성을 보장할 수 없음
  • 다양한 비직렬 스케줄이 만들어질 수 있고 그중에는 잘못된 결과를 생성하는 것도 있음

 

🎫 직렬 가능 스케줄

비직렬 스케줄 중에서 수행 결과가 동일한 직렬 스케줄

 

특징

  • 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있음
  • 직렬 가능 스케줄인지 판단하는 것은 간단한 작업이 아니므로 직렬 가능성을 보장하는 병행 제어 기법을 사용하는 것이 일반적임

 

병행 제어 기법

병행 수행하면서도 직렬 가능성을 보장하기 위한 기법을 말한다.

 

  • 로킹 기법

 

로킹 기법

한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지는 다른 트랜잭 션이 그 데이터에 접근하지 못하도록 상호 배제한다.

 

방법

병행 수행되는 트랜잭션들이 같은 데이터에 동시에 접근하지 못하도록 lockunlock 연산을 이용해 제어

 

  • lock : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
  • unlock : 트랜잭션이 데이터에 대한 독점권을 반환하는 연산

 

2단계 로킹 규약

기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 새로운 규약을 추가

 

방법

트랜잭션이 lockunlock 연산을 확장 단계와 축소 단계로 나누어 실행

 

 

 

 

 

 

 

좋아요는 로그인하지 않아도 누를 수 있습니다!

728x90
반응형
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함