이 글은 배민 기술이사 김영한 이사님의 인프런 강의 "스프링 DB 1편 - 데이터 접근 핵심 원리" 을 기반으로 작성되었습니다. 문제 시 삭제 조치하겠습니다.
아래와 같은 순서로 공부를 진행합니다.
- 트랜잭션 - 개념 이해
- 데이터베이스 연결 구조와 DB 세션
- 트랜잭션 - DB 예제1 - 개념 이해
- 트랜잭션 - DB 예제2 - 자동 커밋, 수동 커밋
- 트랜잭션 - DB 예제3 - 트랜잭션 실습
- 트랜잭션 - DB 예제4- 계좌 이체
1. 트랜잭션 - 개념 이해
데이터를 저장할 때 단순히 파일에 저장해도 되는데, 데이터베이스에 저장하는 이유는 무엇일까요?
여러가지 이유가 있지만, 가장 대표적인 이유는 바로 데이터베이스는 트랜잭션이라는 개념을 지원하기 때문입니다.
트랜잭션을 이름 그대로 번역하면 거래라는 뜻으로, 이것을 쉽게 풀어서 이야기하면, 데이터베이스에서 트랜잭션은 하나의 거래를 안전하게 처리하도록 보장해주는 것을 의미합니다.
그런데 하나의 거래를 안전하게 처리하려면 생각보다 고려해야 할 점이 많습니다.
예를 들어서 A 의 5000원을 B 에게 계좌이체한다고 가정하면 A 의 잔고를 5000원 감소시키고, B 의 잔고를 5000원 증가시켜야 합니다.
5000원 계좌이체
- A의 잔고를 5000원 감소
- B의 잔고를 5000원 증가
계좌이체라는 거래는 이렇게 2가지 작업이 합쳐져서 하나의 작업처럼 동작해야 합니다.
만약 1번은 성공했는데 2번에서 시스템에 문제가 발생하면 계좌이체는 실패하고, A의 잔고만 5000원 감소하는 심각한 문제가 발생하게 됩니다.
데이터베이스가 제공하는 트랜잭션 기능을 사용하면 1,2 둘다 함께 성공해야 저장하고, 중간에 하나라도 실패하면 거래 전의 상태로 돌아갈 수 있습니다.
만약 1번은 성공했는데 2번에서 시스템에 문제가 발생하면 계좌이체는 실패하고, 거래 전의 상태로 완전히 돌아갈 수 있습니다. 결과적으로 A의 잔고가 감소하지 않겠죠.
모든 작업이 성공해서 데이터베이스에 정상 반영하는 것을 커밋(Commit)이라 하고, 작업 중 하나라도 실패해서 거래 이전으로 되돌리는 것을 롤백(Rollback)이라 합니다.
트랜잭션 ACID
트랜잭션은 ACID(http://en.wikipedia.org/wiki/ACID)라 하는 원자성(Atomicity), 일관성(Consistency), 격리성(Isolation), 지속성(Durability)을 보장해야 합니다.
- 원자성(Atomicity): 트랜잭션 내에서 실행한 작업들은 마치 하나의 작업인 것처럼 모두 성공 하거나 모두 실패해야 합니다.
- 일관성(Consistency): 모든 트랜잭션은 일관성 있는 데이터베이스 상태를 유지해야 합니다.
예를 들어 데이터베이스에서 정한 무결성 제약 조건을 항상 만족해야 합니다. - 격리성(Isolation): 동시에 실행되는 트랜잭션들이 서로에게 영향을 미치지 않도록 격리해야 합니다.
예를 들어 동시에 같은 데이터를 수정하지 못하도록 해야 합니다.
격리성은 동시성과 관련된 성능 이슈로 인해 트랜잭션 격리 수준(Isolation level)을 선택할 수 있습니다. - 지속성(Durability): 트랜잭션을 성공적으로 끝내면 그 결과가 항상 기록되어야 합니다.
중간에 시스템에 문제가 발생해도 데이터베이스 로그 등을 사용해서 성공한 트랜잭션 내용을 복구해야 합니다.
트랜잭션은 원자성, 일관성, 지속성을 보장합니다.
여기서 복잡한 문제는 격리성인데 트랜잭션 간에 격리성을 완벽히 보장하려면 트랜잭션을 거의 순서대로 실행해야 하므로 동시 처리 성능이 매우 나빠질 수 밖에 없습니다.
이런 문제로 인해 ANSI 표준은 트랜잭션의 격리 수준(Isolation level)을 4단계로 나누어 정의합니다.
트랜잭션 격리 수준 - Isolation level
- READ UNCOMMITED(커밋되지 않은 읽기) - Dirty Read
- READ COMMITTED(커밋된 읽기) - 가장 많이 씀
- REPEATABLE READ(반복 가능한 읽기)
- SERIALIZABLE(직렬화 가능) - 거의 사용하지 않음
이 글에서는 일반적으로 많이 사용하는 READ COMMITTED(커밋된 읽기) 트랜잭션 격리 수준을 기준으로 설명합니다. 트랜잭션 격리 수준은 데이터베이스 자체에 관한 부분이므로 다른 글을 참고하세요! (앞으로 데이터베이스 관련 내용을 정리할 예정이나 조금 시간이 걸릴 것 같습니다.)
2. 데이터베이스 연결 구조와 DB 세션
데이터베이스 연결 구조1
- 사용자는 웹 애플리케이션 서버(WAS)나 DB 접근 툴 같은 클라이언트를 사용해서 데이터베이스 서버에 접근할 수 있습니다.
- 클라이언트는 데이터베이스 서버에 연결을 요청하고 커넥션을 맺습니다.
- 이 때 데이터베이스 서버는 내부에 세션이라는 것을 생성합니다.
- 그리고 앞으로 해당 커넥션을 통한 모든 요청은 이 세션을 통해서 실행합니다.
쉽게 이야기해서 개발자가 클라이언트를 통해 SQL을 전달하면 현재 커넥션에 연결된 세션이 SQL을 실행하는 것이지요. - 세션은 트랜잭션을 시작하고, 커밋 또는 롤백을 통해 트랜잭션을 종료합니다. 그리고 이후에 새로운 트랜잭션을 다시 시작할 수 있음
- 사용자가 커넥션을 닫거나, 또는 DBA(DB 관리자)가 세션을 강제로 종료하면 세션은 종료됩니다.
데이터베이스 연결 구조2
커넥션 풀이 10개의 커넥션을 생성하면, 세션도 10개 생성됩니다.
3. 트랜잭션 - DB 예제1 - 개념 이해
개념 이해
본 설명은 트랜잭션 개념의 이해를 돕기 위해 예시로 구체적인 실제 구현 방식은 데이터베이스마다 조금씩은 다릅니다.
트랜잭션 사용법
데이터 변경 쿼리를 실행하고 데이터베이스에 그 결과를 반영하려면 커밋 명령어인 commit
을 호출하고, 결과를 반영하고 싶지 않으면 롤백 명령어인 rollback
을 호출하면 됩니다.
커밋을 호출하기 전까지는 임시로 데이터를 저장합니다. 따라서 해당 트랜잭션을 시작한 세션(사용자)에게만 변경 데이터가 보이고 다른 세션(사용자)에게는 변경 데이터가 보이지 않습니다.
기본 데이터
- 세션1, 세션2 둘다 가운데 있는 기본 테이블을 조회하면 해당 데이터가 그대로 조회됩니다.
세션1 신규 데이터 추가
세션1은 트랜잭션을 시작하고 신규 회원1, 신규 회원2를 DB에 추가한 상태입니다. 하지만 아직 커밋은 하지 않은 상태이지요.
새로운 데이터는 임시 상태로 저장됩니다.
세션1은 select
쿼리를 실행해서 본인이 입력한 신규 회원1, 신규 회원2를 조회할 수 있습니다.
하지만 세션1이 아직 커밋을 하지 않았기 때문에 세션2는 select
쿼리를 실행해도 신규 회원들을 조회할 수 없습니다.
만약 위와 다르게 커밋하지 않은 데이터를 다른 곳(세션2)에서 조회할 수 있을 때 발생하는 문제는 무엇일까요?
예를 들어서 커밋하지 않는 데이터가 보인다면, 세션2는 데이터를 조회했을 때 신규 회원1, 2가 보이게 됩니다.
따라서 신규 회원1, 신규 회원2가 있다고 가정하고 어떠한 로직을 수행할 수 있습니다. 그런데 세션1이 롤백을 수행하면 신규 회원1, 신규 회원2의 데이터가 사라지게 되므로 데이터 정합성에 큰 문제가 발생하게 됩니다.
즉, 세션2에서 세션1이 아직 커밋하지 않은 변경 데이터가 보인다면 세션1이 롤백 했을 때 심각한 문제가 발생할 수 있으므로 커밋 전의 데이터는 다른 세션에서 보이지 않아야 합니다.
세션1 신규 데이터 추가 후 commit
이제 세션1이 신규 데이터를 추가한 후에 commit
을 호출했습니다.
commit
으로 새로운 데이터가 실제 데이터베이스에 반영되어 데이터의 상태도 임시 완료로 변경됩니다.
이제 다른 세션에서도 회원 테이블을 조회하면 신규 회원들을 확인할 수 있습니다.
세션1 신규 데이터 추가 후 rollback
세션1이 신규 데이터를 추가한 후에 commit
이 아닌 rollback
을 호출했습니다.
세션1이 데이터베이스에 반영한 모든 데이터가 처음 상태로 복구됩니다.
수정하거나 삭제한 데이터도 rollback
을 호출하면 모두 트랜잭션을 시작하기 직전의 상태로 복구됩니다.
4. 트랜잭션 - DB 예제2 - 자동 커밋, 수동 커밋
member
- 예제 스키마
drop table member if exists;
create table member (
member_id varchar(10),
money integer not null default 0,
primary key (member_id)
);
자동 커밋
자동 커밋으로 설정하면 각각의 쿼리 실행 직후에 자동으로 커밋을 호출합니다. 따라서 커밋이나 롤백을 직접 호출하지 않아도 되어 편리합니다.
하지만 쿼리를 하나하나 실행할 때 마다 자동으로 커밋이 되어버리기 때문에 우리가 원하는 트랜잭션 기능을 제대로 사용할 수 없습니다.
(자동 커밋 설정은 아래처럼 작성하면 됩니다.)
set autocommit true; //자동 커밋 모드 설정
insert into member(member_id, money) values ('data1',10000); //자동 커밋
insert into member(member_id, money) values ('data2',10000); //자동 커밋
select * from member;
따라서 commit
, rollback
을 직접 호출하면서 트랜잭션 기능을 제대로 수행하려면 자동 커밋을 끄고 수동 커밋을 사용해야 합니다.
수동 커밋
set autocommit false; //수동 커밋 모드 설정
insert into member(member_id, money) values ('data3',10000);
insert into member(member_id, money) values ('data4',10000);
commit; //수동 커밋
보통 자동 커밋 모드가 기본으로 설정된 경우가 많기 때문에, 수동 커밋 모드로 설정하는 것을 트랜잭션을 시작한다고 표현할 수 있습니다.
수동 커밋 설정을 하면 이후에 꼭 commit
, rollback
을 호출해야 합니다.
참고로 수동 커밋 모드나 자동 커밋 모드는 한번 설정하면 해당 세션에서는 계속 유지됩니다.
물론, 중간에 변경하는 것도 가능합니다.
5. 트랜잭션 - DB 예제3 - 트랜잭션 실습
1. 기본 데이터 입력
우리는 세션을 하나 더 열기 위해서 웹 콘솔 창을 하나 더 열어서 h2 데이터베이스로 실행할 것입니다.
주의 - H2 데이터베이스 웹 콘솔 창을 2개 열때 기존 URL을 복사하면 안 됩니다.
꼭 http://localhost:8082 를 직접 입력해서 완전히 새로운 세션에서 연결하도록 해야 합니다.
URL을 복사하면 같은 세션( jsessionId )에서 실행되어서 원하는 결과가 나오지 않을 수 있습니다.
예: http://localhost:8082 에 접근했을 때 다음과 같이 jsessionid 값이 서로 달라야 함. jsessionid 값이 같으면 같은 세션에 접근하는 것임.
예) 1번 URL: http://localhost:8082/login.do?jsessionid=744cb5cbdfeab7d972e93d08d731b005
예) 2번 URL: http://localhost:8082/login.do?jsessionid=5e297b3dbeaa2383acc1109942bd2a41
기본 데이터
데이터 초기화 SQL
//데이터 초기화
set autocommit true;
delete from member;
insert into member(member_id, money) values ('oldId',10000);
자동 커밋 모드를 사용했기 때문에 별도로 커밋을 호출하지 않아도 됩니다.
주의 - 만약 잘 진행되지 않으면 이전에 실행한 특정 세션에서 락을 걸고 있을 수 있습니다.
이때는 H2 데이터베이스 서버를 종료하고 다시 실행하면 됩니다.
데이터를 초기화하고 세션1, 세션2에서 다음 쿼리를 실행해서 결과를 확인해봅시다.
select * from member;
세션 1 과 세션 2 모두 동일하게 조회됩니다.
세션1 신규 데이터 추가
세션1 신규 데이터 추가 SQL
//트랜잭션 시작
set autocommit false; //수동 커밋 모드
insert into member(member_id, money) values ('newId1',10000);
insert into member(member_id, money) values ('newId2',10000);
select * from member;
세션1, 세션2에서 다음 쿼리를 실행해서 결과를 확인해봅니다.
아직 세션1이 커밋을 하지 않은 상태이기 때문에 세션1에서는 입력한 데이터가 보이지만, 세션2에서는 입력한 데이터가 보이지 않는 것을 확인할 수 있습니다.
커밋 - commit
세션1에서 신규 데이터를 입력했는데 아직 커밋은 하지 않았습니다. 이제 커밋해서 데이터베이스에 결과를 반영해봅시다.
세션1 신규 데이터 추가 후 commit
세션1에서 커밋을 호출합시다.
commit; //데이터베이스에 반영
세션1, 세션2에서 다음 쿼리를 실행해서 결과를 확인해봅시다.
select * from member;
결과를 이미지와 비교하면 같은 결과입니다.
세션1이 트랜잭션을 커밋했기 때문에 데이터베이스에 실제 데이터가 반영되었습니다. 커밋 이후에는 모든 세션에서 데이터를 조회할 수 있습니다.
롤백 - rollback
기본 데이터
예제를 처음으로 돌리기 위해 데이터를 초기화합시다.
//데이터 초기화
set autocommit true;
delete from member;
insert into member(member_id, money) values ('oldId',10000);
세션1 신규 데이터 추가 후
세션1에서 트랜잭션을 시작 상태로 만든 다음에 데이터를 추가합니다.
//트랜잭션 시작
set autocommit false; //수동 커밋 모드
insert into member(member_id, money) values ('newId1',10000);
insert into member(member_id, money) values ('newId2',10000);
세션1, 세션2에서 다음 쿼리를 실행해서 결과를 확인해봅시다.
select * from member;
아직 세션1이 커밋을 하지 않은 상태이기 때문에 세션1에서는 입력한 데이터가 보이지만, 세션2에서는 입력한 데이터가 보이지 않는 것을 확인할 수 있습니다.
세션1 신규 데이터 추가 후 rollback
세션1에서 롤백을 호출합니다.
rollback; //롤백으로 데이터베이스에 변경 사항을 반영하지 않는다.
세션1, 세션2에서 다음 쿼리를 실행해서 결과를 확인합니다.
select * from member;
롤백으로 데이터가 DB에 반영되지 않은 것을 확인할 수 있습니다.
6. 트랜잭션 - DB 예제4- 계좌 이체
계좌이체가 정상적으로 실행되는 모습
기본 데이터 입력
기본 데이터 입력 - SQL
set autocommit true;
delete from member;
insert into member(member_id, money) values ('memberA',10000);
insert into member(member_id, money) values ('memberB',10000);
memberA
는 10000원 을 가지고 있고 memberB
도 10000원을 갖고 있는 상태가 되었습니다.
계좌이체 실행
memberA
의 돈을 memberB
에게 2000원 계좌이체하는 트랜잭션을 실행합니다.
다음과 같은 2번의 update
쿼리가 수행되어야 합니다
.
set autocommit false
로 설정합니다.
아직 커밋하지 않았으므로 다른 세션에는 기존 데이터가 조회됩니다. 아래 코드를 통해서 실행됩니다.
계좌이체 실행 SQL - 성공
set autocommit false;
update member set money=10000 - 2000 where member_id = 'memberA';
update member set money=10000 + 2000 where member_id = 'memberB';
커밋
commit
명령어를 실행하면 데이터베이스에 결과가 반영됨- 다른 세션에서도
memberA
의 금액이 8000원으로 줄어들고,memberB
의 금액이 12000원으로 증가한 것을 확인할 수 있음
세션 1 에서 커밋
commit;
확인 쿼리
select * from member;
이렇게 되면 정상적으로 실행된 것을 확인할 수 있습니다. 하지만 문제 상황이 일어날 수도 있습니다. 아래 예시처럼 말이죠.
계좌이체 문제 상황 - 커밋
기본 데이터 입력
기본 데이터 입력 - SQL
set autocommit true;
delete from member;
insert into member(member_id, money) values ('memberA',10000);
insert into member(member_id, money) values ('memberB',10000);
계좌이체 실행
계좌이체를 실행하는 도중에 SQL에 어떠한 문제가 발생한다고 합시다. 그렇게 되면 memberA
의 돈을 2000원 줄이는 것에는 성공했지만 memberB
의 돈을 2000원 증가시키는 것에 실패할 수 있습니다.
아래 예시 코드를 보면 두 번째 SQL 에서 member_iddd
라는 필드에 오타가 있습니다. 두 번째 update
쿼리를 실행하면 SQL 오류가 발생하는 것을 확인할 수 있습니다.
계좌이체 실행 SQL - 오류
set autocommit false;
update member set money=10000 - 2000 where member_id = 'memberA'; //성공
update member set money=10000 + 2000 where member_iddd = 'memberB'; //쿼리 예외 발생
두 번째 SQL 실행시 발생하는 오류 메시지
Column "MEMBER_IDDD" not found; SQL statement:
update member set money=10000 + 2000 where member_iddd = 'memberB' [42122-200] 42S22/42122
여기서 문제는 memberA
의 돈은 2000원 줄어들었지만, memberB
의 돈은 2000원 증가하지 않았다는 점입니다. 결과적으로 계좌이체는 실패하고 memberA
의 돈만 2000원 줄어든 상황이 됩니다.
강제 커밋
만약 이 상황에서 강제로 commit
을 호출하면 어떻게 될까요?
당연히 정상적인 계좌이체는 실패하고 memberA
의 돈만 2000원 줄어드는 아주 심각한 문제가 발생하게 됩니다.
직접 커밋을 해서 확인해보면 위 그림처럼 되는 것을 확인할 수 있습니다.
세션1 커밋
commit;
확인 쿼리
select * from member;
이렇게 중간에 문제가 발생했을 때는 커밋을 호출하면 안됩니다!!
롤백을 호출해서 데이터를 트랜잭션 시작 시점으로 원복해야 합니다.
계좌이체 문제 상황 - 롤백
기본 데이터 입력
기본 데이터 입력 - SQL
set autocommit true;
delete from member;
insert into member(member_id, money) values ('memberA',10000);
insert into member(member_id, money) values ('memberB',10000);
계좌이체 실행
계좌이체를 실행하는 도중에 SQL에 문제가 발생했습니다. 그래서 memberA
의 돈을 2000원 줄이는 것에는 성공했지만, memberB
의 돈을 2000원 증가시키는 것에는 실패한 것이지요.
두 번째 update
쿼리를 실행하면 SQL 오류가 발생하는 것을 확인할 수 있습니다.
계좌이체 실행 SQL - 오류
set autocommit false;
update member set money=10000 - 2000 where member_id = 'memberA'; //성공
update member set money=10000 + 2000 where member_iddd = 'memberB'; //쿼리 예외 발생
두 번째 SQL 실행시 발생하는 오류 메시지
Column "MEMBER_IDDD" not found; SQL statement:
update member set money=10000 + 2000 where member_iddd = 'memberB' [42122-200] 42S22/42122
여기서 문제는 memberA
의 돈은 2000원 줄어들었지만, memberB
의 돈은 2000원 증가하지 않았다는 점입니다.
결과적으로 계좌이체는 실패하고 memberA
의 돈만 2000원 줄어든 상황이 되어 버렸습니다.
롤백
이럴 때는 롤백을 호출해서 트랜잭션을 시작하기 전 단계로 데이터를 복구해야 합니다.
아래에 보이는 코드를 통해서 롤백을 사용한 덕분에 계좌이체를 실행하기 전 상태로 원복할 수 있습니다.
memberA
의 돈도 이전 상태인 10000원으로 돌아오고, memberB
의 돈도 10000원으로 유지되는 것을 확인할 수 있습니다!
세션1 - 롤백
rollback;
확인 쿼리
select * from member;
정리
원자성 : 트랜잭션 내에서 실행한 작업들은 마치 하나의 작업인 것처럼 모두 성공하거나 모두 실패해야 합니다!
트랜잭션의 원자성 덕분에 여러 SQL 명령어를 마치 하나의 작업인 것처럼 처리할 수 있습니다. 성공하면 한번에 반영하고, 중간에 실패해도 마치 하나의 작업을 되돌리는 것 처럼 간단히 되돌릴 수 있습니다.
오토 커밋 : 만약 오토 커밋 모드로 동작하는데, 계좌이체 중간에 실패하면 어떻게 할까요? 쿼리를 하나 실행할 때마다 바로바로 커밋이 되어버리기 때문에 memberA
의 돈만 2000원 줄어드는 심각한 문제가 발생하게 됩니다.
트랜잭션 시작: 따라서 이런 종류의 작업은 꼭 수동 커밋 모드를 사용해서 수동으로 커밋과 롤백을 할 수 있도록 해야 합니다. 보통 이렇게 자동 커밋 모드에서 수동 커밋 모드로 전환 하는 것을 트랜잭션을 시작한다고 표현합니다