개발자도 알아야 하는 DBMS튜닝

2016년 JavaCafe 강사준비팀4기
Keynote
DBMS 성능 높이기
개발자도 알아야 하는
Keynote

MariaDB 서버 구축하기
강사소개

■ 강사 프로필
이 름 : 이 정 해
주 사용 DB : DB2, MS-SQL,
MySQL,Oracle
■ 수행 프로젝트
삼성화재 상품, 배치 DB2 Database Server Migration 및 Version Upgrade
국민카드 보험통판 Database 신규 구축
현대중공업 PLM Database 구축
SK Telecom 시스템 고도화 프로젝트
아주캐피탈 차세대 시스템 구축
다크에덴 DB Upgrade 및 모니터링 시스템 구축 - 수행중
■ 주 관심사
인프라 기술
Cloud - Open Stack
SWIFT

차 례

1. DBMS의 Brain : Optimizer
2. 나의 데이터 저장소 : Tablespace,
Table
3. 조리있게 명령을 내리자 : SQL
3. 지름길 안내 : Index
4. LOB의 성능을 높이자 - Inline Lob

INTRO

■ 즐거운 여행
• 서울에서 부산을 가자!
1. 목표를 설정했습니다.
2. 네비게이션에 목표를 입력합니다.
3. 네비게이션이 목표를 찾습니다.
4. 이제 즐겁게 여행을 떠납시다. 고고고~!
5. 네비게이션은 실시간 정보를 받아 어디가 빠를지 계속 안내합
니다.
6. 목적지에 도착 후 즐겁게 여행을 즐깁니다.
7

select /*+ INDEX_DESC (tab1 idx01) */
A.Col1, B.Col2
from Table1 as tab1
Left Outer Join
Table2 as tab2
on tab1.col1 = tab2.col1
and tab1.col2 = tab1.col2
where 1=1
and tab1.col3 = 1
and tab2.col4 = ‘A’
order by col1 desc, col2 asc

■ 즐거운 여행
• 서울에서 부산을 가자!
1. 목표를 설정했습니다. - 사용자 SQL 입력
2. 네비게이션에 목표를 입력 하고 추천 목표지를 받습니다. -
Optimizer의 실행계획
3. 이제 즐겁게 여행을 떠납시다. - 테이블 데이터(여행정보)
4. 네비게이션은 실시간 정보를 받아 어디가 빠를지 계속 안내합
니다.
- Index
5. 목적지에 도착 후 즐겁게 여행을 즐깁니다.
- Table Data, LOB Data[추억쌓기, 사진, 음악등.]
9

DBMS의 핵심이자 두뇌!
Optimizer

■ Optimizer
• Optimizer란?
11
옵티마이저(Optimizer)는 SQL을
가장 빠르고 효율적으로 수행할
최적(최저비용)의 처리경로를 생
성해 주는 DBMS 내부의 핵심엔
진

■ Optimizer
• 방식의 정의 - CBO – Cost Based Optimizer
12

■ Optimizer
• Optimizer - 통계정보 및 실행계획
1. 인덱스 상태.
2. 데이터 분포.
3. Key 종류.
4. 테이블 참조제약.
5. 기타.
13

■ Optimizer
1. 사용자가 질의한 SQL문에 대해 최적의 실행 방법을 결정하
는 역할을 수행
14

■ Optimizer

■ Optimizer
• 쿼리 리라이트 – 최적의 여행코스를 짜보자.
19
서울
휴게소
우동, 짜장면등
중간 경유지
명소, ETC
고속도로 공사
중
우회길 탐색
다른 고속도로
국도
부산 도착

■ Optimizer
• 쿼리 리라이트 – 쿼리 재작성 및 재조합.
1. 사용자 조인을 조정.
2. 사용자 컬럼 캐스팅 조정.
3. 조인 순서 변경
4. 조인 값 추가
5. 기타 여러가지 재조정.
20

■ Optimizer
• 쿼리 리라이트 – 중요한 힌트!
1. 나의 SQL이 어떻게 바뀌었는
지 알 수 있다.
2. 흐름 과정을 이해할 수 있다.
3. SQL을 어떻게 작성할 것인지
에 대한 힌트를 얻을 수 있다.
4. 구간구간 병목 구간을 유추해
볼 수 있다.
5. 버그 유무를 알 수 있다.
21

■ Optimizer
• 쿼리 리라이트 - 쿼리 재작성 및 재조합.

■ Optimizer
• Optimizer Level - Optimizer Mode
1. 서울에서 부산으로 가는 방법
23
교통 수단에 따른 방법
KTX, 고속버스, 자가용
자가용을 사용시 경로에 따른 방법
서울 오른쪽 부산
서울 가운데 부산
서울 왼쪽 부산

■ Optimizer
• Optimizer Level – Optimizer Mode
1. 쿼리 복잡시 DBMS 기본 Optimizer 순위 혹은 상위 설정.
- RDBMS에 Optimizer 연산을 맡겨 빠른 경로를 찾게 함.
- SQL 쿼리 복잡도가 높다면 사람이 계산할 수 있는 한계가 있기 때문
에 옵티마이저가 최대의 연산을 할 수 있도록 도움. DBMS 자원의
상태를 보고 어떤 실행계획이 빠른지 모든 연산을 동원함.
24

■ Optimizer
2. 쿼리 단순시 옵티마이저 레발 혹은 모드를 낮춤.
- 단순 DML Query라면 옵티마이저 레벨을 낮추는게 유리.
- 누가봐도 이게 정답인 거라면 낮추는게 유리. 필요이상의 연산 방지.
25

■ Optimizer
3. 시스템 세션에서 바로 변경이 가능.
- 프로그램 개발시 단순 쿼리라면 현 세션 변수를 통해 Optimizer
Level을 낮추는게 가능.
- 레벨을 낮추어 쓸데없는 연산을 늘리지 말고 바로 수행할 수 있도록
컨트롤.
26

■ Optimizer
• Driving Table
27
- TABLE에 대한 JOIN시 먼저 ACCESS되서
ACCESS PATH를 주도하는TABLE
- 어느 TABLE이 먼저 ACCESS되느냐에 따라
속도의 차이가 크게 날 수 있으므로 매우
중요
27

■ Optimizer
• Driving Table
28
where 1=1
and 주민번호 = ‘998745-1265998’
and 휴대폰번호=‘010-1010-1010’
and 이메일주소=‘spring@spring.com’
where 1=1
and 성별 = ‘남’
and 병역필 = ‘필’
and 시군구 = ‘서울시’

■ Optimizer
• Cardinality - 유일성
1. 유일성
- 컬럼데이터 중 중복 값을 제거한 유일한 데이터 갯수
29
1
1
2
2
3
3
4
4
남
남
남
남
남
남
남
여
A
B
O
A
A
B
O
A
Cardinality : 4 Cardinality : 2 Cardinality : 3

나의 데이터 저장소
TableSpace, Table

■ Table Space
• Table Row의 크기 - Page Size Or Block Size
31
4K Row
Page size : 한 Row가 가질 수 있는 Row의 길이
8K Row
8K Row
16K Row
16K Row
32K Row
32K Row

■ Table Space
1. Oracle에는 Block Size라 표기하고 DB2와 기타 다른
RDBMS는 Page size라고 부름
2. OLTP : Online Transaction Processing
Oracle, MS-SQL, MySQL등
3. OLAP : Online Analytical Processing
DB2. Sybase등
32

■ Table Space
1. Page 크기에 따른 DB 용도
33
OLTP OLAP

■ Table
• 데이터 입력 성능을 높이기 위한 팁
1. 데이터 입력속도 높이기
- DBMS마다 데이터를 입력하는 명령어가 2가지 이상 방법 존재.
- 하나는 Import, 하나는 LOAD.
- 이 두가지 방법은 DBMS메카니즘으로 차이가 있음.
34

■ Table
2. IMPORT
- 테이블의 모든 제약을 점검하면서 데이터를 입력.
- 테이블의 인덱스를 모두 체크하고 입력. - Primary, Unique Key등등.
- ROW By ROW로 입력하기 때문에 DBMS입장에서는 안전한 입력방법.
- Table이 깨질시에도 복구가 쉬움.
- 주로 몇십MB의 데이터 입력시 사용.
35

■ Table
3. LOAD
- 일단 데이터의 입력 공간을 만들어 놓고 데이터를 밀어넣음.
- 후에 테이블의 인덱스를 체크. - Primary, Unique Key등등.
- 대량의 큰 데이터를 한번에 입력할때 사용. 혹은 데이터 초기 적재때 사용
.
- Table이 깨질 위험이 있으며 DBMS부하도 높음.
- 주로 몇GB이상 데이터 입력시 사용.
36

■ Table
4. 데이터 입력 성능을 높이기 위한 방법
- 정렬(SORT) 메모리 크기를 늘림.
- Bulk Load를 위한 메모리 크기를 늘림.
- TEMP Space사이즈를 크게 늘려줌.
- 참조제약을 제거하고 입력. 입력 완료 후 다시 제약조건 설정
- 인덱스 DROP(삭제) 후 재생성.
- 아카이브 로그 작성 일시 OFF
- 빠른 속도를 가지고 있는 디스크로 교체
37

RDBMS를 컨트롤하는
단 하나의 언어
SQL

■ SQL
• Structured Query Language
1.데이터베이스에 접근할 수 있는 데이터베이스 하부 언어. 구조
화 질의어.
2.간단히 데이터 베이스에서 데이터를 읽어올때 DBMS에 명령을
내릴 수 있는 언어.
39

■ SQL
• Database를 제어하는 언어
40
DDL
Create
Drop
Alter
DML
Insert
Update
Delete
DCL
Commit
Rollback
Transaction

■ SQL
• 성격 맞추기
41
C1 C2 C3 C4
Int Char Varchar Date
WEHRE C1=‘1234’
AND C2 = 1
AND C3 = ‘C’
AND C4 = ‘2015-05-06’

■ SQL
• Char vs Varchar
1. Char - size 4byte
42
필 립 스 ’’
삼 성 ’’ ‘'
파 나 소 닉
아 이 와 ’’

■ SQL
• Char vs Varchar
1. Varchar(10)
43
아 메 리 카 노
카 라 멜 마 키 아 토
프 라 푸 치 노
밀 크 쉐 이 크

■ SQL
• Date VS Varchar
44
Date Column
Varchar Column

■ SQL
• Date VS Varchar
45
DATE 컬럼을 쓴 데이터 조회 : 속도 빠름
SELECT ...
FROM ...
WHERE 기준일자 BETWEEN to_date('20091020', 'yyyymmdd') an
to_date('20091021', ‘yyyymmdd)
Varchar 컬럼을 쓴 데이터 조회 : 데이터 품질 저하
SELECT ...
FROM ...
WHERE 기준일자 BETWEEN '20091020' and '20091021'

■ SQL
• 정수형 - Integer
46
INT BIGINT
4 Byte 8 Byte
- 일반적으로 Integer뒤에 나오는 숫자는 표현 자리수를 의미
- 화면상에 나타날 소숫점 자리 혹은 정수자리의 자릴수를 표시
- NUM INT(10) - 10자리 미만은 0으로 채우겠다는 의미.
Insert Into T1 values(12345) = 0000012345
- 벤더사마다 의미가 틀릴 수 있음.

■ SQL
• Group by vs Distinct
47

■ SQL
• Group by vs Distinct
48
공통의 목적 : 중복 제거
정렬의 목적 : Distinct -> 중복만 제거 정렬안됨.
Group by -> 중복제거 후 정렬된 값 도출.
속도비교 : Group by가 오라클에서는 더 빠르다고 함.
타벤더는 데이터 구성이나 방식에 따라 차이가 좀
있을 수도 있음.
결과의 목적 : Group by는 Having Count를 쓸 수 있음.

■ SQL
• 성능을 높이기 위한 팁
1. 사용자제할 Function.
- DECODE - CPU Overhead 발생. 최대한 Case문으로 변경할것.
- Or문 : Full Table Scan 가능성 높아짐. Union All 혹은 In, Exist를 사
용해서 OR 문 제거할것.
- Distinct : 정렬작업을 수반함. 불필요한 Distinct사용남발 자제
49

■ SQL
2. 인덱스 사용.
- 부정형보다 긍정형 조건을 사용. [예 ) <> 대신에 AND ]
- 가능한 PK Index 사용할것.
- 명확환 Where조건 사용. 인위적 변경은 인덱스를 타지 못하게 한다.
50

■ SQL
2. 인덱스 사용.
51
CREATE TABLE T1 (RDATE DATETIME);
CREATE INDEX IDX_RDATE ON T1(RDATE);
INSERT INTO T1 VALUES NOW();
SELECT * FROM T1 WHERE RDATE = SUBSTR(RDATE,1,8)
위의 SQL은 인덱스를 탈까요 안탈까요?
만약에 인덱스를 탄다면 정상일까요? 비정상일까요?

■ SQL
3. Data Type 일치
- Data Type이 일치하도록 한다.
- Data Type이 일치하지 않으면 Casting 연산이 추가로 들어가게 된다. 추
가 연산이 들어간다는 것은 추가적인 부하(OverHead)가 들어간다는 얘
기가 된다.
52

■ SQL
• ANSI SQL
1. ANSI SQL의 정의
- 최초의 SQL-86표준과 관계형 DBMS의 폭발적인 정성기를 주도했
던 ANSI/ISO SQL2(이하 SQL2) 세대를 지나면서 많은 기술적인 발
전
- SQL2의 경우 표준 SQL에 대한 명세가 부족한 부분이 있었고,
DBMS벤더 별로 문법이나 사용되는 용어의 차이가 너무 커져서 상
호 호환성이나 SQL학습 효율이 많이 부족한 문제가 발생
- 이에 향후 SQL에서 필요한 기능을 정리하고 호환 가능한 여러 기
준을 제정한 것이 1999년에 정해진 ANSI/SQL3(이하 SQL3)이다.
이후 가장 먼저 SQL3의 기능을 시현한 것이 Oracle 8i/9i 버전이라
할 수 있다. (현재 오라클 사의 공인 SQL교육은 ANSI 표준 SQL로
실시)
- 이 후 2003년 ANSI/ISO SQL기준이 소폭 추가 개정되었고, 현재 사
용되는 데이터베이스는 대부분 SQL-2003표준을 기준으로 하고 있
다.
53

■ SQL
• ANSI SQL
54
SELECT t1.c1, t2.c1
FROM table t1, table t2
WHERE t1.c1 = t2.c1(+)
AND t1.c2 = ‘ResNo’
AND t2.c2 = ‘TelNo’
어떤것이 Left Outer Join일까요???
그리고 어떤것이 Right Outer Join일까요??
SELECT t1.c1, t2.c1
FROM table t1, table t2
WHERE t1.c1(+) = t2.c1
AND t1.c2 = ‘ResNo’

■ SQL
• ANSI SQL
55
SELECT t1.c1, t2.c1
FROM table t1 LEFT OUTER JOIN table t2
ON t1.c1 = t2.c1
WHERE t1.c2 = ‘ResNo’
왼쪽이 Left Outer Join
오른쪽이 Right Outer Join 입니다.
SELECT t1.c1, t2.c1
FROM table t1 RIGHT OUTER JOIN table t2
ON t1.c1 = t2.c1
WHERE t1.c2 = ‘ResNo’

DBMS의 고속도로
Index

■ Index
• Index란
1. 간단히 정의
- 각 테이블들의 Row에 색인 달기
2. 고급지게 정의.
- 테이블에 저장된 데이터를 빠르게 조회하기 위한 데이터베이스 객
체
- B-Tree구조를 가짐(B-Tree Index의 경우)
- Index는 논리적/물리적으로 테이블과 독립적임
57

■ Index
• Index의 구조 – 이론.
58

■ Index
• Index와 Data의 분리
1. Data Table Space와 Index Table Space를 분리.
- 대부분의 RDBMS는 테이블을 정의할때 Data저장장소와 Index저
장장소를 명시해서 만든다.
- Index의 저장장소를 명시하지 않으면 Data저장 장소를 Index의 저
장 장소로 같이 쓰인다.
59

■ Index
• Primary Index
1. 프리머리 인덱스란?
- 테이블 내의 복수개의 tuple들 중 해당 키 값을 가지고 있는 tuple
은 오직 하나임을 나타내준다.
2. 간단히 테이블안의 특정 컬럼에는 어떤한 값도 중복되지 않
고 존재한다. 즉 유일하다.
60

■ Index
• Primary Index
1. Primary Key 생성법
61
CREATE TABLE Person(
SEQ INT AUTO_INCREMENT,
주민번호 CHAR(14),
이름 VARCHAR(15),
이메일 VARCHAR(40),
전화번호 CHAR(13)
CONSTRAINT pk_key PRIMARY KEY (SEQ))
ALTER TABLE Persons
ADD CONSTRAINT pk_seq PRIMARY KEY (SEQ)

■ Index
• Primary Index
2. Primary Key 사용 이유
- 데이터의 중복값을 허용하지 않음. - 제일 빠른 검색의 조건
- Primary Key 생성시 Primary Index 자동생성.
이로 인해 데이터 검색 속도 향상
- 테이블 관계조건을 맺는 용도로 사용.
- 데이터 통합 및 역공학시 기준점으로 사용되어 작업이 편리해짐.
62

■ Index
• Clustering Index - 정의
1. 테이블에 데이터가 Key 배열에 순서적으로 입력되어 있음.
2. SQL에서 WHERE조건을 검색할 때 클러스터링 인덱스를 최
우선으로 두고 검색을 시작함. 즉 우선순위가 높음.
3. 대용량 처리시 일반 인덱스보다 2배정도 처리 성능이 우월
함.
63

■ Index
• Clustering Index - 모습
64

■ Index
• Clustering Index
1. 생성방법
65
CREATE INDEX idx_seq_cluster ON
Person(SEQ) CLUSTER;

■ Index
• UNIQUE Index
1. Unique Index 의 특징.
- Primary Key와 마찬가지로 데이터 중복을 허용하지 않는 인덱스.
- Primary Key와의 차이는 Null값도 데이터로 보기 때문에 허용하는
것의 차이.
- 여러개 생성이 가능함.
- 그러나 분명한 차이가 있기 때문에 따로 만들어 둔것.
- Primary Key와 Unique Index 의 차이를 반드시 이해할 것.
66

■ Index
• Unique Key
1. 생성방법
67
CREATE UNIQUE INDEX idx_seq ON Person (SEQ)
CREATE UNIQUE INDEX idx_주민번호 ON Person (주
민번호)

■ Index
• Index의 Include 옵션
1. Create index 의 Include 용도
- Covering index로 사용.
- SQL의 WHERE 조건에서 평소에는 잘 사용하지 않으나 어쩌다 필
요에 의해서 사용되는 컬럼에 사용.
68

■ Index
1. 이론
- 일반적으로 복합인덱스 생성시 평소 잘 사용하지 않는 컬럼까지 복
합 인덱스로 생성시 필요이상의 인덱스 깊이가 생기게 됨.
- 이로 인해 인덱스의 깊이가 깊어지게 되고 그에 따른 추가적인 디
스크 용량이 더 필요하게 됨.
69

■ Index
1. 이론
- 평소 잘 사용되지 않는 컬럼을 Include옵션으로 빼두고 만약 필요
할시 이용함.
- 이렇게 해두면 인덱스 깊이는 크게 늘어나지 않고 인덱스 크기도
크게 되지 않게 되어 디스크 용량도 줄어들게 됨.
70

■ Index
• Index 유지보수
1. 한테이블당 인덱스 갯수
- 가능하면 5개 미만으로 유지.
2. 중복되는 인덱스를 여러개 만들지 말것.
- SEQ, 주민번호 - 인덱스 1번
- SEQ, 주민번호, 이메일 - 인덱스 2번
71

■ Index
• Index 유지보수
3. 마스터 테이블은 Clustering Index로 만들것.
- 클러스터링 비율이 1 이하이면 다시 생성.
4. 정기적으로 Table index 재생성.
- 테이블에 DML이 많이 일어나면 테이블 인덱스 효율이 떨어짐.
- 인덱스 재생성 만으로 2-10% 사이의 성능 향상을 기대해볼 수 있음
.
72

나의 전용 방
LOB

■ LOB
• LOB 컬럼의 정의.
1. 일반적으로 테이블 생성시 큰 사이즈의 컬럼 저장장소를 따
로 생성.
2. CHAR, VARCHAR, BIGINT에서 만들 수 있는 허용범위를
벗어난 경우 이곳에 저장.
74

■ LOB
• LOB 컬럼의 운용 - 일반적인 LOB방식
75
Bufferpool
Normal
Tablespace
LOB
Tablespace
Database

■ LOB
• LOB 컬럼의 운용 - 일반적인 LOB방식
76
Normal
Tablespace
LOB
Tablespace
Database
Bufferpool

■ LOB
• Inline LOB 컬럼의 문제점.
1. 메모리 낭비가 심할 수 있음.
2. Prefetcher와 IO CLEAN이 자주 일어날 수 있음.
3. 자주 사용되는 ROW가 우선순위에서 밀려날 수 있음.
4. 보통 4000Byte정도에서 사용할것을 권고합니다.
77

궁금한점은질문해주세요
강의가 끝났습니다
Keynote

개발자도 알아야 하는 DBMS튜닝

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to 개발자도 알아야 하는 DBMS튜닝

Similar to 개발자도 알아야 하는 DBMS튜닝 (20)

개발자도 알아야 하는 DBMS튜닝

Editor's Notes