1. 2018. 10. 17.
의료영상 분석 및 처리
- Introduction to Medical Image
Analysis and Processing -
이 동 헌
2.
3. (1) Dataset
v 임상데이터 (출처: 의료기관)
§ IRB (Institutional Review Board, 임상시험심사위원회)
• ‘취약한 환경에 있는 연구대상자’ : 의료계 대학 학생, 의료기관 직원, 제약회사 직원, 군인 등
§ 개인정보 보호법 (외부 반출 X)
v Open Datasets (e.g. Grand Challenges in Biomedical Image Analysis)
뉘른베르크 강령 헬싱키 선언 벨몬트 보고서
1947 1964 1979 1987 2004
의약품 임상
시험관리기준 제정
생명 윤리 및
안전에 관한 법률 제정
7. (1) Dataset Cleaning (80%)
• Raw dataset → Trainable dataset
e.g. ROI (Segment), Outlier 제거 …
(2) Class Imbalance Check
• Statistical Data Visualization
8. (3-1) Dataset Splitting
§ Train : Validation : Test (; View of Machine Learning Researcher)
= Train : Test : Extra Validation (; View of Clinician)
§ Class Imbalance 고려!
종양1 (n=600) 종양2 (n=240)
ex) Train : Validation : Test = 4 : 1 : 1
종양3 (n=240)
400 160 160 100 40 40
Train Validation Test
100 40 40
9. (3-2) Dataset Splitting
§ 전향적(Prospective Study)
ex) (‘12~18) Train : Validation : ‘(19) Test = 4 : 1 : 1
§ 후향적 연구(Retrospective Study)
ex) (1) Train : Validation : (2) Test = 4 : 1 : 1
2-1) Test 데이터셋을 임의로 분리하여 모델에 적용. (1개 set)
2-2) Test 데이터셋을 바꾸어가며 모델에 적용. (6개 set)
1-1) Train : Validation 데이터셋을 임의로 분리하여 학습. (1개 set)
1-2) Train : Validation 데이터셋을 바꾸어가며 학습. (5개 set)
• 1개의 최선의 모델
• 복수개의 모델들의 평균