SlideShare a Scribd company logo
1 of 53
빅 데이터 시스템 개발에 있어서

이미지/비디오 데이터 처리
이정헌
2
빅 데이터 시스템 일반 프로세스

3
출처 : Forbes(2012)

4
Data Scientist 가 되는 방법

5

출처 : IBM(2012)
빅 데이터의 종류

6
BigData System (ex. IBM InfoSphere Data Explorer 9.0)

7
빅 데이터의 4가지 차원 (정확성)
데이터의 정확성







8

어떤 데이터들은 본질적으로 불확실함. Ex. 인간의 감정이나 진실성, 맨해튼의 고층 건물 사이에서 일어나는 GPS센서의
반사, 날씨, 경제 요인, 그리고 미래 등. 이런 종류의 데이터들을 처리할 때는 아무리 철저한 데이터 정제를 실시해도 불확
실성을 제거할 수 없음. 불확실성에도 불구하고 이런 데이터들은 가치 있는 정보를 포함하고 있으며, 이런 불확실성을 인지
하고 수용해야 하는 것이 바로 빅 데이터 시스템이 갖추어야 하는 특징
이미지 / 비디오 데이터도 이러한 빅 데이터 시스템에서 데이터의 불확실성이 높은 대표적인 데이터임
비정형 원본 데이터의 정형화
비정형 데이터에서 정형 데이터로의 변환



이미지/비디오 원본 데이터

이미지/비디오 분석

추출 데이터

수영/연주/달리기…
철수/영희/정헌/…
남녀/20대 …

High Level

바다/들판/실내/실외 …
사람/얼굴/고양이 …
테이블/의자/비행기 …
테이블옆/의자앞 …
손/발/머리/몸통 …
눈/코/입/눈썹 …
푸른/빨간/노란계열 …
프로파일/히스토그램 …
퍼센트/채도/명도 … Low Level

※ 이미지 / 비디오는 비정형 데이터의 대표적인 데이터
기존의 정형 데이터도 시간 열과 관계성을 추가되게 되면 비정형화 되는 특징을 가짐.

9
추출 데이터의 활용 분야


추출 데이터 기반 활용 분야

추출 데이터
수영/연주/달리기…
철수/영희/정헌/…
남녀/20대 …

보안분야

High Level
마케팅분야

바다/들판/실내/실외 …
사람/얼굴/고양이 …
테이블/의자/비행기 …

교통분야

테이블옆/의자앞 …
손/발/머리/몸통 …
눈/코/입/눈썹 …
푸른/빨간/노란계열 …
프로파일/히스토그램 …
퍼센트/채도/명도 … Low Level

위성영상분야

의료분야

10
빅 데이터 활용 예시

11
이미지 마이닝 일반적인 처리과정

12
영상이해 환경 개발을 위한 문제 현안


해법 정의의 어려움



동일한 기능을 수행하는 수많은 알고리즘의 존재



알고리즘을 개발한 용도 및 동작환경 지식의 부재



알고리즘 사이의 결과를 주고 받는 표준 데이터의 부재



개발한 알고리즘을 쉽게 테스트하고 관리하기 위한 환경의 부재



알고리즘 사이의 성능을 평가하기 위한 평가 체제의 부재



해법을 객관적으로 표현하기 위한 메타데이터 표준의 부재

13
문제 해결을 위한 관련 기술 동향


IUE(Image Understanding Environement)




Khoros




http://www.onvif.org/

OpenCV




http://pascallin.ecs.soton.ac.uk/challenges/VOC/

OnVIF




http://www.amerineximaging.com/en/Products/Aphelion-Imaging-Software-Suite.html

PASCAL VOC




www.mathworks.com

KBVision




www.khoral.com/

MATLAB




DARPA 추진 (1999년)

http://opencv.org/

MTES


14

http://vision.khu.ac.kr/?mid=MTES
이미지 마이닝의 단계 1/2

15
이미지 마이닝의 단계 2/2

16
이미지 마이닝 도구의 아키텍쳐

17
이미지 기술자 중심의 프레임워크

18
기능 중심의 프레임워크

19
정보 중심의 프레임워크
Pattern and
Knowledge
Level

Information integration

Integrated
rules

Alphanumeric
pattern &
knowledge
database

Pattern & knowledge
database
Semantic concept
image retrieval
Semantic
Concept
Level

Object
Level

Image KDD module
Semantic concept
image indexing

Object/region
image retrieval

Alphanumeric KDD
module

Semantic concept
database
Feature
extraction

Alphanumeric
database

Object/region
image indexing
Object/region
database
Pixel
Level

Primitive feature
image retrieval
Image processing
(image segmentation,
object recognition)
Primitive feature
image indexing

Image database

20

User interface
(Data Visualization)

Domain
knowledge
지식 기반의 프레임워크

21
지능적인 위성영상을 위한 이미지 마이닝 시스템(Ex.)

22
상황 인식과 이해 기반 프레임워크

23
정보 융합 기반의 프레임워크

24
정보 융합 수준에서의 상황 분석

25
Visual Object Classes Challenge 2005-2012


To recognize objects from a number of visual object
classes in realistic scenes



Each person annotated has at least their head and
one other body part visible.



Person : person



head



Animal : bird, cat, cow, dog, horse, sheep



hands



Vehicle : aeroplane, bicycle, boat, bus, car,
motorbike, train



feet



Indoor : bottle, chair, dining table, potted plant, sofa,
tv/monitor

26

Mark Everingham (University of Leeds)
Luc van Gool (ETHZ, Zurich)
Chris Williams (University of Edinburgh)
John Winn (Microsoft Research Cambridge)
Andrew Zisserman (University of Oxford))
Visual Object Classes Challenge 2005-2012


The images show the annotation available, consisting of bounding box and set of actions


Jumping / Phoning / PlayingInstrument / Reading / RidingBike / RidingHorse / Running / TakingPhoto / UsingComputer /
Walking

(Visual Object Classes Challenge 2012)
27
영상분석을 위한 기초 기술 그룹

28
페이셜코딩


페이셜 코딩의 역사


사람의 표정은 타고나는 것이며, 얼굴이 감정을 타인에게 전달하는데 사용되는 중
요한 수단이라는 사실이 밝혀졌다.




7년동안 모은 얼굴 표정자료를 기초로 사람은 43개의 안면근육과 이러한 근육들
이 움직여 다양한 방식으로 조합되면 23개의 핵심 움직임 단위(Action Unit, AU)가
만들어지고, 이 움직임 단위들은 감정과 관련된 모든 표정의 가장 기본적인 요소가
된다는 것이 밝혀졌다.




캘리포니아 대학의 폴 에크먼과 의과대학의 윌리프리즌, 2003

에크먼의 FACS 시스템을 이용하여 기업의 행동에 대한 소비자와 직원들의 실제
감정 반응을 파악해주고 기업이 그에 따라 계획을 수립할 수 있게 도와주는 페이셜
코딩을 비즈니스 세계에 접목하기 시작했다.




찰스 다윈, 1872

센서리로직, 2007

페이셜 코딩의 신뢰성


“인간은 지구상의 어떤 동물보다도 많은 안면 근육을 가지고 있다. 이 사실만으로
도 얼굴은 수많은 데이터를 얻어 낼 수 있는 정보의 보고다.”




“얼굴인 신체에서 근육이 직접 피부에 붙어있는 유일한 부분이다. 이 때문에 얼굴
은 대단히 쉽게 움직이며, 피부는 두뇌에서 오는 자극에 빠르게 반응하여 자신의
모양을 바꾼다. 따라서, 얼굴은 감정을 무의식적으로 가장 잘 나타내는 창이다.”




29

애크먼과 프리즌, 2003

맥닐(McNeill), 1998

“얼굴 근육의 풍부한 움직임은 페이셜 코딩의 기본 토대이자 근거다. 두뇌가 감정
적인 자극을 발생시킬 때마다, 이 자극은 모든 안면 근육과 표정을 통제하는 안면
신경을 통해 얼굴로 전달된다.” - 댄 힐(Dan Hill), 2011
페이셜코딩 핵심감정


표정 패턴






표정은 그것이 형성되고 최고조에 이르렀다가 사라지는 형태로 존재한다. 일반적으로 표정이 지속되는 시간은 0.5초에서
4초 사이이며, 근육 움직임의 지속시간 및 유형, 강도를 모두 종합하여 특정 감정의 강도를 측정하는 기준으로 삼는다.
감정은 하나의 패턴으로 유지되지 않으며, 어떠한 이벤트에도 복합적인 감정의 흐름이 단계적 변화와 혼재되어 나타난다.

7가지 핵심감정
행복(긍정적), 놀라움(중립적), 두려움, 분노, 슬픔, 협오감, 경멸감(부정적)



동영상기반 얼굴인식 및 추적기술 필요

놀라움
눈이 커진다.
눈썹이 올라간다.
입이 벌어진다.

30

두려움
눈썹이 올라가고
미간이 좁아진다.
눈이 커진다.
턱 주변 근육이 긴
장된다.
입술이 가로 방향
으로 당겨진다.
턱이 벌어진다.

분노
눈썹 끝이 내려가
고 미간이 찌푸려
진다.
눈이 가늘어진다.
입술을 힘주어 오
므린다.

슬픔

협오감

이마 중간에 주름
이 생긴다.
눈썹의 바깥쪽은
처지고 안쪽은 약
간 올라간다.
눈가에 주름이 생
긴다.
코와 윗입술 주변
의 팔자 주름이 깊
어진다.
입술 양끝이 처지
거나, 거꾸로 된 미
소모양이 나타난
다.

코끝이 올라가고
주름이 생긴다.
윗입술이 올라가
고 떄로 거꾸로 된
미소모양이 약간
나타난다.
아랫입술이 처진
다.

경멸감
입의 한쪽끝이 올
라가면서 비웃는
듯한 분위기와 함
께 얼굴의 반쪽만
표정이 바뀐다.
윗입술이 올라간
다.
눈이 약간 감기거
나 시선을 돌리기
도 한다.

행복(진짜미소)
눈 바깥쪽 피부에
새발 모양의 주름
이 생긴다.
눈꺼풀의 긴장이
풀어지면서 약간
처지고, 눈아래 피
부가 위쪽으로 당
겨진다.
입꼬리가 크게 올
라가고 빰도 위쪽
으로 당겨진다.

행복(사회적미소)
입꼬리와 뺨의 근
육이 올라가면서
얼굴이 전체적으
로 동그래진다.
반면 눈가 근육은
움직이지 않고 눈
동자에도 밝은 기
운이 감돌지 않는
다.
페이셜코딩 감정의 다양성


7가지 핵심감정(기본감정)이 결합되면 24개의 2차 감정이 생성된다.


내향적 감정





해당 감정을 느끼는 사람에 의해서 유발되는 감정 또는 내면으로 향하는 감정을 말한다.
일반적으로 이러한 감정은 자존심과 관련되거나, 또는 우리가 갖는 기대치를 토대로 상황변화에 대한 우리의 감정을 내면화
하는 방식과 관련된다.

외향정 감정



31

외부 요인에 의해 유발되거나 또는 감정의 에너지나 그것이 일으키는 행동이 자신이 아닌 다른 누군가를 향한다.
자신의 상태 및 위치에 대한 관심, 다른 사람들의 상황이나 행운등(특히 그것이 우리의 목표실현과 관련되어 있는 경우)이
외향적인 감정을 일으키는 경향이 있다.
페이셜코딩 응용


페이셜 코딩 데이터를 분석하는데 가장 중요한 데이
터는 청중이 주의를 기울이느냐의 여부이다. 그 이유
는 상업적인 측면에서 사용자들에게 감정적 반응을
유발함으로써 주의를 일깨우지 않는다면 소비자들을
설득할 수 없기 때문이다.



특정 자극에 반응할 때, „그리고/또는‟ 질문에 답변할
때 최소한 한가지 이상의 AU나 정확한 감정을 얼굴에
나타낸 참가자들의 퍼센티지를 조사함으로써 감정적
반응도를 파악한다.



사람들이 감정적으로 반응하는지 여부를 알아냈다면,
그 다음엔 반응의 종류를 파악해야 한다. 페이셜 코딩
을 이용해 기업은 긍정반응이 우세한지 부정 반응이
우세한지 판별할 수 있게 된다.



사람들이 자극에 대한 정확한 반응을 나타내지 못하
는 경우도 많기 때문에 페이셜 코딩과 함께 안구 운동
추적 방법을 병행 사용한다. 안구 운동 추적 방법은
사람들이 보고 있는 지점, 그들이 집중하는 지점을 알
아내 기록하는 것을 말한다. 감정 반응과 시각적 집
중을 동시에 파악하는 것은 사람들의 반응을 유발하
는 요인을 이해하기 위해 효과적인 방법이다.

32
얼굴검출 기술동향


얼굴 검출 기술은 얼굴인식 이전에 실행되
어야 하는 과정으로 영상에서 얼굴이 있는
곳을 찾아내는 기술이다. 일반적으로 사람
의 얼굴은 조명, 사람의 얼굴이 응시하는 방
향과 각도, 표정, 카메라와 사람 간 거리에
따른 얼굴의 크기, 배경과 얼굴의 색상 차이
등과 같이 환경적인 조건에 따라 민감한 반
응을 하기 때문에, 영상으로부터의 얼굴 검
출 및 얼굴 인식에 관한 연구는 실제 많은 어
려움을 포함하고 있다.

얼굴검출

지식기반

특징기반

규칙기반

템플릿매칭기반

외형기반

얼굴특징

사전정의 얼굴템플릿

Eigenface

텍스쳐

변형하는 템플릿

분산기반

피부색

Neural Network

다양한 얼굴특징

SVM(Support Vector
Machines)

Naïve Bayes
Classifier

Hidden Markov
Model

InformationTheoretical Approach

33
얼굴추적 및 특징추출 기술동향


얼굴영역이 검출되면 검출된 영역을 추적하면서 얼굴인식에 사용
할 특징값들을 추출하는 과정이 진행된다. 이과정에서 사용하는
알고리즘에 따라 뒤에 얼굴인식 알고리즘에 영향을 미치게 되며,
특징값을 선택하는 알고리즘의 종류들도 바뀌게 된다.

얼굴검출 및 추적 과정

특징값 추출 과정

34
얼굴특징 추출 및 특징선택 기술 동향


특징값 선택 과정

35

얼굴인식에 사용되는 가장 작은 단위
의 분류에 오류를 일으킬 수 있는 영향
을 줄 수 있는 특징 값중에서 부분세트
를 선택하는 것이 목적으로 사용되는
것이 바로 특징값 선택과정이다.
얼굴인식 기술동향


얼굴인식 기술은 크게 3가지 유형으로 분류 할 수 있으며, 하이브리드 방법을 이용한 연구들이 많이 진행되고 있다.
하이브리드 방법에서는 위치 특성과 더불어 하나의 얼굴을 인식하기 위하여 얼굴 전체 영역을 사용하기 때문에 매우
복잡하지만 인식률은 전체론적인 매칭 방법과 특징 기반의 매칭 방법들에 비하여 월등히 우수하다.

얼굴인식

전체론적 방법

특징기반 방법

하이브리드 방법

PCA(Eigenface)

Pure Geometry
Methods

LFA

LDA(Fisherface)

Dynamic Link
Architecture

ShapeNormalized

ICA

Hidden Markov
Model

Componentbased

PCA기반 얼굴학습 단계

Tensorfaces

PDBNN

36

PCA기반 얼굴인식 단계
얼굴인식 기술동향 (주요기술)


기하학적 방법





특징 : 얼굴의 기하학적 특징점을 추출하여 일치여부를 판단하여 인식
성능 : 얼굴은 3차원이고 회전이 가능하기 때문에 적용에 한계가 있다.

Eigenfaces





특징 : 특징점 추출로 PCA(Principal Component Analysis)를 적용하고 유사도 측정으로 Euclidean 거리 적용.
성능 : 조명이나 환경변화에 민감하게 반응하지만 널리 사용되고 있어 그 성능이 검증된 대표적인 얼굴인식 방법.

Fisherfaces





특징 : FLD(Fisher Linear Discriminant) 분류 알고리즘으로 적용한 얼굴인식 방법.
성능 : 사람 개개인의 특성을 학습함으로써 보다 정확하고 환경변화에 둔감한 특성을 지니고 있어 on-line 상태에서 실시간
으로 적용 가능한 알고리즘.

SVM( Support Vector Machine)에 기초한 방법





특징 : PCA와 SVM(Support Vector Machine)알고리즘을 사용한 알고리즘.
성능 : 비교적 높은 인식률을 높이지만 얼굴인식과 같은 멀티 클래스에 적용하기에는 시간과 메모리가 많이 소모되는 알고
리즘이지만 현재 연구되는 얼굴인식 알고리즘의 대표적인 알고리즘임

신경회로망





특징 : 흑백의 정지영상에서 슬라이딩 윈도우를 이용해 학습된 얼굴모양을 검색
성능 : 두 개 이상의 다수 얼굴의 추출도 가능하나 속도가 느리며 학습이 어려움.

퍼지 + 신경회로망





특징 : 신경회로망회로의 입력으로 픽셀의 밝기 값 대신 퍼지 소속함수를 사용
성능 : 신경회로망만을 이용한 방법보다 성능은 향상되나 처리속도는 떨어짐.

Wavelet + Elastic Matching


특징 : 주파수 변환을 사용하며, 자세 및 표정의 변화를 처리하는데 효과적.



성능 : 인식률에 비해서 연산량이 많음.

37
얼굴인식 성능평가 기술 동향


성능평가 기준



성능평가에 사용하는 얼굴DB





FERET Protocol



Error rate



XM2VTS Protocol



Computational speed.





Hit ratio

Memory usage.

성능에 영향을 주는 중요요인


Illumination / occlusion / expression /
pose invariability



Scalability.



Adaptability (to variable input image
formats, sizes, etc.)



ˆ Automatism (unsupervised processes)



Portability.

• 실제 응용에 있어서는 인식율을
좌우하는 측면에서 DB의 내용이
매우 중요하며 대부분의 상용솔루
션들의 자체 DB를 확보하고 있음

38
얼굴인식 문제 및 해법연구 동향
문제 vs 해법연구

Illumination

Pose

Occlusion

Heuristic approach

Single-model
based approaches

Light-modeling app
roach

Expression

Multi-image based
approaches

Statistical approac
h

Optical technology

Geometric
approaches

Model-based appro
ach

Multi-spectral imagi
ng approach

39

조명의 차이로 인한 분류 클래스의 변위
시선 추적 응용

40
시선 추적 응용

41
비디오 분석의 차별점 (Scene/Shot 방식)

42
비디오 분석의 차별점 (Summarization 방식)

43
지능형 영상 보안 기본 모델

44
CCTV 영상의 종류

45
고객 성향 분석 응용(Ex.)

46
교통사고 관리 응용 (1/2)

47
교통사고 관리 응용 (2/2)

48
자가-성장형 프레임워크

49
상황인지 기반 지능형 자동 선택 필터 (ex. MTES)

50
지식 기반 알고리즘 자동 조합 예시
A

B
#10

#6

#11

#9

#5

#10

#15

#20

#15
C

#9

(# : 알고리즘 데이터베이스 시스템 내부의 알고리즘 관리 인덱스)
: 중앙의 알고리즘의 전/후 관계에 사용될 수 있는 지식 정보
(a) 각 중앙의 알고리즘 정보로부터 생성된 전/후 알고리즘의 정보

B

#6

#11
A

#10

#5

C

#15

#20

#9

(b) (a)의 각 알고리즘의 전후 관계를 합쳐서 만든 전체 알고리즘의 관계

51
빅데이터 분석에 실패하는 6가지 습관 (HBR)

경험에 따른 직관을 믿어라

완벽한 결정을 내릴 수 있도록 끊임 없이
정보를 모아라

52

결론을 내 놓고 데이터를 분석해라

모두가 같은 의견을 내는 것을 믿어라

출처 : Harvard Business Review(2012)

다른 것들을 예측하라

스스로 데이터 품질을 검증할 수 있다고
자만하라
감사합니다.

53

More Related Content

What's hot

인공지능개론 (머신러닝 중심)
인공지능개론 (머신러닝 중심)인공지능개론 (머신러닝 중심)
인공지능개론 (머신러닝 중심)SK(주) C&C - 강병호
 
Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Donghan Kim
 
관제, IoT/Wearable에서 주목할 정보행동
관제, IoT/Wearable에서 주목할 정보행동관제, IoT/Wearable에서 주목할 정보행동
관제, IoT/Wearable에서 주목할 정보행동Seoul National University
 
GTCx 2016 C.SIDE Korea
GTCx 2016 C.SIDE KoreaGTCx 2016 C.SIDE Korea
GTCx 2016 C.SIDE KoreaKyungho Kim
 
인공지능: 변화와 능력개발
인공지능: 변화와 능력개발인공지능: 변화와 능력개발
인공지능: 변화와 능력개발Taegyun Jeon
 
머신러닝 간단 뽀개기
머신러닝 간단 뽀개기머신러닝 간단 뽀개기
머신러닝 간단 뽀개기Heejae Jeong
 
사용자경험(UX)기반 U-헬스케어 서비스
사용자경험(UX)기반 U-헬스케어 서비스사용자경험(UX)기반 U-헬스케어 서비스
사용자경험(UX)기반 U-헬스케어 서비스재용 신
 
라이트브레인 UX 아카데미 2기 오픈 프로젝트 - 스마트태그(2)
라이트브레인 UX 아카데미 2기 오픈 프로젝트 -  스마트태그(2)  라이트브레인 UX 아카데미 2기 오픈 프로젝트 -  스마트태그(2)
라이트브레인 UX 아카데미 2기 오픈 프로젝트 - 스마트태그(2) RightBrain inc.
 
머신러닝(딥러닝 요약)
머신러닝(딥러닝 요약)머신러닝(딥러닝 요약)
머신러닝(딥러닝 요약)Byung-han Lee
 

What's hot (9)

인공지능개론 (머신러닝 중심)
인공지능개론 (머신러닝 중심)인공지능개론 (머신러닝 중심)
인공지능개론 (머신러닝 중심)
 
Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1Ai(인공지능) & ML(머신러닝) 101 Part1
Ai(인공지능) & ML(머신러닝) 101 Part1
 
관제, IoT/Wearable에서 주목할 정보행동
관제, IoT/Wearable에서 주목할 정보행동관제, IoT/Wearable에서 주목할 정보행동
관제, IoT/Wearable에서 주목할 정보행동
 
GTCx 2016 C.SIDE Korea
GTCx 2016 C.SIDE KoreaGTCx 2016 C.SIDE Korea
GTCx 2016 C.SIDE Korea
 
인공지능: 변화와 능력개발
인공지능: 변화와 능력개발인공지능: 변화와 능력개발
인공지능: 변화와 능력개발
 
머신러닝 간단 뽀개기
머신러닝 간단 뽀개기머신러닝 간단 뽀개기
머신러닝 간단 뽀개기
 
사용자경험(UX)기반 U-헬스케어 서비스
사용자경험(UX)기반 U-헬스케어 서비스사용자경험(UX)기반 U-헬스케어 서비스
사용자경험(UX)기반 U-헬스케어 서비스
 
라이트브레인 UX 아카데미 2기 오픈 프로젝트 - 스마트태그(2)
라이트브레인 UX 아카데미 2기 오픈 프로젝트 -  스마트태그(2)  라이트브레인 UX 아카데미 2기 오픈 프로젝트 -  스마트태그(2)
라이트브레인 UX 아카데미 2기 오픈 프로젝트 - 스마트태그(2)
 
머신러닝(딥러닝 요약)
머신러닝(딥러닝 요약)머신러닝(딥러닝 요약)
머신러닝(딥러닝 요약)
 

Similar to 이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항

빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1
빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1
빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1JeongHeon Lee
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료Park Sungpil
 
소프트웨어설계론
소프트웨어설계론소프트웨어설계론
소프트웨어설계론JeongDong Kim
 
AI 파이프라인과 실전 테스팅 전략
AI 파이프라인과 실전 테스팅 전략AI 파이프라인과 실전 테스팅 전략
AI 파이프라인과 실전 테스팅 전략IMQA
 
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래Taehoon Ko
 
드라마 감성분석을 위한 표정인식
드라마 감성분석을 위한 표정인식 드라마 감성분석을 위한 표정인식
드라마 감성분석을 위한 표정인식 cyberemotion
 
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)NAVER D2
 
Visualizing Computer-Based Activity on Ambient Displays to Reduce Sedentary ...
Visualizing Computer-Based Activity on Ambient Displays  to Reduce Sedentary ...Visualizing Computer-Based Activity on Ambient Displays  to Reduce Sedentary ...
Visualizing Computer-Based Activity on Ambient Displays to Reduce Sedentary ...SodamKim14
 
Searching for magic formula by deep learning
Searching for magic formula by deep learningSearching for magic formula by deep learning
Searching for magic formula by deep learningJames Ahn
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Jiun Bae
 
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저BESPIN GLOBAL
 
Sqlp 스터디
Sqlp 스터디Sqlp 스터디
Sqlp 스터디lee4339
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindDataya Nolja
 
Vip detection sensor
Vip detection sensorVip detection sensor
Vip detection sensorchs71
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰JeongHeon Lee
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
Sumi Kim
 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스Ji Lee
 

Similar to 이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항 (20)

빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1
빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1
빅데이터 처리에 있어서 이미지/비디오 데이터의 분석 ver.1.1
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료
 
소프트웨어설계론
소프트웨어설계론소프트웨어설계론
소프트웨어설계론
 
AI 파이프라인과 실전 테스팅 전략
AI 파이프라인과 실전 테스팅 전략AI 파이프라인과 실전 테스팅 전략
AI 파이프라인과 실전 테스팅 전략
 
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
 
드라마 감성분석을 위한 표정인식
드라마 감성분석을 위한 표정인식 드라마 감성분석을 위한 표정인식
드라마 감성분석을 위한 표정인식
 
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
 
Visualizing Computer-Based Activity on Ambient Displays to Reduce Sedentary ...
Visualizing Computer-Based Activity on Ambient Displays  to Reduce Sedentary ...Visualizing Computer-Based Activity on Ambient Displays  to Reduce Sedentary ...
Visualizing Computer-Based Activity on Ambient Displays to Reduce Sedentary ...
 
Searching for magic formula by deep learning
Searching for magic formula by deep learningSearching for magic formula by deep learning
Searching for magic formula by deep learning
 
Memento
MementoMemento
Memento
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보
 
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저
Session 4. 쉽게 보는 딥러닝 트랜드와 AWS 활용 시나리오 - 베스핀글로벌 이승규 매니저
 
Sqlp 스터디
Sqlp 스터디Sqlp 스터디
Sqlp 스터디
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in Mind
 
Vip detection sensor
Vip detection sensorVip detection sensor
Vip detection sensor
 
Research
ResearchResearch
Research
 
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
 

More from JeongHeon Lee

2020년 중소벤처기업부 R&D 지원체계 개편안
2020년 중소벤처기업부 R&D 지원체계 개편안2020년 중소벤처기업부 R&D 지원체계 개편안
2020년 중소벤처기업부 R&D 지원체계 개편안JeongHeon Lee
 
[이정헌] 기업가정신교육 - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?
[이정헌] 기업가정신교육  - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?[이정헌] 기업가정신교육  - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?
[이정헌] 기업가정신교육 - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?JeongHeon Lee
 
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WDJeongHeon Lee
 
웨어러블 디바이스와 다가오는 미래
웨어러블 디바이스와 다가오는 미래웨어러블 디바이스와 다가오는 미래
웨어러블 디바이스와 다가오는 미래JeongHeon Lee
 
Life Innovation-Ware (라이프 이노베이션웨어)
Life Innovation-Ware (라이프 이노베이션웨어)Life Innovation-Ware (라이프 이노베이션웨어)
Life Innovation-Ware (라이프 이노베이션웨어)JeongHeon Lee
 
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’JeongHeon Lee
 
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛JeongHeon Lee
 
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라JeongHeon Lee
 
비즈니스모델 수립 및 수정
비즈니스모델 수립 및 수정비즈니스모델 수립 및 수정
비즈니스모델 수립 및 수정JeongHeon Lee
 
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망JeongHeon Lee
 
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스JeongHeon Lee
 
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)JeongHeon Lee
 
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)JeongHeon Lee
 
스마트 UI/UX 기술 및 산업 동향
스마트 UI/UX 기술 및 산업 동향스마트 UI/UX 기술 및 산업 동향
스마트 UI/UX 기술 및 산업 동향JeongHeon Lee
 
차세대 UX/UI 기술 및 산업동향
차세대 UX/UI 기술 및 산업동향차세대 UX/UI 기술 및 산업동향
차세대 UX/UI 기술 및 산업동향JeongHeon Lee
 
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)JeongHeon Lee
 
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]JeongHeon Lee
 
스마트공공서비스 상호호환규격수립
스마트공공서비스 상호호환규격수립스마트공공서비스 상호호환규격수립
스마트공공서비스 상호호환규격수립JeongHeon Lee
 
공공서비스을 위한 N-스크린 상호연동규격
공공서비스을 위한 N-스크린 상호연동규격공공서비스을 위한 N-스크린 상호연동규격
공공서비스을 위한 N-스크린 상호연동규격JeongHeon Lee
 

More from JeongHeon Lee (20)

2020년 중소벤처기업부 R&D 지원체계 개편안
2020년 중소벤처기업부 R&D 지원체계 개편안2020년 중소벤처기업부 R&D 지원체계 개편안
2020년 중소벤처기업부 R&D 지원체계 개편안
 
[이정헌] 기업가정신교육 - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?
[이정헌] 기업가정신교육  - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?[이정헌] 기업가정신교육  - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?
[이정헌] 기업가정신교육 - 하이컨셉 시대, 우리는 무엇을 준비해야 하는가 ?
 
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD
내츄럴 사용자 인터페이스와 웨어러블 디바이스 - 하이컨셉 NUI / 하이터치 WD
 
웨어러블 디바이스와 다가오는 미래
웨어러블 디바이스와 다가오는 미래웨어러블 디바이스와 다가오는 미래
웨어러블 디바이스와 다가오는 미래
 
Life Innovation-Ware (라이프 이노베이션웨어)
Life Innovation-Ware (라이프 이노베이션웨어)Life Innovation-Ware (라이프 이노베이션웨어)
Life Innovation-Ware (라이프 이노베이션웨어)
 
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’
개발자가 성공하기 위해 가져야 할 7가지 ‘ㄲ’
 
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛
제19회 정보통신응용기술워크숍(ICAT 2014) 리플렛
 
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라
BM 발굴 프로젝트 - [제1편] 없던 것을 찾아라
 
비즈니스모델 수립 및 수정
비즈니스모델 수립 및 수정비즈니스모델 수립 및 수정
비즈니스모델 수립 및 수정
 
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망
NUI / 웨어러블 디바이스 / 소환현실의 기술동향 및 전망
 
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스
[성균관대 특강] 웨어러블 디바이스와 내츄럴 사용자 인터페이스
 
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)
웨어러블 디바이스와 내츄럴 사용자 인터페이스(Wearable Device and Natural User Interface)
 
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)
BM 발굴 프로젝트 - 비즈니스 모델편(개인 비즈니스 모델 포함)
 
스마트 UI/UX 기술 및 산업 동향
스마트 UI/UX 기술 및 산업 동향스마트 UI/UX 기술 및 산업 동향
스마트 UI/UX 기술 및 산업 동향
 
차세대 UX/UI 기술 및 산업동향
차세대 UX/UI 기술 및 산업동향차세대 UX/UI 기술 및 산업동향
차세대 UX/UI 기술 및 산업동향
 
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)
HTML5 기반 다매체 연동형 서비스 발전 방향(티비스톰 정운교 이사)
 
NUI와 Kinect
NUI와 KinectNUI와 Kinect
NUI와 Kinect
 
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]
왜 그녀는 다리를 꼬았을까[NUI기반 감성인식 기술동향]
 
스마트공공서비스 상호호환규격수립
스마트공공서비스 상호호환규격수립스마트공공서비스 상호호환규격수립
스마트공공서비스 상호호환규격수립
 
공공서비스을 위한 N-스크린 상호연동규격
공공서비스을 위한 N-스크린 상호연동규격공공서비스을 위한 N-스크린 상호연동규격
공공서비스을 위한 N-스크린 상호연동규격
 

이미지(비디오)를 대상으로 한 빅 데이터 시스템 기술 동향 및 고려사항

  • 1. 빅 데이터 시스템 개발에 있어서 이미지/비디오 데이터 처리 이정헌
  • 2. 2
  • 3. 빅 데이터 시스템 일반 프로세스 3
  • 5. Data Scientist 가 되는 방법 5 출처 : IBM(2012)
  • 7. BigData System (ex. IBM InfoSphere Data Explorer 9.0) 7
  • 8. 빅 데이터의 4가지 차원 (정확성) 데이터의 정확성    8 어떤 데이터들은 본질적으로 불확실함. Ex. 인간의 감정이나 진실성, 맨해튼의 고층 건물 사이에서 일어나는 GPS센서의 반사, 날씨, 경제 요인, 그리고 미래 등. 이런 종류의 데이터들을 처리할 때는 아무리 철저한 데이터 정제를 실시해도 불확 실성을 제거할 수 없음. 불확실성에도 불구하고 이런 데이터들은 가치 있는 정보를 포함하고 있으며, 이런 불확실성을 인지 하고 수용해야 하는 것이 바로 빅 데이터 시스템이 갖추어야 하는 특징 이미지 / 비디오 데이터도 이러한 빅 데이터 시스템에서 데이터의 불확실성이 높은 대표적인 데이터임
  • 9. 비정형 원본 데이터의 정형화 비정형 데이터에서 정형 데이터로의 변환  이미지/비디오 원본 데이터 이미지/비디오 분석 추출 데이터 수영/연주/달리기… 철수/영희/정헌/… 남녀/20대 … High Level 바다/들판/실내/실외 … 사람/얼굴/고양이 … 테이블/의자/비행기 … 테이블옆/의자앞 … 손/발/머리/몸통 … 눈/코/입/눈썹 … 푸른/빨간/노란계열 … 프로파일/히스토그램 … 퍼센트/채도/명도 … Low Level ※ 이미지 / 비디오는 비정형 데이터의 대표적인 데이터 기존의 정형 데이터도 시간 열과 관계성을 추가되게 되면 비정형화 되는 특징을 가짐. 9
  • 10. 추출 데이터의 활용 분야  추출 데이터 기반 활용 분야 추출 데이터 수영/연주/달리기… 철수/영희/정헌/… 남녀/20대 … 보안분야 High Level 마케팅분야 바다/들판/실내/실외 … 사람/얼굴/고양이 … 테이블/의자/비행기 … 교통분야 테이블옆/의자앞 … 손/발/머리/몸통 … 눈/코/입/눈썹 … 푸른/빨간/노란계열 … 프로파일/히스토그램 … 퍼센트/채도/명도 … Low Level 위성영상분야 의료분야 10
  • 11. 빅 데이터 활용 예시 11
  • 13. 영상이해 환경 개발을 위한 문제 현안  해법 정의의 어려움  동일한 기능을 수행하는 수많은 알고리즘의 존재  알고리즘을 개발한 용도 및 동작환경 지식의 부재  알고리즘 사이의 결과를 주고 받는 표준 데이터의 부재  개발한 알고리즘을 쉽게 테스트하고 관리하기 위한 환경의 부재  알고리즘 사이의 성능을 평가하기 위한 평가 체제의 부재  해법을 객관적으로 표현하기 위한 메타데이터 표준의 부재 13
  • 14. 문제 해결을 위한 관련 기술 동향  IUE(Image Understanding Environement)   Khoros   http://www.onvif.org/ OpenCV   http://pascallin.ecs.soton.ac.uk/challenges/VOC/ OnVIF   http://www.amerineximaging.com/en/Products/Aphelion-Imaging-Software-Suite.html PASCAL VOC   www.mathworks.com KBVision   www.khoral.com/ MATLAB   DARPA 추진 (1999년) http://opencv.org/ MTES  14 http://vision.khu.ac.kr/?mid=MTES
  • 17. 이미지 마이닝 도구의 아키텍쳐 17
  • 18. 이미지 기술자 중심의 프레임워크 18
  • 20. 정보 중심의 프레임워크 Pattern and Knowledge Level Information integration Integrated rules Alphanumeric pattern & knowledge database Pattern & knowledge database Semantic concept image retrieval Semantic Concept Level Object Level Image KDD module Semantic concept image indexing Object/region image retrieval Alphanumeric KDD module Semantic concept database Feature extraction Alphanumeric database Object/region image indexing Object/region database Pixel Level Primitive feature image retrieval Image processing (image segmentation, object recognition) Primitive feature image indexing Image database 20 User interface (Data Visualization) Domain knowledge
  • 22. 지능적인 위성영상을 위한 이미지 마이닝 시스템(Ex.) 22
  • 23. 상황 인식과 이해 기반 프레임워크 23
  • 24. 정보 융합 기반의 프레임워크 24
  • 25. 정보 융합 수준에서의 상황 분석 25
  • 26. Visual Object Classes Challenge 2005-2012  To recognize objects from a number of visual object classes in realistic scenes  Each person annotated has at least their head and one other body part visible.  Person : person  head  Animal : bird, cat, cow, dog, horse, sheep  hands  Vehicle : aeroplane, bicycle, boat, bus, car, motorbike, train  feet  Indoor : bottle, chair, dining table, potted plant, sofa, tv/monitor 26 Mark Everingham (University of Leeds) Luc van Gool (ETHZ, Zurich) Chris Williams (University of Edinburgh) John Winn (Microsoft Research Cambridge) Andrew Zisserman (University of Oxford))
  • 27. Visual Object Classes Challenge 2005-2012  The images show the annotation available, consisting of bounding box and set of actions  Jumping / Phoning / PlayingInstrument / Reading / RidingBike / RidingHorse / Running / TakingPhoto / UsingComputer / Walking (Visual Object Classes Challenge 2012) 27
  • 28. 영상분석을 위한 기초 기술 그룹 28
  • 29. 페이셜코딩  페이셜 코딩의 역사  사람의 표정은 타고나는 것이며, 얼굴이 감정을 타인에게 전달하는데 사용되는 중 요한 수단이라는 사실이 밝혀졌다.   7년동안 모은 얼굴 표정자료를 기초로 사람은 43개의 안면근육과 이러한 근육들 이 움직여 다양한 방식으로 조합되면 23개의 핵심 움직임 단위(Action Unit, AU)가 만들어지고, 이 움직임 단위들은 감정과 관련된 모든 표정의 가장 기본적인 요소가 된다는 것이 밝혀졌다.   캘리포니아 대학의 폴 에크먼과 의과대학의 윌리프리즌, 2003 에크먼의 FACS 시스템을 이용하여 기업의 행동에 대한 소비자와 직원들의 실제 감정 반응을 파악해주고 기업이 그에 따라 계획을 수립할 수 있게 도와주는 페이셜 코딩을 비즈니스 세계에 접목하기 시작했다.   찰스 다윈, 1872 센서리로직, 2007 페이셜 코딩의 신뢰성  “인간은 지구상의 어떤 동물보다도 많은 안면 근육을 가지고 있다. 이 사실만으로 도 얼굴은 수많은 데이터를 얻어 낼 수 있는 정보의 보고다.”   “얼굴인 신체에서 근육이 직접 피부에 붙어있는 유일한 부분이다. 이 때문에 얼굴 은 대단히 쉽게 움직이며, 피부는 두뇌에서 오는 자극에 빠르게 반응하여 자신의 모양을 바꾼다. 따라서, 얼굴은 감정을 무의식적으로 가장 잘 나타내는 창이다.”   29 애크먼과 프리즌, 2003 맥닐(McNeill), 1998 “얼굴 근육의 풍부한 움직임은 페이셜 코딩의 기본 토대이자 근거다. 두뇌가 감정 적인 자극을 발생시킬 때마다, 이 자극은 모든 안면 근육과 표정을 통제하는 안면 신경을 통해 얼굴로 전달된다.” - 댄 힐(Dan Hill), 2011
  • 30. 페이셜코딩 핵심감정  표정 패턴    표정은 그것이 형성되고 최고조에 이르렀다가 사라지는 형태로 존재한다. 일반적으로 표정이 지속되는 시간은 0.5초에서 4초 사이이며, 근육 움직임의 지속시간 및 유형, 강도를 모두 종합하여 특정 감정의 강도를 측정하는 기준으로 삼는다. 감정은 하나의 패턴으로 유지되지 않으며, 어떠한 이벤트에도 복합적인 감정의 흐름이 단계적 변화와 혼재되어 나타난다. 7가지 핵심감정 행복(긍정적), 놀라움(중립적), 두려움, 분노, 슬픔, 협오감, 경멸감(부정적)  동영상기반 얼굴인식 및 추적기술 필요 놀라움 눈이 커진다. 눈썹이 올라간다. 입이 벌어진다. 30 두려움 눈썹이 올라가고 미간이 좁아진다. 눈이 커진다. 턱 주변 근육이 긴 장된다. 입술이 가로 방향 으로 당겨진다. 턱이 벌어진다. 분노 눈썹 끝이 내려가 고 미간이 찌푸려 진다. 눈이 가늘어진다. 입술을 힘주어 오 므린다. 슬픔 협오감 이마 중간에 주름 이 생긴다. 눈썹의 바깥쪽은 처지고 안쪽은 약 간 올라간다. 눈가에 주름이 생 긴다. 코와 윗입술 주변 의 팔자 주름이 깊 어진다. 입술 양끝이 처지 거나, 거꾸로 된 미 소모양이 나타난 다. 코끝이 올라가고 주름이 생긴다. 윗입술이 올라가 고 떄로 거꾸로 된 미소모양이 약간 나타난다. 아랫입술이 처진 다. 경멸감 입의 한쪽끝이 올 라가면서 비웃는 듯한 분위기와 함 께 얼굴의 반쪽만 표정이 바뀐다. 윗입술이 올라간 다. 눈이 약간 감기거 나 시선을 돌리기 도 한다. 행복(진짜미소) 눈 바깥쪽 피부에 새발 모양의 주름 이 생긴다. 눈꺼풀의 긴장이 풀어지면서 약간 처지고, 눈아래 피 부가 위쪽으로 당 겨진다. 입꼬리가 크게 올 라가고 빰도 위쪽 으로 당겨진다. 행복(사회적미소) 입꼬리와 뺨의 근 육이 올라가면서 얼굴이 전체적으 로 동그래진다. 반면 눈가 근육은 움직이지 않고 눈 동자에도 밝은 기 운이 감돌지 않는 다.
  • 31. 페이셜코딩 감정의 다양성  7가지 핵심감정(기본감정)이 결합되면 24개의 2차 감정이 생성된다.  내향적 감정    해당 감정을 느끼는 사람에 의해서 유발되는 감정 또는 내면으로 향하는 감정을 말한다. 일반적으로 이러한 감정은 자존심과 관련되거나, 또는 우리가 갖는 기대치를 토대로 상황변화에 대한 우리의 감정을 내면화 하는 방식과 관련된다. 외향정 감정   31 외부 요인에 의해 유발되거나 또는 감정의 에너지나 그것이 일으키는 행동이 자신이 아닌 다른 누군가를 향한다. 자신의 상태 및 위치에 대한 관심, 다른 사람들의 상황이나 행운등(특히 그것이 우리의 목표실현과 관련되어 있는 경우)이 외향적인 감정을 일으키는 경향이 있다.
  • 32. 페이셜코딩 응용  페이셜 코딩 데이터를 분석하는데 가장 중요한 데이 터는 청중이 주의를 기울이느냐의 여부이다. 그 이유 는 상업적인 측면에서 사용자들에게 감정적 반응을 유발함으로써 주의를 일깨우지 않는다면 소비자들을 설득할 수 없기 때문이다.  특정 자극에 반응할 때, „그리고/또는‟ 질문에 답변할 때 최소한 한가지 이상의 AU나 정확한 감정을 얼굴에 나타낸 참가자들의 퍼센티지를 조사함으로써 감정적 반응도를 파악한다.  사람들이 감정적으로 반응하는지 여부를 알아냈다면, 그 다음엔 반응의 종류를 파악해야 한다. 페이셜 코딩 을 이용해 기업은 긍정반응이 우세한지 부정 반응이 우세한지 판별할 수 있게 된다.  사람들이 자극에 대한 정확한 반응을 나타내지 못하 는 경우도 많기 때문에 페이셜 코딩과 함께 안구 운동 추적 방법을 병행 사용한다. 안구 운동 추적 방법은 사람들이 보고 있는 지점, 그들이 집중하는 지점을 알 아내 기록하는 것을 말한다. 감정 반응과 시각적 집 중을 동시에 파악하는 것은 사람들의 반응을 유발하 는 요인을 이해하기 위해 효과적인 방법이다. 32
  • 33. 얼굴검출 기술동향  얼굴 검출 기술은 얼굴인식 이전에 실행되 어야 하는 과정으로 영상에서 얼굴이 있는 곳을 찾아내는 기술이다. 일반적으로 사람 의 얼굴은 조명, 사람의 얼굴이 응시하는 방 향과 각도, 표정, 카메라와 사람 간 거리에 따른 얼굴의 크기, 배경과 얼굴의 색상 차이 등과 같이 환경적인 조건에 따라 민감한 반 응을 하기 때문에, 영상으로부터의 얼굴 검 출 및 얼굴 인식에 관한 연구는 실제 많은 어 려움을 포함하고 있다. 얼굴검출 지식기반 특징기반 규칙기반 템플릿매칭기반 외형기반 얼굴특징 사전정의 얼굴템플릿 Eigenface 텍스쳐 변형하는 템플릿 분산기반 피부색 Neural Network 다양한 얼굴특징 SVM(Support Vector Machines) Naïve Bayes Classifier Hidden Markov Model InformationTheoretical Approach 33
  • 34. 얼굴추적 및 특징추출 기술동향  얼굴영역이 검출되면 검출된 영역을 추적하면서 얼굴인식에 사용 할 특징값들을 추출하는 과정이 진행된다. 이과정에서 사용하는 알고리즘에 따라 뒤에 얼굴인식 알고리즘에 영향을 미치게 되며, 특징값을 선택하는 알고리즘의 종류들도 바뀌게 된다. 얼굴검출 및 추적 과정 특징값 추출 과정 34
  • 35. 얼굴특징 추출 및 특징선택 기술 동향  특징값 선택 과정 35 얼굴인식에 사용되는 가장 작은 단위 의 분류에 오류를 일으킬 수 있는 영향 을 줄 수 있는 특징 값중에서 부분세트 를 선택하는 것이 목적으로 사용되는 것이 바로 특징값 선택과정이다.
  • 36. 얼굴인식 기술동향  얼굴인식 기술은 크게 3가지 유형으로 분류 할 수 있으며, 하이브리드 방법을 이용한 연구들이 많이 진행되고 있다. 하이브리드 방법에서는 위치 특성과 더불어 하나의 얼굴을 인식하기 위하여 얼굴 전체 영역을 사용하기 때문에 매우 복잡하지만 인식률은 전체론적인 매칭 방법과 특징 기반의 매칭 방법들에 비하여 월등히 우수하다. 얼굴인식 전체론적 방법 특징기반 방법 하이브리드 방법 PCA(Eigenface) Pure Geometry Methods LFA LDA(Fisherface) Dynamic Link Architecture ShapeNormalized ICA Hidden Markov Model Componentbased PCA기반 얼굴학습 단계 Tensorfaces PDBNN 36 PCA기반 얼굴인식 단계
  • 37. 얼굴인식 기술동향 (주요기술)  기하학적 방법    특징 : 얼굴의 기하학적 특징점을 추출하여 일치여부를 판단하여 인식 성능 : 얼굴은 3차원이고 회전이 가능하기 때문에 적용에 한계가 있다. Eigenfaces    특징 : 특징점 추출로 PCA(Principal Component Analysis)를 적용하고 유사도 측정으로 Euclidean 거리 적용. 성능 : 조명이나 환경변화에 민감하게 반응하지만 널리 사용되고 있어 그 성능이 검증된 대표적인 얼굴인식 방법. Fisherfaces    특징 : FLD(Fisher Linear Discriminant) 분류 알고리즘으로 적용한 얼굴인식 방법. 성능 : 사람 개개인의 특성을 학습함으로써 보다 정확하고 환경변화에 둔감한 특성을 지니고 있어 on-line 상태에서 실시간 으로 적용 가능한 알고리즘. SVM( Support Vector Machine)에 기초한 방법    특징 : PCA와 SVM(Support Vector Machine)알고리즘을 사용한 알고리즘. 성능 : 비교적 높은 인식률을 높이지만 얼굴인식과 같은 멀티 클래스에 적용하기에는 시간과 메모리가 많이 소모되는 알고 리즘이지만 현재 연구되는 얼굴인식 알고리즘의 대표적인 알고리즘임 신경회로망    특징 : 흑백의 정지영상에서 슬라이딩 윈도우를 이용해 학습된 얼굴모양을 검색 성능 : 두 개 이상의 다수 얼굴의 추출도 가능하나 속도가 느리며 학습이 어려움. 퍼지 + 신경회로망    특징 : 신경회로망회로의 입력으로 픽셀의 밝기 값 대신 퍼지 소속함수를 사용 성능 : 신경회로망만을 이용한 방법보다 성능은 향상되나 처리속도는 떨어짐. Wavelet + Elastic Matching  특징 : 주파수 변환을 사용하며, 자세 및 표정의 변화를 처리하는데 효과적.  성능 : 인식률에 비해서 연산량이 많음. 37
  • 38. 얼굴인식 성능평가 기술 동향  성능평가 기준  성능평가에 사용하는 얼굴DB   FERET Protocol  Error rate  XM2VTS Protocol  Computational speed.   Hit ratio Memory usage. 성능에 영향을 주는 중요요인  Illumination / occlusion / expression / pose invariability  Scalability.  Adaptability (to variable input image formats, sizes, etc.)  ˆ Automatism (unsupervised processes)  Portability. • 실제 응용에 있어서는 인식율을 좌우하는 측면에서 DB의 내용이 매우 중요하며 대부분의 상용솔루 션들의 자체 DB를 확보하고 있음 38
  • 39. 얼굴인식 문제 및 해법연구 동향 문제 vs 해법연구 Illumination Pose Occlusion Heuristic approach Single-model based approaches Light-modeling app roach Expression Multi-image based approaches Statistical approac h Optical technology Geometric approaches Model-based appro ach Multi-spectral imagi ng approach 39 조명의 차이로 인한 분류 클래스의 변위
  • 42. 비디오 분석의 차별점 (Scene/Shot 방식) 42
  • 43. 비디오 분석의 차별점 (Summarization 방식) 43
  • 44. 지능형 영상 보안 기본 모델 44
  • 46. 고객 성향 분석 응용(Ex.) 46
  • 50. 상황인지 기반 지능형 자동 선택 필터 (ex. MTES) 50
  • 51. 지식 기반 알고리즘 자동 조합 예시 A B #10 #6 #11 #9 #5 #10 #15 #20 #15 C #9 (# : 알고리즘 데이터베이스 시스템 내부의 알고리즘 관리 인덱스) : 중앙의 알고리즘의 전/후 관계에 사용될 수 있는 지식 정보 (a) 각 중앙의 알고리즘 정보로부터 생성된 전/후 알고리즘의 정보 B #6 #11 A #10 #5 C #15 #20 #9 (b) (a)의 각 알고리즘의 전후 관계를 합쳐서 만든 전체 알고리즘의 관계 51
  • 52. 빅데이터 분석에 실패하는 6가지 습관 (HBR) 경험에 따른 직관을 믿어라 완벽한 결정을 내릴 수 있도록 끊임 없이 정보를 모아라 52 결론을 내 놓고 데이터를 분석해라 모두가 같은 의견을 내는 것을 믿어라 출처 : Harvard Business Review(2012) 다른 것들을 예측하라 스스로 데이터 품질을 검증할 수 있다고 자만하라