SlideShare a Scribd company logo
1 of 32
Download to read offline
비정형 데이터 분석을 위한
IBM Watson Explore
Jun. 2018
이동연실장
IBM Analytics Team, IBM Korea
WatsonExplorerV12의제품종류
• IBM Watson Explorer Deep Analytics Edition Foundational
Components V12.0.0 (Windows, Linux)
• IBM Watson Explorer Deep Analytics Edition Analytics Components
V12.0.0 (Windows, Linux, AIX, Linux on System z)
• IBM Watson Explorer Deep Analytics Edition oneWEX V12.0.0 for
ICP Linux
• IBM Watson Explorer Deep Analytics Edition oneWEX V12.0.0
(Windows, Linux)
IBMWatsonExplorerDeepAnalyticsEditionV12
• 간편해진 패키징
• 새로운 oneWEX는 업데이트된 클래식 구성 요소를 포함하고 있습니다.
• oneWEX 플랫폼을 소개합니다.
• 목표 : 최첨단 기술의 FC/AC와 함께 제공되는 검색 및 컨텐츠 분석 솔루션
• 더 보강된 FC/AC 기능 구현
Deep Analytics Edition
V11 V12
Enterprise Edition
FC
Advanced Edition
ACFC FC oneWEXAC
목차
• IBM Watson Explorer 를 사용하고 있는 고객들
• 다양한 산업군과 유형
• 비정형 데이터의 중요성
• IBM Watson Explorer 기능
• 비정형 데이터 분석에 특화된 솔루션
• 서비스 구성도 및 컨텐츠 마이너
• UMIA 아키텍처
• IBM Watson Explorer 12의 새로운 기능들
• 새로운 아키텍처
• 새로운 컨텐츠 마이너
• ML 기반의 문서 분류(Document Classification)와 유사 문서(Ranker) 검색 기능
• 확장성
• 요약
5
IBMWatsonExplorer를사용하고있는고객들,…
IBM Analytics / © 2018 IBM Corporation 5
6
다양한산업군에서WEX를이용하실수있습니다
Financial Services 고객 활동을 기반으로 한 통찰력 유도(VoC), , 사기 행위 조사, 글로벌 기업 간 안전한
데이터 투명성 확보
재검사 감소, FDA규정 준수에 걸리는 시간 단축, 환자 및 전문가를 위한 정보를 찾는
데 걸리는 시간 단축
문서 검색 정확도 향상, 검색 기능 향상, 민감한 데이터 규칙을 준수하면서 정보 공유,
상담원 생산성 및 고객 만족도 대폭 증가, 클레임 손실 비율 및 사기 감소, 캠페인 효과
향상
제품 개발을 위해 소셜 미디어 및 소비자 의견을 분석, 제품 문제를 보다 빨리 파악,
맞춤형 제품 생산 및 생산 / 유지 보수 관리 비용을 줄이고, 공급망의 일관성을
개선하고 상품 배송 / 관리 필요한 최신 정보 제공
제품 조사에 필요한 정보를 찾는 데 걸리는 시간을 단축하고 전 세계 환자 및 연구
데이터에 대한 접근을 개선합니다.
규제 업데이트 속도 향상, 시민들의 공개 정보 연결, 밀수품 활동 식별, 불만 사항 검색
및 분석, 검거율 향상
제품 분석을 개선하고, 고객의 의견에 기초한 핵심 의사 결정을 개선하고, 설문 조사
정보를 실행 가능한 인텔리전스로 변환
콜 센터 해결률 개선, 이탈 가능 고객 탐색, M&A활동 후 정보 통합 및 정상화
Healthcare
Insurance
Manufacturing
Pharma
Public Sector
Retail / CPG
Telco
IBM Analytics / © 2018 IBM Corporation 6
또한다양한업무환경에서도WEX를활용할수있습니다
고객의 소리 분석 및 대응
• 분석 : 콜로그, e-메일, 웹/소셜 미디어
• 목적 : 고객 불만 대응, 구매자 행동 패턴,
고객 이탈 방지,챗봇 서비스를 위한 코퍼스 분석
• 효과 : 고객 만족도 향상, 새로운 수익 기회 발견,
마케팅 및 캠페인 고도화, 효과적인 챗봇 계획
범죄 / 위협 징후 모니터링
• 분석 : 사건 조서, 외부 뉴스, SNS, 911 콜 기록 등
• 목적 : 범죄 분석 및 예측, 용의자 프로파일링
• 효과 : 안전한 지역사회 만들기, 경찰 인력 배치
최적화
장비 결함 분석 및 제품 품질 통찰
• 분석 : 결함 및 정비 기록, 고객 피드백
• 목적 : 결함 정비 정보 자산화, 품질 보증 서비스
• 효과 : 신속한 정비 지식 확보(정비 지연 최소화),
보증 비용 절감, 고객 만족도 향상, 마케팅 캠페인
마케팅 인사이트
• 분석 : 콜센타 고객 상담 로그, 웹/소셜 미디어 및
멀티 컨텐츠 저장소
• 목적 : 타겟 고객 확보, 고객 이탈 예측, 신제품 트렌드,
브랜드 이미지 고도화
• 효과 : 고객 만족도의 향상, 마케팅, 캠페인, 새로운
수익 기회 발견, 제품 브랜드의 품질 문제의 발견
보안 및 규정 준수, 보험 사기 방지, 지능형 문서
검색
• 분석 : 이메일, 채팅, 보험 청구 내역 등
• 목적 : 보안 규정 및 법률 준수, 부정 행위 및 패턴
감지, 규제 패턴 탐색
• 효과 : 보안 및 규제 준수 모니터링 및 감지, 업무
프로세스 감시
헬스 케어
• 분석 : e-Medical 기록/처방전, 병원 보고서
• 목적 : 임상 기록, 처방 최적화
• 효과 : 만성병 화자의 사전 진료 관리, 처방전 최적화,
향상된 치료 효과
반복적이고 시간이 소요되는, 사람이 해야 하는 작업의 생산성 및 품질 향상
비정형 데이터로부터 새로운 인사이트 도출 및 확보 용이
7
분석 : 결함 및 정비 기록, 고객 피드백 분석 : e-Medical 기록/처방전, 병원 보고서
분석 : 콜센타 고객 상담 로그, 웹/소셜 미디어 및
멀티 컨텐츠 저장소
분석 : 콜로그, e-메일, 웹/소셜 미디어
분석 : 사건 조서, 외부 뉴스, SNS, 911 콜 기록 등
분석 : 이메일, 채팅, 보험 청구 내역 등
7
IBM Analytics / © 2018 IBM Corporation
HEALTHCARE DATA
GOVERNMENT
& EDUCATION DATA
99% 88% 94% 84%
Healthcare data comes from sources such as: Government & education data comes from
sources such as:
Patient
Sensors
Electronic
Medical
Records
Test
Results
Vehicle Fleet
Sensors
Traffic
Sensors
Student
Evaluations
UTILITIES DATA MEDIA DATA
93% 84% 97% 82%
Utilities data comes from sources such as: Media data comes from sources such as:
Utility
Sensors
Employee
Sensors
Location
Data
Video
and Film
Images Audio
growth by 2017 unstructured growth by 2017 unstructured
growth by 2017 unstructured growth by 2017 unstructured
2020년경이면 지구상의 모든
인간이 생성하는 데이터는
초당 1.7MB의 새로운
정보를 생성해 낼 것입니다.
What answers
lie in the 88%
that is dark?
기존의비정형데이터에서우리는새로운도전과기회를얻을수있습니다.
IBM Analytics / © 2018 IBM Corporation 8
정형분석
“WHAT is happening?”
비정형분석
“WHY is it happening?”
온라인 의류업체 3분기 연속 판매 부진 주문/포장/배송상의 서비스 미흡에 대해 고객은
부정적인 감정을 표출함
Healthcare
Insurance
Crime
Customer Insight
울혈성 심부전 환자의 재입원율 20%
증가
보험사 지난 달 민원 12% 증가
범죄율이 서서히 증가한 지난 6개월 간
체포 건수 감소
의사가 직접 작성한 환자 노트에서 알 수 있는 나이와
재입원율의 상관관계 등 놓친 의학정보
특정 지역 설계사들의 상품 설명 불충분 등 불완전 판매
행태
새로운 패턴의 범죄에 대응할 수 있는 인력재배치 미흡
비정형데이터분석은“무엇”뒤에숨어있는“왜”를알수있도록합니다
IBM Analytics / © 2018 IBM Corporation 9
AI for your enterprise data
Watson Explorer 기능
IBM Analytics / © 2018 IBM Corporation
11
IBMWatsonExplorer는비정형데이터분석에특화된솔루션입니다.
확장텍스트 정형화 시각화 / 마이닝
• 트렌드, 패턴, 시간, 빈도, 분포, 연관관계
• 비즈니스 컨텍스트 추출 및 감성 분석
Not only was the pick-up line
at the counter very long, but
I waited 30 minutes just to
talk to a rude representative
who gave me a car that
smelled like smoke, had
stained floor mats, a dented
fender, and only half a tank
of gas
• 형태소 분석
• 용어사전을 이용한
키워드/개체 분석
• Rule기반 문장패턴
인식을 통한 의미 분석
• ML기반의 Classifier
• 웹 기반의 전용 화면
• 패싯 검색 /
• 빈도/상관, 고급 검색
• 시계열 / 편차 /패싯 쌍
/ 연결
• 정형 데이터와 연계
(외부 데이터와 통합 화면)
• IBM Cognos Analytic &
DSX 연계
• 외부데이터와 연계한 화면을 구성하기 위한 환경 제공 (AppBuilder)
• 정형 분석이 가능한 형태로 반출하여 BI솔루션인 Cognos Analytics
및 고급분석 도구인 IBM Data Science Experience에서 활용
RDB
IBM Analytics / © 2018 IBM Corporation 11
12
IBMWatsonExplorer는비정형데이터분석에특화된솔루션입니다.
기업내부
• 콜센터, 상담메모, 녹취,…
• eMail, 게시판, KMS, ECM
• 설비결함 및 정비로그
• 진단 및 처방기록,. 등
기업외부
• SNS(페이스북, 트위터,
밴드,..)
• 웹 사이트
• 리서치 기관 자료
• 특허, 논문, 잡지,.. 등
아우~~~~! 너무 귀여운
에스쁘아 미니미 러브코치!
향은 5가지다 물론 좋구요..
향수라는 느낌보다 엄마가
좋은 향기 넣어
빨래한.스쳐지나갈떄 은은한
향기가나는! 참 좋은
향기였어요 !모든 향기가
대부분 시원했으며. 달콤한
사랑의 향기! 에스쁘아
미니미
일반명사 아우
부사 너무
형용사 귀엽다
수정된명사 귀엽다 … 에스쁘아
긍정적 귀엽다
기타 에스쁘아
명사 시퀸스 에스쁘아 미니 미 러브
일반명사 미니
명사시퀸스 미니 미 러브 코치
일반명사 미
비정형을 정형화
Cognitive View
Export전 처리
자연어 분석 기술은 다양한 형태의 대내외 비정형 데이터를 수집, 분석하고 그 분석 결과를 시각화하여 다양한
인사이트를 제공합니다.
IBM Analytics / © 2018 IBM Corporation 12
관리자
사용자
분석가
관리
보고서
분석도구
REST
대시보드,
정형보고서 및 검색
Financial
Applications
Scorecards
Planning and
Reporting
Business Intelligence
& Analytics
ETL
기업 외부
FTP
기업내부
거버넌스 개발환경 보안
Thumbnail
Index
Facet Count
Sub Index
Taxonomy
Index
Search
Index
뉴스 빅데이터 분석서버
Crawler
Framework
Importer
Framework
Document Processor
Parser
Document
Generator
Annotator
UIMA
Annotator
ExporterCommon Infrastructure
Control Monitor Configuration
Logging Security Scheduler
Raw Data
Store
Document
Cache
Crawler
Plug-in
Crawlers
CSV
Importer
Indexer
Service
Indexer
Export Plug-in
Inspector
Text Analytics
& Search
Runtime
xx용
수집 DB
SNS
뉴스기사
원문
뉴스기사
카테고리
뉴스기사
메타데이터
Crawler
영역
UMIA 분석 엔진
자연어 분석 결과
저장 및 검색
분석 결과 보기 및
API
시스템 설정 / 관리 사용자 인터페이스
WEX서비스구성도
원문보기
패싯트리
(분류맵)
시계열,
편차,
경향등
다양한
시각화
메뉴
연관된
품사 빈도
탐색어와
연관 관계
검색
WEX는직관적인컨텐츠마이너화면을제공합니다
1
2
3
1. WEX Default Facet
데이터 로딩만으로 분석할 수 있음
기본적인 Pattern Discovery 수행
- Part of Speech
- Phrase Constituent
- Sentiment Expression
2. Structured Data Facet
분석대상 문서와 연계된 메타 정보
비정형 데이터와 연계 insight 도출
- 작성자, 분류, 소분류, 회사명,
브랜드 평가점수,.. 등
3. Analysis Facet
인지 컴퓨팅 기반 분석 목적에 따라
텍스트에서 추출한 분석 관점
- 상품 관점
- 긍정/부정
1 2 3
15
텍스트처리를위한UIMA아키텍처(1/2)
Indexer Task
Indexer
Document
Processor
Document
Generator
Index
Master Node
Document Processor
Crawler
LinguisticAnalysis
LangIdentification
Classification
Custom
Dictionary
PatternMatcher
NamedEntity
Text
Extraction
Export
UIMA ( Unstructured Information Management Architecture )
UIMA pipeline
IBM Analytics / © 2018 IBM Corporation 15
16
텍스트처리를위한UIMA아키텍처(2/2)
ABC생명 의 가나 연금보험으로 건강한 노후를 준비하세요
Text Analysis
ABC생명
고유명사
회사명
상품홍보
형태소 분석
품사 정보 분석
개체명 분석
이벤트 분석
UIMAFramework
의 가나
조사
형용
사
으
로
조사
건강한
형용사
노후
준비하세
요
명사 동사
상품명
연
금
명사
보
험
명사
를
조사
회사명+상품명+’노후 를 준비하세요’
(ABC생명 + 가나 연금 보험 + ‘노후를 준비하세요’)
반복
IBM Analytics / © 2018 IBM Corporation 16
AI for your enterprise data
Watson Explorer 12(oneWEX)새로운 기능들
IBM Analytics / © 2018 IBM Corporation
18
oneWEX의새로운기능들
• ICP(IBM Cloud Private) 기반 환경의 유연한
확장성
• Docker 컨테이너 기반 환경하에서 마이크로
서비스 기반으로 운영됨
• 새로운 컨텐츠 마이닝과 관리
• LoB 기반의 사용자 인터페이스
• 사용자는 마이닝 히스토리를
• 새로운 마이닝 기법으로 가이드를 제시
• 새로운 개념의 관리 기법
• 데이터 세트와 컬렉션
• 기계 학습 기반의 역량
• 문서 분류(Document Classification)
• 상관 관계 기반의 검색(Ranker)
IBM Analytics / © 2018 IBM Corporation 18
oneWEX아키텍처
• Based on Docker/Kubernetes
• Services
• Ingestion Service
• Crawl and convert
• Enrichment Service
• Apply annotator per fields
• Machine Learning Service
• ML based Classifier/Ranker
• Exploration Service
• Solr based new index/search
• Applications
• Content Miner
• AppBuilder
• Admin GUI
AppBuilder
Content
Miner
Admin
Ingestion
Service
Enrichment
Service
Exploration
Service
M-Learning
Service
Embedded
TensorFlow
Embedded
HDFS/YARN
Solr x
ZooKeeper
nginx
WEX Frontend
WEX Ingestion
CouchDB
Fluentd
WEX Plugin
IBM Cloud Private (K8s)
WEX IngestionWEX Ingestion
ZooKeeperZooKeeper
Solr xWEX PluginSolr xWEX Plugin
Embedded
TensorFlow
Embedded
HDFS/YARN
Embedded
TensorFlow
Embedded
HDFS/YARN
ICP(IBM Cloud Private) 기반 환경의 유연한 확장성
20
oneWEX서비스구성도
Database
File System
Data
Sources
Data Crawler
Data Enricher
Classifier
Runtime
Classifier
Trainer
Labeler
Model
Labeler
Model
Classifier
Model
Data
Importer
Dataset
File
Data
Converter
Miner Application
AppBuilder
and other
Applications
DictionaryDictionary
Dictionary
Custom
Annotator
Collection
Search
Analytics
Runtime
Acquire
Analyze and SearchEnrich
IBM Analytics / © 2018 IBM Corporation 20
ICP(IBM Cloud Private) 기반 환경의 유연한 확장성
21
Content Miner 인터페이스는 손쉬운 화면, ML 및 AI 기능을 사용하여 일반 사용자 또는 Data
Scientist에게 의미 있고 주요 항목을 제시합니다.
컨텐츠
마이너는
분석을위해
사용됩니다
IBM Analytics / © 2018 IBM Corporation 21
새로운 컨텐츠 마이닝과 관리
oneWEX 컨텐츠마이너
22
Analyze:
“무엇”뒤에
숨어 있는
“왜”를
이해하게 도와
줍니다
직관적인
UI
워드
클라우드
IBM Analytics / © 2018 IBM Corporation 22
새로운 컨텐츠 마이닝과 관리
oneWEX 컨텐츠마이너
23
Advise:
효과적인의사
결정 가이드
패싯기반
원본문서
보기
IBM Analytics / © 2018 IBM Corporation 23
새로운 컨텐츠 마이닝과 관리
oneWEX 컨텐츠마이너
24
AppBuilder:
전반적인기업
전체의
데이터에서
인사이트를
도출
다양한
대시보드
IBM Analytics / © 2018 IBM Corporation 24
새로운 컨텐츠 마이닝과 관리
oneWEX -360View
25
WEX의기계학습(MachineLearning)기능
새로운 기계 학습기능이 WEX Core엔진에 내장되어 있으며, 이미 다수의 금융권 사례를 통하여 검증된 기능을
제품화 한 솔루션입니다
• 문서 분류(Document Classifier)
• 문서 내용 분류에 대한 자동 학습을 통한
문서 분류
• 보험 청구 자동 심사 : 규칙 기반 분류의
모호함을 기계학습 모형으로 보강
• 유사 문서(Ranker) 추천
• 유사 문서에 대한 자동 학습 기반 Ranking
• 콜센터 자동 응답 추천 기능 – 주어진 질문
내용에 대해 가장 유사한 답변을 자동 매핑
NLP
ML
model
Classifier
Machine
Learning
Cognitive
Advise
Document
IBM Analytics / © 2018 IBM Corporation 25
기계학습 기반의 역량
26
ML기반의문서분류기능(1/2)
Documents
Classification
by Machine Learning Classification Result
(Labels)
Politics, Economy,
Science, Sports, …
"더 빨리 뛰게 하는 신발 기술의
발전은 100미터 달리기 기록의
향상에 기여합니다."
Sports
Economy
✓
✗
Science ✗
자동 분류는 현재 기계 학습 기술의 가장 실용적인 응용 프로그램입니다.
▪ 인간과 비교 : 압도적으로 빠름
▪ 규칙 기반 분류와 비교 : 충분한 학습 데이터로 높은 정확도와 많은 양의 복잡한 규칙을 관리 할 필요가 없음
IBM Analytics / © 2018 IBM Corporation 26
기계학습 기반의 역량
27
ML기반의문서분류기능(2/2)
Content (문서 본문 ) Class Labeling(내용 분류)
Three pieces of chocolate missing from a
dozen-pack
Amount.shortage
One cup of mint jelly missing from a 12-p
ack
Amount.shortage
I bought chocolate ice cream, but the insi
de of the container was dirty.
Is it safe?
Package_container.dirt
Some juice leaked from the bottom of th
e juice pack.
Package_container.lear
IBM Analytics / © 2018 IBM Corporation 27
기계학습 기반의 역량
28
[ Backup Slide] 문서 분류자 기반 정확도
Training:
Run the Trained Model:
WEX ML-DC
IBM Analytics / © 2018 IBM Corporation 28
기계학습 기반의 역량
29
ML기반의유사문서추천-Sumitomo Mitsui Banking Corp.
학습된 유사문서
기준에 따라 결과
Ranking을 조정
• 비즈니스 요구 사항
▪ 잦은 이직으로 인한 전문 콜센터 요원의
부족
▪ 체계화되지 않은 고객 응대로 느린 응답
시간 및 잦은 업무 중단
▪ 고객 서비스에 대한 업무 개선이 필요
• 소스 데이터
▪ 운영 매뉴얼, 오류 코드, 지점 정보,
스크립트, FAQ 등
구현 항목
• 상담원은 논의 된 주제를 기반으로
컨텐츠 추천
▪ 순위가 매겨진 답변 후보군 제시 최상의
정보를 즉각적으로 표시
• NLQ1) 기반의 정보 검색
• ML 적용
• 다국어 지원(일본어, 영어) 확장
▪ 신용 관리 전문 주제를 포함, 국내 유럽,
미국 고객까지 지원 확대
IBM Analytics / © 2018 IBM Corporation 29
기계학습 기반의 역량
30
확장 : Watson Explorer Integration with DSX Local
▪ WEX 기능은 DSX Local Notebook에서 이용할 수 있습니다.
• 비정형 데이터 분석으로 확장:
Notebook에서 데이터 분석가는 다양한 라이브러리 (예 : numpy로 숫자
분석)로 구조화 된 데이터를 분석하고 WEX NLP로 구조화되지 않은
데이터를 완벽하게 분석 할 수 있습니다
• Reporting:
WEX의 분석 결과는 Notebook으로 시각화 할 수 있으며 데이터 분석가
사이에서 공유 될 수 있습니다.
▪ Cognos Analytics 고객은 Watson Explorer를 활용함으로써 보다 더큰
이익을 얻을 수 있습니다.
• Cognos Analytics는 구조화된 데이터에 구조화되지 않은 데이터를
추가하여 분석 및 보고 역량을 확장 할 수 있습니다.
• 보고서, 시각화 및 배포를 위해 Watson Explorer 분석내용을 Cognos
Analytics로 직접 보낼 수 있습니다.
• Watson Explorer는 초기 분석에 사용할 수 있으므로 대용량 데이터 집합을
줄여 Cognos Analytics로 내 보내어 더 많은 사용자가 더 많은 분석과
액세스를 할 수 있습니다.
• Watson Explorer는 Cognos Analytics에서 제공하는 "What"뒤에 "Why"에
대한 답을 제공합니다.
IBM Analytics / © 2018 IBM Corporation 30
확장성
WEX를 정리해보면
좋은 인지적 탐사 및 콘텐츠 분석 요구 사항
• 필요한 데이터를 효율적인 데이터 세트로 관리
• 강력한 자연어 분석 기반 검색 및 분류
• 규칙 기반 학습과 기계 학습 학습의 폭 넓고 유연한 NLP 및 텍스트 분석
• 손쉬운 사용과 강력한 시각화
• 사용을 통한 새로운 인사이트 및 개선
IBM Watson Explorer
Explore Analyze
Advise
IBM Analytics / © 2018 IBM Corporation 31
감사합니다
이동연실장
dlee@kr.ibm.com
ICP, CTP, 010-4995-4519
IBM Analytics, IBM Korea

More Related Content

What's hot

[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
NAVER D2
 

What's hot (20)

05. it정보화전략-어플리케이션 프레임워크
05. it정보화전략-어플리케이션 프레임워크05. it정보화전략-어플리케이션 프레임워크
05. it정보화전략-어플리케이션 프레임워크
 
1. 아키텍쳐 설계 프로세스
1. 아키텍쳐 설계 프로세스1. 아키텍쳐 설계 프로세스
1. 아키텍쳐 설계 프로세스
 
Elasticsearch 엘라스틱서치 (검색서비스) 에 대해 알아보자.txt
Elasticsearch 엘라스틱서치 (검색서비스) 에 대해 알아보자.txtElasticsearch 엘라스틱서치 (검색서비스) 에 대해 알아보자.txt
Elasticsearch 엘라스틱서치 (검색서비스) 에 대해 알아보자.txt
 
쿠키런 1년, 서버개발 분투기
쿠키런 1년, 서버개발 분투기쿠키런 1년, 서버개발 분투기
쿠키런 1년, 서버개발 분투기
 
검색엔진이 데이터를 다루는 법 김종민
검색엔진이 데이터를 다루는 법 김종민검색엔진이 데이터를 다루는 법 김종민
검색엔진이 데이터를 다루는 법 김종민
 
차곡차곡 쉽게 알아가는 Elasticsearch와 Node.js
차곡차곡 쉽게 알아가는 Elasticsearch와 Node.js차곡차곡 쉽게 알아가는 Elasticsearch와 Node.js
차곡차곡 쉽게 알아가는 Elasticsearch와 Node.js
 
[네전따] 네트워크 엔지니어에게 쿠버네티스는 어떤 의미일까요
[네전따] 네트워크 엔지니어에게 쿠버네티스는 어떤 의미일까요[네전따] 네트워크 엔지니어에게 쿠버네티스는 어떤 의미일까요
[네전따] 네트워크 엔지니어에게 쿠버네티스는 어떤 의미일까요
 
Elastic Search (엘라스틱서치) 입문
Elastic Search (엘라스틱서치) 입문Elastic Search (엘라스틱서치) 입문
Elastic Search (엘라스틱서치) 입문
 
Atlassian confluence WIKI를 활용한 공유와 협업 환경 구성
Atlassian confluence WIKI를 활용한 공유와 협업 환경 구성Atlassian confluence WIKI를 활용한 공유와 협업 환경 구성
Atlassian confluence WIKI를 활용한 공유와 협업 환경 구성
 
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
 
[우리가 데이터를 쓰는 법] 모바일 게임 로그 데이터 분석 이야기 - 엔터메이트 공신배 팀장
[우리가 데이터를 쓰는 법] 모바일 게임 로그 데이터 분석 이야기 - 엔터메이트 공신배 팀장[우리가 데이터를 쓰는 법] 모바일 게임 로그 데이터 분석 이야기 - 엔터메이트 공신배 팀장
[우리가 데이터를 쓰는 법] 모바일 게임 로그 데이터 분석 이야기 - 엔터메이트 공신배 팀장
 
Ipl자동화방안제안 애플트리랩
Ipl자동화방안제안 애플트리랩Ipl자동화방안제안 애플트리랩
Ipl자동화방안제안 애플트리랩
 
파이콘 한국 2019 - 파이썬으로 서버를 극한까지 끌어다 쓰기: Async I/O의 밑바닥
파이콘 한국 2019 - 파이썬으로 서버를 극한까지 끌어다 쓰기: Async I/O의 밑바닥파이콘 한국 2019 - 파이썬으로 서버를 극한까지 끌어다 쓰기: Async I/O의 밑바닥
파이콘 한국 2019 - 파이썬으로 서버를 극한까지 끌어다 쓰기: Async I/O의 밑바닥
 
대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
 
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
 
신입 SW 개발자 취업 준비
신입 SW 개발자 취업 준비신입 SW 개발자 취업 준비
신입 SW 개발자 취업 준비
 
서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)
 
클라우드 네이티브 IT를 위한 4가지 요소와 상관관계 - DevOps, CI/CD, Container, 그리고 MSA
클라우드 네이티브 IT를 위한 4가지 요소와 상관관계 - DevOps, CI/CD, Container, 그리고 MSA클라우드 네이티브 IT를 위한 4가지 요소와 상관관계 - DevOps, CI/CD, Container, 그리고 MSA
클라우드 네이티브 IT를 위한 4가지 요소와 상관관계 - DevOps, CI/CD, Container, 그리고 MSA
 
Data Engineering 101
Data Engineering 101Data Engineering 101
Data Engineering 101
 
신입 개발자 생활백서 [개정판]
신입 개발자 생활백서 [개정판]신입 개발자 생활백서 [개정판]
신입 개발자 생활백서 [개정판]
 

Similar to [한국IBM] 비정형데이터분석 WEX 솔루션 소개

클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
Amazon Web Services Korea
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
 
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018 제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
Amazon Web Services Korea
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
Amazon Web Services Korea
 

Similar to [한국IBM] 비정형데이터분석 WEX 솔루션 소개 (20)

[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer[IBM Korea 김상훈] Watson Explorer
[IBM Korea 김상훈] Watson Explorer
 
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
 
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
 
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
[에이스카운터 웹로그분석]에이스카운터 ASP 서비스 소개서
 
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
고객 중심 서비스 출시를 위한 준비 “온오프라인 고객 데이터 통합” – 김준형 AWS 솔루션즈 아키텍트, 김수진 아모레퍼시픽:: AWS C...
 
UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015
 
Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용
 
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018 제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
제조업의 AWS 기반 주요 워크로드 및 고객 사례:: 이현석::AWS Summit Seoul 2018
 
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
[Retail & CPG Day 2019] AWS기반의 Data 분석 플랫폼 구축, 고객사례 (GS SHOP) -김형일, AWS 솔루션즈 ...
 
클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션 :: 정우진 이사
클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션 :: 정우진 이사클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션 :: 정우진 이사
클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션 :: 정우진 이사
 
170426 cloud day in 포항 2. 클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션_aws 정우진 이사
170426 cloud day in 포항 2. 클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션_aws 정우진 이사170426 cloud day in 포항 2. 클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션_aws 정우진 이사
170426 cloud day in 포항 2. 클라우드 뉴노멀 시대의 글로벌 혁신 기업들의 디지털 트랜스포메이션_aws 정우진 이사
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
 
H2O Driverless AI on IBM Power
H2O Driverless AI on IBM PowerH2O Driverless AI on IBM Power
H2O Driverless AI on IBM Power
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
 
[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
[Retail & CPG Day 2019] 유통 고객의 AWS 도입 동향 - 박동국, AWS 어카운트 매니저, 김준성, AWS어카운트 매니저
 

More from Sejeong Kim 김세정

More from Sejeong Kim 김세정 (10)

[한국IBM] 관리회계/경영계획 솔루션 Planning Analytics 소개자료
[한국IBM] 관리회계/경영계획 솔루션 Planning Analytics 소개자료 [한국IBM] 관리회계/경영계획 솔루션 Planning Analytics 소개자료
[한국IBM] 관리회계/경영계획 솔루션 Planning Analytics 소개자료
 
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
 
[한국IBM] AI활용을 위한 머신러닝 모델 구현 및 운영 세션
[한국IBM] AI활용을 위한 머신러닝 모델 구현 및 운영 세션[한국IBM] AI활용을 위한 머신러닝 모델 구현 및 운영 세션
[한국IBM] AI활용을 위한 머신러닝 모델 구현 및 운영 세션
 
[한국IBM] Watson API를 통한 디지털혁신 사례_201904
[한국IBM] Watson API를 통한 디지털혁신 사례_201904[한국IBM] Watson API를 통한 디지털혁신 사례_201904
[한국IBM] Watson API를 통한 디지털혁신 사례_201904
 
[한국IBM]클라우드 서비스 적용 시나리오와 고객 가치 창출 사례
[한국IBM]클라우드 서비스 적용 시나리오와 고객 가치 창출 사례[한국IBM]클라우드 서비스 적용 시나리오와 고객 가치 창출 사례
[한국IBM]클라우드 서비스 적용 시나리오와 고객 가치 창출 사례
 
[날씨x산업] 날씨기반 IBM 유통업 솔루션 소개
[날씨x산업] 날씨기반 IBM 유통업 솔루션 소개[날씨x산업] 날씨기반 IBM 유통업 솔루션 소개
[날씨x산업] 날씨기반 IBM 유통업 솔루션 소개
 
[한국IBM] Watson AI 소개 및 도입사례 (201904)
[한국IBM] Watson AI 소개 및 도입사례 (201904)[한국IBM] Watson AI 소개 및 도입사례 (201904)
[한국IBM] Watson AI 소개 및 도입사례 (201904)
 
[한국IBM] 날씨기반 산업 솔루션, Weather SaaS 소개자료
[한국IBM] 날씨기반 산업 솔루션, Weather SaaS 소개자료[한국IBM] 날씨기반 산업 솔루션, Weather SaaS 소개자료
[한국IBM] 날씨기반 산업 솔루션, Weather SaaS 소개자료
 
IBM with 서비스나우, IT운영관리 이젠 바뀔 때입니다.
IBM with 서비스나우, IT운영관리 이젠 바뀔 때입니다.IBM with 서비스나우, IT운영관리 이젠 바뀔 때입니다.
IBM with 서비스나우, IT운영관리 이젠 바뀔 때입니다.
 
[한국IBM] ServiceNow로 IT운영관리 최적화!
[한국IBM] ServiceNow로 IT운영관리 최적화![한국IBM] ServiceNow로 IT운영관리 최적화!
[한국IBM] ServiceNow로 IT운영관리 최적화!
 

[한국IBM] 비정형데이터분석 WEX 솔루션 소개

  • 1. 비정형 데이터 분석을 위한 IBM Watson Explore Jun. 2018 이동연실장 IBM Analytics Team, IBM Korea
  • 2. WatsonExplorerV12의제품종류 • IBM Watson Explorer Deep Analytics Edition Foundational Components V12.0.0 (Windows, Linux) • IBM Watson Explorer Deep Analytics Edition Analytics Components V12.0.0 (Windows, Linux, AIX, Linux on System z) • IBM Watson Explorer Deep Analytics Edition oneWEX V12.0.0 for ICP Linux • IBM Watson Explorer Deep Analytics Edition oneWEX V12.0.0 (Windows, Linux)
  • 3. IBMWatsonExplorerDeepAnalyticsEditionV12 • 간편해진 패키징 • 새로운 oneWEX는 업데이트된 클래식 구성 요소를 포함하고 있습니다. • oneWEX 플랫폼을 소개합니다. • 목표 : 최첨단 기술의 FC/AC와 함께 제공되는 검색 및 컨텐츠 분석 솔루션 • 더 보강된 FC/AC 기능 구현 Deep Analytics Edition V11 V12 Enterprise Edition FC Advanced Edition ACFC FC oneWEXAC
  • 4. 목차 • IBM Watson Explorer 를 사용하고 있는 고객들 • 다양한 산업군과 유형 • 비정형 데이터의 중요성 • IBM Watson Explorer 기능 • 비정형 데이터 분석에 특화된 솔루션 • 서비스 구성도 및 컨텐츠 마이너 • UMIA 아키텍처 • IBM Watson Explorer 12의 새로운 기능들 • 새로운 아키텍처 • 새로운 컨텐츠 마이너 • ML 기반의 문서 분류(Document Classification)와 유사 문서(Ranker) 검색 기능 • 확장성 • 요약
  • 6. 6 다양한산업군에서WEX를이용하실수있습니다 Financial Services 고객 활동을 기반으로 한 통찰력 유도(VoC), , 사기 행위 조사, 글로벌 기업 간 안전한 데이터 투명성 확보 재검사 감소, FDA규정 준수에 걸리는 시간 단축, 환자 및 전문가를 위한 정보를 찾는 데 걸리는 시간 단축 문서 검색 정확도 향상, 검색 기능 향상, 민감한 데이터 규칙을 준수하면서 정보 공유, 상담원 생산성 및 고객 만족도 대폭 증가, 클레임 손실 비율 및 사기 감소, 캠페인 효과 향상 제품 개발을 위해 소셜 미디어 및 소비자 의견을 분석, 제품 문제를 보다 빨리 파악, 맞춤형 제품 생산 및 생산 / 유지 보수 관리 비용을 줄이고, 공급망의 일관성을 개선하고 상품 배송 / 관리 필요한 최신 정보 제공 제품 조사에 필요한 정보를 찾는 데 걸리는 시간을 단축하고 전 세계 환자 및 연구 데이터에 대한 접근을 개선합니다. 규제 업데이트 속도 향상, 시민들의 공개 정보 연결, 밀수품 활동 식별, 불만 사항 검색 및 분석, 검거율 향상 제품 분석을 개선하고, 고객의 의견에 기초한 핵심 의사 결정을 개선하고, 설문 조사 정보를 실행 가능한 인텔리전스로 변환 콜 센터 해결률 개선, 이탈 가능 고객 탐색, M&A활동 후 정보 통합 및 정상화 Healthcare Insurance Manufacturing Pharma Public Sector Retail / CPG Telco IBM Analytics / © 2018 IBM Corporation 6
  • 7. 또한다양한업무환경에서도WEX를활용할수있습니다 고객의 소리 분석 및 대응 • 분석 : 콜로그, e-메일, 웹/소셜 미디어 • 목적 : 고객 불만 대응, 구매자 행동 패턴, 고객 이탈 방지,챗봇 서비스를 위한 코퍼스 분석 • 효과 : 고객 만족도 향상, 새로운 수익 기회 발견, 마케팅 및 캠페인 고도화, 효과적인 챗봇 계획 범죄 / 위협 징후 모니터링 • 분석 : 사건 조서, 외부 뉴스, SNS, 911 콜 기록 등 • 목적 : 범죄 분석 및 예측, 용의자 프로파일링 • 효과 : 안전한 지역사회 만들기, 경찰 인력 배치 최적화 장비 결함 분석 및 제품 품질 통찰 • 분석 : 결함 및 정비 기록, 고객 피드백 • 목적 : 결함 정비 정보 자산화, 품질 보증 서비스 • 효과 : 신속한 정비 지식 확보(정비 지연 최소화), 보증 비용 절감, 고객 만족도 향상, 마케팅 캠페인 마케팅 인사이트 • 분석 : 콜센타 고객 상담 로그, 웹/소셜 미디어 및 멀티 컨텐츠 저장소 • 목적 : 타겟 고객 확보, 고객 이탈 예측, 신제품 트렌드, 브랜드 이미지 고도화 • 효과 : 고객 만족도의 향상, 마케팅, 캠페인, 새로운 수익 기회 발견, 제품 브랜드의 품질 문제의 발견 보안 및 규정 준수, 보험 사기 방지, 지능형 문서 검색 • 분석 : 이메일, 채팅, 보험 청구 내역 등 • 목적 : 보안 규정 및 법률 준수, 부정 행위 및 패턴 감지, 규제 패턴 탐색 • 효과 : 보안 및 규제 준수 모니터링 및 감지, 업무 프로세스 감시 헬스 케어 • 분석 : e-Medical 기록/처방전, 병원 보고서 • 목적 : 임상 기록, 처방 최적화 • 효과 : 만성병 화자의 사전 진료 관리, 처방전 최적화, 향상된 치료 효과 반복적이고 시간이 소요되는, 사람이 해야 하는 작업의 생산성 및 품질 향상 비정형 데이터로부터 새로운 인사이트 도출 및 확보 용이 7 분석 : 결함 및 정비 기록, 고객 피드백 분석 : e-Medical 기록/처방전, 병원 보고서 분석 : 콜센타 고객 상담 로그, 웹/소셜 미디어 및 멀티 컨텐츠 저장소 분석 : 콜로그, e-메일, 웹/소셜 미디어 분석 : 사건 조서, 외부 뉴스, SNS, 911 콜 기록 등 분석 : 이메일, 채팅, 보험 청구 내역 등 7 IBM Analytics / © 2018 IBM Corporation
  • 8. HEALTHCARE DATA GOVERNMENT & EDUCATION DATA 99% 88% 94% 84% Healthcare data comes from sources such as: Government & education data comes from sources such as: Patient Sensors Electronic Medical Records Test Results Vehicle Fleet Sensors Traffic Sensors Student Evaluations UTILITIES DATA MEDIA DATA 93% 84% 97% 82% Utilities data comes from sources such as: Media data comes from sources such as: Utility Sensors Employee Sensors Location Data Video and Film Images Audio growth by 2017 unstructured growth by 2017 unstructured growth by 2017 unstructured growth by 2017 unstructured 2020년경이면 지구상의 모든 인간이 생성하는 데이터는 초당 1.7MB의 새로운 정보를 생성해 낼 것입니다. What answers lie in the 88% that is dark? 기존의비정형데이터에서우리는새로운도전과기회를얻을수있습니다. IBM Analytics / © 2018 IBM Corporation 8
  • 9. 정형분석 “WHAT is happening?” 비정형분석 “WHY is it happening?” 온라인 의류업체 3분기 연속 판매 부진 주문/포장/배송상의 서비스 미흡에 대해 고객은 부정적인 감정을 표출함 Healthcare Insurance Crime Customer Insight 울혈성 심부전 환자의 재입원율 20% 증가 보험사 지난 달 민원 12% 증가 범죄율이 서서히 증가한 지난 6개월 간 체포 건수 감소 의사가 직접 작성한 환자 노트에서 알 수 있는 나이와 재입원율의 상관관계 등 놓친 의학정보 특정 지역 설계사들의 상품 설명 불충분 등 불완전 판매 행태 새로운 패턴의 범죄에 대응할 수 있는 인력재배치 미흡 비정형데이터분석은“무엇”뒤에숨어있는“왜”를알수있도록합니다 IBM Analytics / © 2018 IBM Corporation 9
  • 10. AI for your enterprise data Watson Explorer 기능 IBM Analytics / © 2018 IBM Corporation
  • 11. 11 IBMWatsonExplorer는비정형데이터분석에특화된솔루션입니다. 확장텍스트 정형화 시각화 / 마이닝 • 트렌드, 패턴, 시간, 빈도, 분포, 연관관계 • 비즈니스 컨텍스트 추출 및 감성 분석 Not only was the pick-up line at the counter very long, but I waited 30 minutes just to talk to a rude representative who gave me a car that smelled like smoke, had stained floor mats, a dented fender, and only half a tank of gas • 형태소 분석 • 용어사전을 이용한 키워드/개체 분석 • Rule기반 문장패턴 인식을 통한 의미 분석 • ML기반의 Classifier • 웹 기반의 전용 화면 • 패싯 검색 / • 빈도/상관, 고급 검색 • 시계열 / 편차 /패싯 쌍 / 연결 • 정형 데이터와 연계 (외부 데이터와 통합 화면) • IBM Cognos Analytic & DSX 연계 • 외부데이터와 연계한 화면을 구성하기 위한 환경 제공 (AppBuilder) • 정형 분석이 가능한 형태로 반출하여 BI솔루션인 Cognos Analytics 및 고급분석 도구인 IBM Data Science Experience에서 활용 RDB IBM Analytics / © 2018 IBM Corporation 11
  • 12. 12 IBMWatsonExplorer는비정형데이터분석에특화된솔루션입니다. 기업내부 • 콜센터, 상담메모, 녹취,… • eMail, 게시판, KMS, ECM • 설비결함 및 정비로그 • 진단 및 처방기록,. 등 기업외부 • SNS(페이스북, 트위터, 밴드,..) • 웹 사이트 • 리서치 기관 자료 • 특허, 논문, 잡지,.. 등 아우~~~~! 너무 귀여운 에스쁘아 미니미 러브코치! 향은 5가지다 물론 좋구요.. 향수라는 느낌보다 엄마가 좋은 향기 넣어 빨래한.스쳐지나갈떄 은은한 향기가나는! 참 좋은 향기였어요 !모든 향기가 대부분 시원했으며. 달콤한 사랑의 향기! 에스쁘아 미니미 일반명사 아우 부사 너무 형용사 귀엽다 수정된명사 귀엽다 … 에스쁘아 긍정적 귀엽다 기타 에스쁘아 명사 시퀸스 에스쁘아 미니 미 러브 일반명사 미니 명사시퀸스 미니 미 러브 코치 일반명사 미 비정형을 정형화 Cognitive View Export전 처리 자연어 분석 기술은 다양한 형태의 대내외 비정형 데이터를 수집, 분석하고 그 분석 결과를 시각화하여 다양한 인사이트를 제공합니다. IBM Analytics / © 2018 IBM Corporation 12
  • 13. 관리자 사용자 분석가 관리 보고서 분석도구 REST 대시보드, 정형보고서 및 검색 Financial Applications Scorecards Planning and Reporting Business Intelligence & Analytics ETL 기업 외부 FTP 기업내부 거버넌스 개발환경 보안 Thumbnail Index Facet Count Sub Index Taxonomy Index Search Index 뉴스 빅데이터 분석서버 Crawler Framework Importer Framework Document Processor Parser Document Generator Annotator UIMA Annotator ExporterCommon Infrastructure Control Monitor Configuration Logging Security Scheduler Raw Data Store Document Cache Crawler Plug-in Crawlers CSV Importer Indexer Service Indexer Export Plug-in Inspector Text Analytics & Search Runtime xx용 수집 DB SNS 뉴스기사 원문 뉴스기사 카테고리 뉴스기사 메타데이터 Crawler 영역 UMIA 분석 엔진 자연어 분석 결과 저장 및 검색 분석 결과 보기 및 API 시스템 설정 / 관리 사용자 인터페이스 WEX서비스구성도
  • 14. 원문보기 패싯트리 (분류맵) 시계열, 편차, 경향등 다양한 시각화 메뉴 연관된 품사 빈도 탐색어와 연관 관계 검색 WEX는직관적인컨텐츠마이너화면을제공합니다 1 2 3 1. WEX Default Facet 데이터 로딩만으로 분석할 수 있음 기본적인 Pattern Discovery 수행 - Part of Speech - Phrase Constituent - Sentiment Expression 2. Structured Data Facet 분석대상 문서와 연계된 메타 정보 비정형 데이터와 연계 insight 도출 - 작성자, 분류, 소분류, 회사명, 브랜드 평가점수,.. 등 3. Analysis Facet 인지 컴퓨팅 기반 분석 목적에 따라 텍스트에서 추출한 분석 관점 - 상품 관점 - 긍정/부정 1 2 3
  • 15. 15 텍스트처리를위한UIMA아키텍처(1/2) Indexer Task Indexer Document Processor Document Generator Index Master Node Document Processor Crawler LinguisticAnalysis LangIdentification Classification Custom Dictionary PatternMatcher NamedEntity Text Extraction Export UIMA ( Unstructured Information Management Architecture ) UIMA pipeline IBM Analytics / © 2018 IBM Corporation 15
  • 16. 16 텍스트처리를위한UIMA아키텍처(2/2) ABC생명 의 가나 연금보험으로 건강한 노후를 준비하세요 Text Analysis ABC생명 고유명사 회사명 상품홍보 형태소 분석 품사 정보 분석 개체명 분석 이벤트 분석 UIMAFramework 의 가나 조사 형용 사 으 로 조사 건강한 형용사 노후 준비하세 요 명사 동사 상품명 연 금 명사 보 험 명사 를 조사 회사명+상품명+’노후 를 준비하세요’ (ABC생명 + 가나 연금 보험 + ‘노후를 준비하세요’) 반복 IBM Analytics / © 2018 IBM Corporation 16
  • 17. AI for your enterprise data Watson Explorer 12(oneWEX)새로운 기능들 IBM Analytics / © 2018 IBM Corporation
  • 18. 18 oneWEX의새로운기능들 • ICP(IBM Cloud Private) 기반 환경의 유연한 확장성 • Docker 컨테이너 기반 환경하에서 마이크로 서비스 기반으로 운영됨 • 새로운 컨텐츠 마이닝과 관리 • LoB 기반의 사용자 인터페이스 • 사용자는 마이닝 히스토리를 • 새로운 마이닝 기법으로 가이드를 제시 • 새로운 개념의 관리 기법 • 데이터 세트와 컬렉션 • 기계 학습 기반의 역량 • 문서 분류(Document Classification) • 상관 관계 기반의 검색(Ranker) IBM Analytics / © 2018 IBM Corporation 18
  • 19. oneWEX아키텍처 • Based on Docker/Kubernetes • Services • Ingestion Service • Crawl and convert • Enrichment Service • Apply annotator per fields • Machine Learning Service • ML based Classifier/Ranker • Exploration Service • Solr based new index/search • Applications • Content Miner • AppBuilder • Admin GUI AppBuilder Content Miner Admin Ingestion Service Enrichment Service Exploration Service M-Learning Service Embedded TensorFlow Embedded HDFS/YARN Solr x ZooKeeper nginx WEX Frontend WEX Ingestion CouchDB Fluentd WEX Plugin IBM Cloud Private (K8s) WEX IngestionWEX Ingestion ZooKeeperZooKeeper Solr xWEX PluginSolr xWEX Plugin Embedded TensorFlow Embedded HDFS/YARN Embedded TensorFlow Embedded HDFS/YARN ICP(IBM Cloud Private) 기반 환경의 유연한 확장성
  • 20. 20 oneWEX서비스구성도 Database File System Data Sources Data Crawler Data Enricher Classifier Runtime Classifier Trainer Labeler Model Labeler Model Classifier Model Data Importer Dataset File Data Converter Miner Application AppBuilder and other Applications DictionaryDictionary Dictionary Custom Annotator Collection Search Analytics Runtime Acquire Analyze and SearchEnrich IBM Analytics / © 2018 IBM Corporation 20 ICP(IBM Cloud Private) 기반 환경의 유연한 확장성
  • 21. 21 Content Miner 인터페이스는 손쉬운 화면, ML 및 AI 기능을 사용하여 일반 사용자 또는 Data Scientist에게 의미 있고 주요 항목을 제시합니다. 컨텐츠 마이너는 분석을위해 사용됩니다 IBM Analytics / © 2018 IBM Corporation 21 새로운 컨텐츠 마이닝과 관리 oneWEX 컨텐츠마이너
  • 22. 22 Analyze: “무엇”뒤에 숨어 있는 “왜”를 이해하게 도와 줍니다 직관적인 UI 워드 클라우드 IBM Analytics / © 2018 IBM Corporation 22 새로운 컨텐츠 마이닝과 관리 oneWEX 컨텐츠마이너
  • 23. 23 Advise: 효과적인의사 결정 가이드 패싯기반 원본문서 보기 IBM Analytics / © 2018 IBM Corporation 23 새로운 컨텐츠 마이닝과 관리 oneWEX 컨텐츠마이너
  • 24. 24 AppBuilder: 전반적인기업 전체의 데이터에서 인사이트를 도출 다양한 대시보드 IBM Analytics / © 2018 IBM Corporation 24 새로운 컨텐츠 마이닝과 관리 oneWEX -360View
  • 25. 25 WEX의기계학습(MachineLearning)기능 새로운 기계 학습기능이 WEX Core엔진에 내장되어 있으며, 이미 다수의 금융권 사례를 통하여 검증된 기능을 제품화 한 솔루션입니다 • 문서 분류(Document Classifier) • 문서 내용 분류에 대한 자동 학습을 통한 문서 분류 • 보험 청구 자동 심사 : 규칙 기반 분류의 모호함을 기계학습 모형으로 보강 • 유사 문서(Ranker) 추천 • 유사 문서에 대한 자동 학습 기반 Ranking • 콜센터 자동 응답 추천 기능 – 주어진 질문 내용에 대해 가장 유사한 답변을 자동 매핑 NLP ML model Classifier Machine Learning Cognitive Advise Document IBM Analytics / © 2018 IBM Corporation 25 기계학습 기반의 역량
  • 26. 26 ML기반의문서분류기능(1/2) Documents Classification by Machine Learning Classification Result (Labels) Politics, Economy, Science, Sports, … "더 빨리 뛰게 하는 신발 기술의 발전은 100미터 달리기 기록의 향상에 기여합니다." Sports Economy ✓ ✗ Science ✗ 자동 분류는 현재 기계 학습 기술의 가장 실용적인 응용 프로그램입니다. ▪ 인간과 비교 : 압도적으로 빠름 ▪ 규칙 기반 분류와 비교 : 충분한 학습 데이터로 높은 정확도와 많은 양의 복잡한 규칙을 관리 할 필요가 없음 IBM Analytics / © 2018 IBM Corporation 26 기계학습 기반의 역량
  • 27. 27 ML기반의문서분류기능(2/2) Content (문서 본문 ) Class Labeling(내용 분류) Three pieces of chocolate missing from a dozen-pack Amount.shortage One cup of mint jelly missing from a 12-p ack Amount.shortage I bought chocolate ice cream, but the insi de of the container was dirty. Is it safe? Package_container.dirt Some juice leaked from the bottom of th e juice pack. Package_container.lear IBM Analytics / © 2018 IBM Corporation 27 기계학습 기반의 역량
  • 28. 28 [ Backup Slide] 문서 분류자 기반 정확도 Training: Run the Trained Model: WEX ML-DC IBM Analytics / © 2018 IBM Corporation 28 기계학습 기반의 역량
  • 29. 29 ML기반의유사문서추천-Sumitomo Mitsui Banking Corp. 학습된 유사문서 기준에 따라 결과 Ranking을 조정 • 비즈니스 요구 사항 ▪ 잦은 이직으로 인한 전문 콜센터 요원의 부족 ▪ 체계화되지 않은 고객 응대로 느린 응답 시간 및 잦은 업무 중단 ▪ 고객 서비스에 대한 업무 개선이 필요 • 소스 데이터 ▪ 운영 매뉴얼, 오류 코드, 지점 정보, 스크립트, FAQ 등 구현 항목 • 상담원은 논의 된 주제를 기반으로 컨텐츠 추천 ▪ 순위가 매겨진 답변 후보군 제시 최상의 정보를 즉각적으로 표시 • NLQ1) 기반의 정보 검색 • ML 적용 • 다국어 지원(일본어, 영어) 확장 ▪ 신용 관리 전문 주제를 포함, 국내 유럽, 미국 고객까지 지원 확대 IBM Analytics / © 2018 IBM Corporation 29 기계학습 기반의 역량
  • 30. 30 확장 : Watson Explorer Integration with DSX Local ▪ WEX 기능은 DSX Local Notebook에서 이용할 수 있습니다. • 비정형 데이터 분석으로 확장: Notebook에서 데이터 분석가는 다양한 라이브러리 (예 : numpy로 숫자 분석)로 구조화 된 데이터를 분석하고 WEX NLP로 구조화되지 않은 데이터를 완벽하게 분석 할 수 있습니다 • Reporting: WEX의 분석 결과는 Notebook으로 시각화 할 수 있으며 데이터 분석가 사이에서 공유 될 수 있습니다. ▪ Cognos Analytics 고객은 Watson Explorer를 활용함으로써 보다 더큰 이익을 얻을 수 있습니다. • Cognos Analytics는 구조화된 데이터에 구조화되지 않은 데이터를 추가하여 분석 및 보고 역량을 확장 할 수 있습니다. • 보고서, 시각화 및 배포를 위해 Watson Explorer 분석내용을 Cognos Analytics로 직접 보낼 수 있습니다. • Watson Explorer는 초기 분석에 사용할 수 있으므로 대용량 데이터 집합을 줄여 Cognos Analytics로 내 보내어 더 많은 사용자가 더 많은 분석과 액세스를 할 수 있습니다. • Watson Explorer는 Cognos Analytics에서 제공하는 "What"뒤에 "Why"에 대한 답을 제공합니다. IBM Analytics / © 2018 IBM Corporation 30 확장성
  • 31. WEX를 정리해보면 좋은 인지적 탐사 및 콘텐츠 분석 요구 사항 • 필요한 데이터를 효율적인 데이터 세트로 관리 • 강력한 자연어 분석 기반 검색 및 분류 • 규칙 기반 학습과 기계 학습 학습의 폭 넓고 유연한 NLP 및 텍스트 분석 • 손쉬운 사용과 강력한 시각화 • 사용을 통한 새로운 인사이트 및 개선 IBM Watson Explorer Explore Analyze Advise IBM Analytics / © 2018 IBM Corporation 31