SlideShare a Scribd company logo
1 of 37
빅데이터와 기술 트렌드
            그리고

“강남스타일”과 타겟마케팅

       Youngwhan Lee, Ph. D.
        전화: 010-7997-0345
    이메일: nicklee@konkuk.ac.kr
   Facebook: Youngwhan Nick Lee
         Twitter: nicklee002




               1
Internet Today
2012:
•   Social Media: Facebook (1 Billion Monthly Active Users)
•   문자 발명후 2003년까지 5 엑사 바이트  2012년 현재 매일 7 엑사바이트 데이터 생성 중
•   Is “big data” a big pile of garbage?




                  빅데이터 상에서의 마케팅은?




                                                        1-2
목차
1. 웹의 진화
     – 지식/정보 추출 기술
2.   롱테일 현상과 산업
3.   데이터의 웹: Linked Open Data (LOD)
4.   큐레이션
5.   소셜미디어 분석
     – 예: 강남스타일과 시사점
빅 데이터 생성

• 개인 정보
 – 크레딧 카드 사용
 – 스마트 폰
   • 위치 기반 서비스 앱
 – 의료 센서
 – 인터넷 사용
   • 게임
   • 검색
   • 소셜 미디어 – Facebook, Twitter, Pinterest, …
• 공공 정보
 – 각종 공공 센서
 – 각종 정부 기관의 활동
웹의 진화
빅데이터 처리와 정보/지식 추출 기술
Aggregation




                                    지식구조화                LOD

                                           RIF                                     큐레이션
                                        SPARQ
                                           L
                                            OWL
                                       RDF

            NoSQL                               데이터 마이닝
           MapReduce
        Cloud Computing                           XML

          R-DBMS

                                                                                                            Understanding




                   Modified, based on Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
정보/지식 추출 기술
• 정보 검색
  – SEO(Search Engine Optimization) PageRank, EdgeRank
• Data Mining: 프로그램에 의한 정보(지식) 추출 가능
  – 통계분석, Rule-based Analysis, 신경망 분석
  – Visualization
• 지식공학 이용
  – RDF/OWL 사용한 온톨로지(Ontology) 연결
  – Raw Data 연결하고 분석 가능하도록 개방 (Linked Open Data; LOD)
  – 프로그램에 의한 논리분석 가능한 지식 추출
     • SPARQL
     • RIF(Rule-based Interface Framework)

• 인간의 힘 이용: 큐레이션
  – 인간의 눈과 지식을 이용하여 정보에 의미를 부여하고 필터하고 종합하는
    작업
     • 예: blog, pinterest.com, videocooki.com, storify.com, scoop.it, curated.by
롱테일 현상과 산업
Pareto’s Law

                  Longtail




Bighead
Longtail Phenomena in IT
                                              The Long Tail by Chris Anderson (Wired, Oct. ´04) adopted to
                                                                                     information domains




                                            Longtail Application Universe


                                            Mobile Apps
                                                     iPhone Apps
Popularity




                                                     Android Apps
                                            SNS Apps
                                                     Facebook Apps
                                                     Twitter Apps
                                            LOD Apps
                                                     Medical Apps
                                                     공공 정보 활용 Apps
                                                     …

                                    …
                                        …                      …                      …




             Bighead Applications
The Birth of New Industries
• “In fact, we get the standards right, we believe this can be a big engine
for the economic growth of the country.”
                              - White House CIO

(http://www.whitehouse.gov/blog/2009/12/08/promoting-
transparency-government)




President Obama’s big hopes

• 공개정보 계획안: Open Government Initiative (2009)

• 빅데이터 R&D 계획안: Big Data R&D Initiative (2012)
Linked Open Data (LOD) 프로젝트
What are the Problems with the Web?
• Not easy to find information
   – “Data Mining” gives an answer of 30 Million Pages
• No way to find the information that I want
   – How can you find the pianist name of a song that is
     being played in the radio?
• Search results cannot be connected
   – Companies that got venture capital investment more
     than $1 Billions that is related Pyramidal Neurons
   – Landlocked countries the population more than 10
     Millions
• Vocabulary sensitive
   – River that flows into Atlantic ocean?
• Data, information or knowledge that I am interested
  does not find me real-time
The Web of Data

• 기술의 변화
  – 하이퍼 텍스트에서 하이퍼데이터로
  – 시맨틱 웹 레이어의 개발
    • LOD
      – Tim Berners-Lee’s 4 Principles
      – LOD clouds began exploding



• Giant Global Graph (GGG)
Linked Open Data (LOD) Principles
    Linking Open Data (LOD) is to connect and to open data to public
    A little history of LOD Project
         Tim Berners-Lee proposed LOD(Linking Open Data) project (2006)
         Since the proposal, numerous countries and organizations participated, caused LOD to
          explode in terms of the number of data
               Wikipedia  DBpedia (www.dbpedia.org)
               Bio2RDF project opened in 27 fields of Biology, Genetics, Medical-related, of which the
                data sets are about 2.3 billions (Bio2RDF.org) (2008.10)
               BBC announced to participate LOD project (www.bbc.org), now one of the institutes
                actively utilizing the data
               US Data.gov released 5 billion data triples
               US Library of Congress announced to join LOD project.
                (http://id.loc.gov/authorities/sh85042531#concept)
               NY Times ( data.nytimes.com) release their data of 150 years of publication (2009.10)
               US Whitehouse release a plan to open data in RDF (2009.11)


                          1.    Use URIs as names for things
     4 Principles         2.    Use HTTP URIs
       of LOD             3.    When someone looks up a URI, provide useful information
                          4.    Include links to other URIs
Linked Open Data (LOD) Principles
Change of Web Structure



                    유저 인터페이스

인간을 위한
웹 페이지 연결            웹페이지 연결 버스




                    유저 인터페이스

 인간을 위한
               웹페이지 연결 버스
 웹 페이지 연결

                          매쉬업
              매쉬업

 컴퓨터를 위한
                      웹데이터 연결 버스
 웹 데이터 연결


                     17
Mar., 2008
May, 2007                    Sep., 2008




                July, 2009
SPARQL Example: To Query Wikipedia




          DBPedia SPARQL Endpoint
SPARQL Example: To Query Neuro Commons
큐레이션
Curation Services
Social Data Curation
Video Curation
소셜미디어 분석
Gloor’s Coolhunting
Gloor’s Coolhunting




소셜네트워크 분석을 통하여 트렌드 분석(Coolhunting)뿐만이
    아니고 트렌드 창출(Coolfarming)도 가능하다
전희주: 텔레콤 이탈고객 분석

■   양방향 해지자 네트워크 분석




                            • Color: 해지일자 별 표현
                                     (빨간색->보라색: 해지일자 선->
                            후)
                            • Shape: 십자가 모양 (이탈유발자)
                             - Connector 및 Broker 역할 점수가 평
                               균점수보다 모두 높은 고객
                            • Size: 연령 (20대 ~ 50대 분포)
                            • Label: 해지일자




    <그림 1> 102명 해지자들 간의 네트워 해지유발자를 찾아낼 수 있다
       소셜 네트워크 분석을 통하여
                                                             29
    크
                                  출처: 2012 하계 통계학회 2012-11
예: 강남스타일과 시사점
오빤 강남 스타일
• 8억 클릭 육박 중.
    •2012년 7월 15일 뮤직비디오 공개

    • 2012년 8월 24일, 40(+40)일 경과: 5000만 뷰

    • 2012년 9월 4일, 52 (+11)일 경과: 1억 뷰

    • 2012년 9월 12일, 60 (+8)일 경과: 1.5억 뷰

    • 2012년 9월 18일, 66(+6)일 경과: 2억 뷰

    • 2012년 9월 26일, 74일 경과: 3억 뷰

    • 2012년 10월 20일, 98일 경과: 5억 284만 뷰

    • 2012년 11월 20일, 128일 경과: 7억 704만 뷰

•       참고) 역대 유투브 조회수

    –   1위: 저스틴 비버의 ‘Baby’ 7억 9105만 건

    –   2위: 제니퍼 로페즈의 ‘On the floor’ 6억 1072만 건
SM Town 트위팅 3/3 ~ 3/9
트위터 id           Betweenness
allkpop               0.14915
icontaec              0.05684
mama_risaa            0.04227
yeolbong              0.03491
mikcat39              0.03056
ponponn91             0.01750
bigbangupdates        0.02072
dunia_kpopers         0.01920
ariearien             0.01875
2ne1global            0.01850
instiz_ichart         0.01446
taeccool              0.01137
soompi_bigbang        0.01060
yuuuukaap             0.00903
su_sunshine           0.00947
soompi                0.00948
koreanchingu          0.01063
lovelytaec            0.01034
younggirls97          0.00753
소녀시대 트위팅 3/3 ~ 3/9
                     트위터 id     Betweenness
               smtown_snsd           0.18733
               soshified             0.08696
               soal_kpop             0.08263
               yurui912              0.06552
               dunia_kpopers         0.03794
               ggkwonyuri_           0.03667
               we_lovekorea          0.03364
               ccpacilli             0.02858
               oniontaker            0.02562
               allkpop               0.02676
               abckpop_              0.02306
               egghead0              0.02190
               diiahottest           0.01963
               youtube               0.01661
               mikifujisaki          0.01597
               processic             0.01546
               kpopers_family        0.01478
               snsd_news             0.01222
               niakanyaa             0.01280
강남스타일 트위팅 11/3 ~ 11/5
트위터 id            Betweenness
psy                    0.40147
ellemca                0.15645
only5guysonly1d        0.10259
duckbelieber97         0.08064
davtinmodel            0.06590
laura_stubbsx          0.06070
laraheleno             0.05797
fernandoponcejr        0.04981
delylachen_ii          0.04234
kayliesimmons          0.03671
geekstoremx            0.03172
timeswagbiebs          0.02865
itsmaylinsofia_        0.02664
youtube                0.02585
ultrakpop              0.02335
justinbieber           0.02329
conqueruniverse        0.02321
taylorswift13          0.02292
staystronghope         0.02130
“강남 스타일” Twitters
기술 수용 주기와 캐즘 이론
  VISIONARIES      PRAGMATISTS
  “Follow their    “Stay with the
  own dictates”        herd”
소녀시대 / SM Town
                  강남 스타일 Twitters
   Twitters
향후 연구

• 소셜네트워크 분석과 LOD의 접목
 – 사용 단어 분석에 온톨로지를 사용하여 분석의
   정밀성 제고
 – Foaf 등을 이용한 소셜 네트워크 관계성 정밀 분
   석
• 강남스타일 및 한류스타 트윗 정밀 분석
 – 트윗 패턴 및 트위터 성향 분석



         감사합니다

More Related Content

Similar to 빅데이터와 타겟 마케팅 Ver 1 0

공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할Konkuk University
 
Social big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective IntelligenceSocial big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective Intelligencekang Anthony
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012Daum DNA
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료Hyun Namgoong
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력현주 유
 
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원Center for Teaching and Learning
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked dataymchu88
 
01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유Industrial Bank of Korea
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 datasciencekorea
 
뉴미수정본(Ver3)
뉴미수정본(Ver3)뉴미수정본(Ver3)
뉴미수정본(Ver3)Juyoung An
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)Hong-Seok Kim
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안메가트렌드랩 megatrendlab
 

Similar to 빅데이터와 타겟 마케팅 Ver 1 0 (20)

공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할공공정보의 개방활용의 필요성과 역할
공공정보의 개방활용의 필요성과 역할
 
Social big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective IntelligenceSocial big data - Collaboration & Collective Intelligence
Social big data - Collaboration & Collective Intelligence
 
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
빅데이터 기반 공공 데이터 서비스 동향 | Devon 2012
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력빅 데이터, 새로운 통찰력
빅 데이터, 새로운 통찰력
 
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
e-learning 3.0 시대, SNS 기반 차세대 e-러닝 플랫폼의 발전 방향 : 삶과 학습의 경계를 허물다 - 박춘원
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked data
 
공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략
 
01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유01.소셜 큐레이션 서비스가 각광받는 이유
01.소셜 큐레이션 서비스가 각광받는 이유
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환 데이터시장의 트렌드와 예측 - 이영환
데이터시장의 트렌드와 예측 - 이영환
 
뉴미수정본(Ver3)
뉴미수정본(Ver3)뉴미수정본(Ver3)
뉴미수정본(Ver3)
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향
 
건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안건설분야에서의 빅데이터 활용의 잠재적 가치제안
건설분야에서의 빅데이터 활용의 잠재적 가치제안
 

More from Konkuk University

비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언Konkuk University
 
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508Konkuk University
 
금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제Konkuk University
 
Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Konkuk University
 
시민의코딩(주) 소개서 Ver. 1.3
시민의코딩(주) 소개서 Ver. 1.3시민의코딩(주) 소개서 Ver. 1.3
시민의코딩(주) 소개서 Ver. 1.3Konkuk University
 
소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1Konkuk University
 
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )Konkuk University
 
Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Konkuk University
 
Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Konkuk University
 
웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약Konkuk University
 

More from Konkuk University (10)

비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언비대면인증의 성공적 정착을 위한 제언
비대면인증의 성공적 정착을 위한 제언
 
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
핀테크를 통한 여신금융업계의 대응과 가치 창출 방안 여신금융 여름호 1508
 
금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제금융 보안사고 트렌드와 정부 금융사들의 과제
금융 보안사고 트렌드와 정부 금융사들의 과제
 
Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend Lessons Learned from Lod Failure and Big Data : The Future Trend
Lessons Learned from Lod Failure and Big Data : The Future Trend
 
시민의코딩(주) 소개서 Ver. 1.3
시민의코딩(주) 소개서 Ver. 1.3시민의코딩(주) 소개서 Ver. 1.3
시민의코딩(주) 소개서 Ver. 1.3
 
소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1소셜미디어 사용 해외사례 Ver 1 1
소셜미디어 사용 해외사례 Ver 1 1
 
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )
하이텍크 마케팅 - 컬트 브랜딩 ( Hightech Marketing - Cult brainding )
 
Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)Smart gov 3 소통과 공유의 원칙 (최종)
Smart gov 3 소통과 공유의 원칙 (최종)
 
Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종Smart gov 3 소통과 공유의 원칙 최종
Smart gov 3 소통과 공유의 원칙 최종
 
웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약웹 3.0 세상을 바꾸고 있다 요약
웹 3.0 세상을 바꾸고 있다 요약
 

빅데이터와 타겟 마케팅 Ver 1 0

  • 1. 빅데이터와 기술 트렌드 그리고 “강남스타일”과 타겟마케팅 Youngwhan Lee, Ph. D. 전화: 010-7997-0345 이메일: nicklee@konkuk.ac.kr Facebook: Youngwhan Nick Lee Twitter: nicklee002 1
  • 2. Internet Today 2012: • Social Media: Facebook (1 Billion Monthly Active Users) • 문자 발명후 2003년까지 5 엑사 바이트  2012년 현재 매일 7 엑사바이트 데이터 생성 중 • Is “big data” a big pile of garbage? 빅데이터 상에서의 마케팅은? 1-2
  • 3. 목차 1. 웹의 진화 – 지식/정보 추출 기술 2. 롱테일 현상과 산업 3. 데이터의 웹: Linked Open Data (LOD) 4. 큐레이션 5. 소셜미디어 분석 – 예: 강남스타일과 시사점
  • 4. 빅 데이터 생성 • 개인 정보 – 크레딧 카드 사용 – 스마트 폰 • 위치 기반 서비스 앱 – 의료 센서 – 인터넷 사용 • 게임 • 검색 • 소셜 미디어 – Facebook, Twitter, Pinterest, … • 공공 정보 – 각종 공공 센서 – 각종 정부 기관의 활동
  • 6. 빅데이터 처리와 정보/지식 추출 기술 Aggregation 지식구조화 LOD RIF 큐레이션 SPARQ L OWL RDF NoSQL 데이터 마이닝 MapReduce Cloud Computing XML R-DBMS Understanding Modified, based on Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
  • 7. 정보/지식 추출 기술 • 정보 검색 – SEO(Search Engine Optimization) PageRank, EdgeRank • Data Mining: 프로그램에 의한 정보(지식) 추출 가능 – 통계분석, Rule-based Analysis, 신경망 분석 – Visualization • 지식공학 이용 – RDF/OWL 사용한 온톨로지(Ontology) 연결 – Raw Data 연결하고 분석 가능하도록 개방 (Linked Open Data; LOD) – 프로그램에 의한 논리분석 가능한 지식 추출 • SPARQL • RIF(Rule-based Interface Framework) • 인간의 힘 이용: 큐레이션 – 인간의 눈과 지식을 이용하여 정보에 의미를 부여하고 필터하고 종합하는 작업 • 예: blog, pinterest.com, videocooki.com, storify.com, scoop.it, curated.by
  • 9. Pareto’s Law Longtail Bighead
  • 10. Longtail Phenomena in IT The Long Tail by Chris Anderson (Wired, Oct. ´04) adopted to information domains Longtail Application Universe Mobile Apps  iPhone Apps Popularity  Android Apps SNS Apps  Facebook Apps  Twitter Apps LOD Apps  Medical Apps  공공 정보 활용 Apps  … … … … … Bighead Applications
  • 11. The Birth of New Industries • “In fact, we get the standards right, we believe this can be a big engine for the economic growth of the country.” - White House CIO (http://www.whitehouse.gov/blog/2009/12/08/promoting- transparency-government) President Obama’s big hopes • 공개정보 계획안: Open Government Initiative (2009) • 빅데이터 R&D 계획안: Big Data R&D Initiative (2012)
  • 12. Linked Open Data (LOD) 프로젝트
  • 13. What are the Problems with the Web? • Not easy to find information – “Data Mining” gives an answer of 30 Million Pages • No way to find the information that I want – How can you find the pianist name of a song that is being played in the radio? • Search results cannot be connected – Companies that got venture capital investment more than $1 Billions that is related Pyramidal Neurons – Landlocked countries the population more than 10 Millions • Vocabulary sensitive – River that flows into Atlantic ocean? • Data, information or knowledge that I am interested does not find me real-time
  • 14. The Web of Data • 기술의 변화 – 하이퍼 텍스트에서 하이퍼데이터로 – 시맨틱 웹 레이어의 개발 • LOD – Tim Berners-Lee’s 4 Principles – LOD clouds began exploding • Giant Global Graph (GGG)
  • 15. Linked Open Data (LOD) Principles Linking Open Data (LOD) is to connect and to open data to public  A little history of LOD Project  Tim Berners-Lee proposed LOD(Linking Open Data) project (2006)  Since the proposal, numerous countries and organizations participated, caused LOD to explode in terms of the number of data  Wikipedia  DBpedia (www.dbpedia.org)  Bio2RDF project opened in 27 fields of Biology, Genetics, Medical-related, of which the data sets are about 2.3 billions (Bio2RDF.org) (2008.10)  BBC announced to participate LOD project (www.bbc.org), now one of the institutes actively utilizing the data  US Data.gov released 5 billion data triples  US Library of Congress announced to join LOD project. (http://id.loc.gov/authorities/sh85042531#concept)  NY Times ( data.nytimes.com) release their data of 150 years of publication (2009.10)  US Whitehouse release a plan to open data in RDF (2009.11) 1. Use URIs as names for things 4 Principles 2. Use HTTP URIs of LOD 3. When someone looks up a URI, provide useful information 4. Include links to other URIs
  • 16. Linked Open Data (LOD) Principles
  • 17. Change of Web Structure 유저 인터페이스 인간을 위한 웹 페이지 연결 웹페이지 연결 버스 유저 인터페이스 인간을 위한 웹페이지 연결 버스 웹 페이지 연결 매쉬업 매쉬업 컴퓨터를 위한 웹데이터 연결 버스 웹 데이터 연결 17
  • 18. Mar., 2008 May, 2007 Sep., 2008 July, 2009
  • 19.
  • 20. SPARQL Example: To Query Wikipedia DBPedia SPARQL Endpoint
  • 21. SPARQL Example: To Query Neuro Commons
  • 28. Gloor’s Coolhunting 소셜네트워크 분석을 통하여 트렌드 분석(Coolhunting)뿐만이 아니고 트렌드 창출(Coolfarming)도 가능하다
  • 29. 전희주: 텔레콤 이탈고객 분석 ■ 양방향 해지자 네트워크 분석 • Color: 해지일자 별 표현 (빨간색->보라색: 해지일자 선-> 후) • Shape: 십자가 모양 (이탈유발자) - Connector 및 Broker 역할 점수가 평 균점수보다 모두 높은 고객 • Size: 연령 (20대 ~ 50대 분포) • Label: 해지일자 <그림 1> 102명 해지자들 간의 네트워 해지유발자를 찾아낼 수 있다 소셜 네트워크 분석을 통하여 29 크 출처: 2012 하계 통계학회 2012-11
  • 31. 오빤 강남 스타일 • 8억 클릭 육박 중. •2012년 7월 15일 뮤직비디오 공개 • 2012년 8월 24일, 40(+40)일 경과: 5000만 뷰 • 2012년 9월 4일, 52 (+11)일 경과: 1억 뷰 • 2012년 9월 12일, 60 (+8)일 경과: 1.5억 뷰 • 2012년 9월 18일, 66(+6)일 경과: 2억 뷰 • 2012년 9월 26일, 74일 경과: 3억 뷰 • 2012년 10월 20일, 98일 경과: 5억 284만 뷰 • 2012년 11월 20일, 128일 경과: 7억 704만 뷰 • 참고) 역대 유투브 조회수 – 1위: 저스틴 비버의 ‘Baby’ 7억 9105만 건 – 2위: 제니퍼 로페즈의 ‘On the floor’ 6억 1072만 건
  • 32. SM Town 트위팅 3/3 ~ 3/9 트위터 id Betweenness allkpop 0.14915 icontaec 0.05684 mama_risaa 0.04227 yeolbong 0.03491 mikcat39 0.03056 ponponn91 0.01750 bigbangupdates 0.02072 dunia_kpopers 0.01920 ariearien 0.01875 2ne1global 0.01850 instiz_ichart 0.01446 taeccool 0.01137 soompi_bigbang 0.01060 yuuuukaap 0.00903 su_sunshine 0.00947 soompi 0.00948 koreanchingu 0.01063 lovelytaec 0.01034 younggirls97 0.00753
  • 33. 소녀시대 트위팅 3/3 ~ 3/9 트위터 id Betweenness smtown_snsd 0.18733 soshified 0.08696 soal_kpop 0.08263 yurui912 0.06552 dunia_kpopers 0.03794 ggkwonyuri_ 0.03667 we_lovekorea 0.03364 ccpacilli 0.02858 oniontaker 0.02562 allkpop 0.02676 abckpop_ 0.02306 egghead0 0.02190 diiahottest 0.01963 youtube 0.01661 mikifujisaki 0.01597 processic 0.01546 kpopers_family 0.01478 snsd_news 0.01222 niakanyaa 0.01280
  • 34. 강남스타일 트위팅 11/3 ~ 11/5 트위터 id Betweenness psy 0.40147 ellemca 0.15645 only5guysonly1d 0.10259 duckbelieber97 0.08064 davtinmodel 0.06590 laura_stubbsx 0.06070 laraheleno 0.05797 fernandoponcejr 0.04981 delylachen_ii 0.04234 kayliesimmons 0.03671 geekstoremx 0.03172 timeswagbiebs 0.02865 itsmaylinsofia_ 0.02664 youtube 0.02585 ultrakpop 0.02335 justinbieber 0.02329 conqueruniverse 0.02321 taylorswift13 0.02292 staystronghope 0.02130
  • 36. 기술 수용 주기와 캐즘 이론 VISIONARIES PRAGMATISTS “Follow their “Stay with the own dictates” herd” 소녀시대 / SM Town 강남 스타일 Twitters Twitters
  • 37. 향후 연구 • 소셜네트워크 분석과 LOD의 접목 – 사용 단어 분석에 온톨로지를 사용하여 분석의 정밀성 제고 – Foaf 등을 이용한 소셜 네트워크 관계성 정밀 분 석 • 강남스타일 및 한류스타 트윗 정밀 분석 – 트윗 패턴 및 트위터 성향 분석 감사합니다

Editor's Notes

  1. To run for real: http://dbpedia.org/sparqlPREFIX type: &lt;http://dbpedia.org/class/yago/&gt;PREFIX prop: &lt;http://dbpedia.org/property/&gt;SELECT ?country_name ?populationWHERE { ?country a type:LandlockedCountries ;rdfs:label ?country_name ;prop:populationEstimate ?population . FILTER (?population &gt; 15000000 &amp;&amp; langMatches(lang(?country_name), &quot;EN&quot;)) .} ORDER BY DESC(?population)