SlideShare a Scribd company logo
1 of 61
Download to read offline
How to do things with ‘BigKinds’
Daemin PARK
Korea Press Foundation
Senior Researcher
1
뉴스 빅데이터와의 만남
Content
키워드 트렌드 기능
How to do things with ‘BigKinds’
2
뉴스 검색 및 인용문 검색 기능
뉴스 빅데이터 분석
뉴스 의미연결망의 분포
뉴스 의미연결망 분석 사례
부록: 자연어처리 성능, 기타 기능
뉴스 빅데이터와의 만남
: 정의, 유형, 특성
3
News Big Data
4
NLP SNA
Raw
Meta
News big data is dirty and dynamic
5
https://namu.wiki/w/무구정광대다라니경
http://www.imdb.com/title/tt0477347/mediaindex?ref_=tt_pv_mi_sm
<BigKinds>: Aggregation & NLP
6
Analysis: Excel, Description, and Degree
7
井上雄彦(1993). < Slam Dunk>. 東京: 週刊少年ジャンプ.
키워드 트렌드 기능
: DB 한계 고려한 기술통계
8
키워드 트렌드 기능
9
키워드 트렌드 다운로드 파일
10
매체별 수집 시기
박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥
재단.
11
데이터 수집 DB, 수집 일
박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥
재단.
12
- 데이터 수집 DB: <빅카인즈>
- 데이터 수집 완료일: 2016년 10월 21일
매체별 기사 수
13
박대민(2016.4.18.). 신문 26년: 150만 건 기사의 뉴스 빅데이터로 본 신문의 역사. <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥재단.
검색 기사의 기술통계
박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥
재단.
14
뉴스 검색 및 인용문 검색 기능
: 다운로드, 전처리
15
뉴스 검색 기능
16
뉴스 검색 다운로드 파일
17
수집된 메타데이터: 뉴스 식별자, 일자, 언론사, 기고자, 제목, 본문
지면: 통합분류1, 통합분류2, 통합분류3
사건/사고: 사건/사고1, 사건/사고2, 사건/사고3
개체명: 인물, 위치, 기관
주제: 키워드, 특성추출 (기사 수준)
뉴스 검색 데이터 변환 및 보완
18
변환
-수집데이터: 뉴스 식별자(ART_ID), 일자(ART_DATE), 언론사(ART_PROVIDER), 기고자(ART_BYLINE), 제목(ART_HEAD), 본문
(ART_CONTENT)
-지면: 통합분류1(ART_CAT1), 통합분류2(ART_CAT2), 통합분류3(ART_CAT3)
-개체명: 인물(ART_PERSON), 위치(ART_LOCATION), 기관(ART_ORGANIZATION)
-주제(기사 수준) : 키워드(ART_TAG1, ART_TAG2, ART_TAG3)
삭제
-사건/사고1, 사건/사고2, 사건/사고3, 특성추출
보완
- 빅카인즈 내 원문 링크: NEWS_LINK
인용문 검색 다운로드 기능
19
인용문 검색 파일
20
수집된 메타데이터: 뉴스 식별자, 일자, 언론사, 제목, 소스, 인용문
지면: 통합분류1, 통합분류2, 통합분류3
사건/사고: 사건/사고1, 사건/사고2, 사건/사고3
주제: 키워드, 특성추출 (인용문 수준)
인용문 검색 Data 변환 및 보완
21
변환
-수집된 메타데이터: 뉴스 식별자(ART_ID), 일자(ART_DATE), 언론사(ART_PROVIDER), 제목(ART_HEAD), 소스(INFOSRC),
인용문(STN_CONTENT)
-지면: 통합분류1(ART_CAT1), 통합분류2(ART_CAT2), 통합분류3(ART_CAT3)
삭제
-사건/사고1, 사건/사고2, 사건/사고3, 키워드, 특성추출
보완
-인용문: SEN_ID(인용문 식별자)
-주제(인용문 수준): SNT_TAG1, SNT_TAG2, SNT_TAG3
-정보원: INFOSRC_PER(정보원 인명), INFOSRC_ORG(정보원 기관), INFOSRC_OCCUPATION(직위/직함)
-주제(기사 수준) : 키워드(ART_TAG1, ART_TAG2, ART_TAG3)
-빅카인즈 내 원문 링크: NEWS_LINK
Edge list
22
Semantic Network Data 생성
Linked list Matrix
Semantic Network Data 생성
박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261.
23
File Naming
24
reference_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xls(또는 xlsx)
edgeList_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx
degree_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx
degreeExponent_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일]_[E].xlsx
degreeUnitPeriod_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일]_[단위 기간]_[디그리 최
소값].xlsx
rank_[순위]__[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xls
description__[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx
뉴스 빅데이터 분석
: 의미연결망 분석
25
- 형태소분석, NER
- 구문분석, 의미분석
- data cleansing
- 프로그램 기획 개발
- Visualization
- 정보원 분석
- 인용문 분석
- 담론분석
- 구조 파악
- Transpose, Diagonal,
Dichotomize
- centrality
01
02
03
04
Crawling NLP, Data cleansing
Semantic Network
Analysis
Discourse Analysis
26
- 데이터 모델링
- 수작업, Crawler, 계약
- 자료는 충분히 많아야
함
Procedure of News Big Data Analytics
빅카인즈
Transformation
27
빅카인즈: 데이터 수집, 자연어처리
뉴스젤리: 탐색적 연구
-형태소분석
- 워드클라우드
넷마이너: 행렬 변환
- file > import
- transform > 2 mode
- comembership-correlation-inner product
- transform > value > diagonal
- analyze > neighbor > degree
UCINET: 파일 포맷 변환
- data > data editor > DL editor
- data format > matrix > save
Analysis & Visualization
28
NETDRAW: 연결망 분석 및 시각화
- file > open > ucinet dl text file > network
(1-mode)
- analysis > centrality measures > set node
sizes by: degree
- properties > nodes > label > size
- properties > lines > size > tie strength
- properties > lines > arrow heads > arrow
heads off, apply to all
-layout > graphic theoretic layout
- layout > ego network
- geodesic distance from ego: 1 or 2
Folder-to-Folder
29
FileNameStandizer
DegreeAnalyzer
EdgelistConverter
Statistics
Ranker
QuoteRanker
DegreeExponent
FragmentAnalyzer
SentenceNetAnalyzer
Consolidator
Partitioner
sen_tag_similar
reference
article_cooccur
sen_src
Big kinds
article
sen_similar
degreesen_network
shortest_path
clique
sen_rank
sen_summary
sen_detail
diameter
sen_main
sen_deg rank
org_deg
tag_degedgelist
src_degdegree
degree rank
org_rank
tag_rank
src_rank
description
org_descrip
tag_descrip
src_descrip
article_descrip
sen_rank
sen_rank_org
sen_rank_tag
sen_rank_src
article_cooccur
sen_cooccur
src_network
org_network
tag_network
뉴스 의미연결망의 분포
: 분석 수준, 두터운 꼬리, 동조화와 파편화
30
Power Law
31
Time Series
박대민(2016). 장기 시계열 내용 분석을 위한 뉴스 빅데이터 분석의 활용 가능성: 100만 건 기사의 정보원과 주제로 본 신문 26년. <한국언론학보>, 60권 5호, 353-407.
32
Level of Analysis
박대민 등(2015) <뉴스 빅데이터 분석 시스템 연구>. 서울: 한국언론진흥재단.
33
Dimension Reduction
Nouns Net News Sources Net
34
Maturity
35
Park, D.M., Kim, G.N., & On, B.W.(under review). Understanding the network fundamentals of the news sources associated with a specific topic.
Information Sciences..
Growth
36
Fat-tailed
연결정도(x축)에 따른 연결정도지수(y축)의 추이
박대민(2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션 이론>, 10권 1호, 295-324.
연결정도(x축)에 따른 연결정도지수(y축)의 추이
37
Synchronization & Fragmentation
38
뉴스 의미연결망 분석 사례
: 정보원, 주제, 정보원-주제
39
Fundamentals of News Source Network
박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261.
21
1
2 3
1
4 5
2 3
1
4 5
40
- 같은 기사에 두 정보원이 직접인용문으로 함께 인용됐을 경우 이 정보원들 간에 서로 의미론적인 관계가 있는 것으로 보고 간접적으로 만드는
준연결망(quasi network)
- 기사공동출현에 의한 관계로 관계 방향이 양방향 내지 무방향인 연결망(undirected graph)
Word Cloud
형태소 분석, 빈도분석 개념어 분석, 의미연결망분석
41
Keyword-centric Network
박대민, 김선호(2015.9.). 청년실업 언론보도와 국민인식. <미디어이슈>, 1권 14호. 서울: 한국언론진흥재단.
42
Keyword-centric Network
43
박대민, 오세욱 (2016.2.). AI 21년: 뉴스 빅데이터로 본 인공지능의 역사. <News Big Data Analytics & Insights>, 1권 2호. 서울: 한국언론진흥재단.
News Source Network: Thoughtless Comments
44
News Source Network Analysis
한겨레동아
박대민(2015). 사실기사의 직접인용에 대한 이중의 타당성 문제의 검토: 동아일보와 한겨레신문의 4대강 추진 논란 기사에 대한 뉴스 정보원 연결망 및 인용문 분석. <한국언론학
보>, 59권 5호, 121-151.
45
Source-Topic Network
박대민(2015.8). 망언의 네트워크: 신문뉴스 빅데이터 분석으로 본 일본 망언보도 10년사. <미디어이슈>, 1권 12호. 서울: 한국언론진흥재단.
46
Attribute
47
박대민 (2016.2.). 지난 10년간 새해 화두는 ‘경쟁력’과 ‘북한’: 신년사 보도에 대한 뉴스 빅데이터 분석으로 본 한국.
<News Big Data Analytics & Insights>, 1권 0호. 서울: 한국언론진흥재단.
Time-series Content Analysis
박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단.
48
Time-series Content Analysis
박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단.
49
Discourse Analysis
박대민(2014) <담론의 금융화: 서민주택담론을 통해 본 한국 금융통치성의 대두>. 서울대학교 사회과학대학원 박사학위논문.
50
Q & A
51
<Interstellar>
부록
: 자연어처리 성능, 기타 기능
52
NLP 성능: 개체명 인식
53
솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
NLP 성능: 지면 분류
54
솔트룩스(2015.10.). 자동분류 정확도 평가결과_1008
NLP 성능: 인용구 추출
55
솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
NLP 성능: 키워드 추출
56
Berlocher, I., Lee, K. I., & Kim, K. (2008, July). TopicRank: bringing insight to users. In Proceedings of the 31st annual international ACM SIGIR conference on
Research and development in information retrieval (pp. 703-704). ACM. ISO 690
NLP 성능: 사건 사고 분류
57
솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
NLP 성능: 감성인식
58
솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
기타: 네트워크 분석
59
기타: 워드클라우드
60
기타: 텍사노미 기반 검색
61

More Related Content

What's hot

News Media Network Analysis: Comparing Media Systems Mathematically
News Media Network Analysis: Comparing Media Systems MathematicallyNews Media Network Analysis: Comparing Media Systems Mathematically
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data AnalyticsDaemin Park
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원datasciencekorea
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형datasciencekorea
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁datasciencekorea
 
Automated discourse analysis with BigKinds and Semantic Network Analyzer
Automated discourse analysis with BigKinds and Semantic Network AnalyzerAutomated discourse analysis with BigKinds and Semantic Network Analyzer
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
 
뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1Newsjelly
 
2016 경주지진 트위터 네트워크 분석
2016 경주지진 트위터 네트워크 분석2016 경주지진 트위터 네트워크 분석
2016 경주지진 트위터 네트워크 분석Han Woo PARK
 
[LLG_Module 1] 데이터 저널리즘
[LLG_Module 1] 데이터 저널리즘[LLG_Module 1] 데이터 저널리즘
[LLG_Module 1] 데이터 저널리즘Newsjelly
 
방송기자협회 - 데이터 저널리즘팀 본격 가동
방송기자협회 - 데이터 저널리즘팀 본격 가동방송기자협회 - 데이터 저널리즘팀 본격 가동
방송기자협회 - 데이터 저널리즘팀 본격 가동Han Woo PARK
 
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석datasciencekorea
 
SNS 빅데이터 분석을 위한 연구문제와 통계
SNS 빅데이터 분석을 위한 연구문제와 통계SNS 빅데이터 분석을 위한 연구문제와 통계
SNS 빅데이터 분석을 위한 연구문제와 통계Han Woo PARK
 
뉴스젤리 - 데이터 저널리즘 비즈니스 모델
뉴스젤리 - 데이터 저널리즘 비즈니스 모델뉴스젤리 - 데이터 저널리즘 비즈니스 모델
뉴스젤리 - 데이터 저널리즘 비즈니스 모델Newsjelly
 
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘빅데이터와 저널리즘의 만남, 빅데이터 저널리즘
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘영제 임
 
데이터저널리즘 국내 Newsjelly
데이터저널리즘 국내 Newsjelly데이터저널리즘 국내 Newsjelly
데이터저널리즘 국내 NewsjellyNewsjelly
 
뉴스젤리 - 데이터저널리즘 이해하기 2
뉴스젤리 - 데이터저널리즘 이해하기 2뉴스젤리 - 데이터저널리즘 이해하기 2
뉴스젤리 - 데이터저널리즘 이해하기 2Newsjelly
 
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색Creative Commons Korea
 
빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2ko donghwi
 
국내 데이터 저널리즘 동향분석
국내 데이터 저널리즘 동향분석국내 데이터 저널리즘 동향분석
국내 데이터 저널리즘 동향분석Newsjelly
 
13주차 뉴스 빅데이터 기반 저널리즘 연구
13주차 뉴스 빅데이터 기반 저널리즘 연구13주차 뉴스 빅데이터 기반 저널리즘 연구
13주차 뉴스 빅데이터 기반 저널리즘 연구Daemin Park
 

What's hot (20)

News Media Network Analysis: Comparing Media Systems Mathematically
News Media Network Analysis: Comparing Media Systems MathematicallyNews Media Network Analysis: Comparing Media Systems Mathematically
News Media Network Analysis: Comparing Media Systems Mathematically
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data Analytics
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
 
Automated discourse analysis with BigKinds and Semantic Network Analyzer
Automated discourse analysis with BigKinds and Semantic Network AnalyzerAutomated discourse analysis with BigKinds and Semantic Network Analyzer
Automated discourse analysis with BigKinds and Semantic Network Analyzer
 
뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1뉴스젤리 - 데이터저널리즘 이해하기 1
뉴스젤리 - 데이터저널리즘 이해하기 1
 
2016 경주지진 트위터 네트워크 분석
2016 경주지진 트위터 네트워크 분석2016 경주지진 트위터 네트워크 분석
2016 경주지진 트위터 네트워크 분석
 
[LLG_Module 1] 데이터 저널리즘
[LLG_Module 1] 데이터 저널리즘[LLG_Module 1] 데이터 저널리즘
[LLG_Module 1] 데이터 저널리즘
 
방송기자협회 - 데이터 저널리즘팀 본격 가동
방송기자협회 - 데이터 저널리즘팀 본격 가동방송기자협회 - 데이터 저널리즘팀 본격 가동
방송기자협회 - 데이터 저널리즘팀 본격 가동
 
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
데이터사이언스학회 5월 세미나 데이터저널리즘과 트위터네트워크 분석
 
SNS 빅데이터 분석을 위한 연구문제와 통계
SNS 빅데이터 분석을 위한 연구문제와 통계SNS 빅데이터 분석을 위한 연구문제와 통계
SNS 빅데이터 분석을 위한 연구문제와 통계
 
뉴스젤리 - 데이터 저널리즘 비즈니스 모델
뉴스젤리 - 데이터 저널리즘 비즈니스 모델뉴스젤리 - 데이터 저널리즘 비즈니스 모델
뉴스젤리 - 데이터 저널리즘 비즈니스 모델
 
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘빅데이터와 저널리즘의 만남, 빅데이터 저널리즘
빅데이터와 저널리즘의 만남, 빅데이터 저널리즘
 
데이터저널리즘 국내 Newsjelly
데이터저널리즘 국내 Newsjelly데이터저널리즘 국내 Newsjelly
데이터저널리즘 국내 Newsjelly
 
뉴스젤리 - 데이터저널리즘 이해하기 2
뉴스젤리 - 데이터저널리즘 이해하기 2뉴스젤리 - 데이터저널리즘 이해하기 2
뉴스젤리 - 데이터저널리즘 이해하기 2
 
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색
[과학기술 오픈 데이터 활용캠프] 5조(NENAYU) - 논문/연구자 상세 검색
 
빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2빅데이터 이용 사례 분석 2
빅데이터 이용 사례 분석 2
 
국내 데이터 저널리즘 동향분석
국내 데이터 저널리즘 동향분석국내 데이터 저널리즘 동향분석
국내 데이터 저널리즘 동향분석
 
13주차 뉴스 빅데이터 기반 저널리즘 연구
13주차 뉴스 빅데이터 기반 저널리즘 연구13주차 뉴스 빅데이터 기반 저널리즘 연구
13주차 뉴스 빅데이터 기반 저널리즘 연구
 

Viewers also liked

Toward a news data science
Toward a news data scienceToward a news data science
Toward a news data scienceDaemin Park
 
Debating Machine: Rule Based News Sentence Network Analysis
Debating Machine: Rule Based News Sentence Network AnalysisDebating Machine: Rule Based News Sentence Network Analysis
Debating Machine: Rule Based News Sentence Network AnalysisDaemin Park
 
Natural language processing of news
Natural language processing of newsNatural language processing of news
Natural language processing of newsDaemin Park
 
대학원생 소셜 네트워크 & 통계 분석 서비스
대학원생 소셜 네트워크 & 통계 분석 서비스 대학원생 소셜 네트워크 & 통계 분석 서비스
대학원생 소셜 네트워크 & 통계 분석 서비스 NSGroup
 
마인즈랩소개자료 20150616
마인즈랩소개자료 20150616마인즈랩소개자료 20150616
마인즈랩소개자료 20150616Taejoon Yoo
 
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용현호 김
 
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표Taejoon Yoo
 
R 프로그래밍 기본 문법
R 프로그래밍 기본 문법R 프로그래밍 기본 문법
R 프로그래밍 기본 문법Terry Cho
 
인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝Jinwon Lee
 
쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전Modulabs
 
catalog
catalogcatalog
catalog? ?
 
Top 8 front desk associate resume samples
Top 8 front desk associate resume samplesTop 8 front desk associate resume samples
Top 8 front desk associate resume samplesdavimores
 
Internal Metrics for Civic Impact | Keith Cerny
Internal Metrics for Civic Impact | Keith CernyInternal Metrics for Civic Impact | Keith Cerny
Internal Metrics for Civic Impact | Keith CernyOPERA America
 
Top 8 1st assistant director resume samples
Top 8 1st assistant director resume samplesTop 8 1st assistant director resume samples
Top 8 1st assistant director resume samplestonychoper5705
 

Viewers also liked (18)

Toward a news data science
Toward a news data scienceToward a news data science
Toward a news data science
 
Debating Machine: Rule Based News Sentence Network Analysis
Debating Machine: Rule Based News Sentence Network AnalysisDebating Machine: Rule Based News Sentence Network Analysis
Debating Machine: Rule Based News Sentence Network Analysis
 
Natural language processing of news
Natural language processing of newsNatural language processing of news
Natural language processing of news
 
대학원생 소셜 네트워크 & 통계 분석 서비스
대학원생 소셜 네트워크 & 통계 분석 서비스 대학원생 소셜 네트워크 & 통계 분석 서비스
대학원생 소셜 네트워크 & 통계 분석 서비스
 
마인즈랩소개자료 20150616
마인즈랩소개자료 20150616마인즈랩소개자료 20150616
마인즈랩소개자료 20150616
 
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용
[Pycon 2015] 오늘 당장 딥러닝 실험하기 제출용
 
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표
20160203_마인즈랩_딥러닝세미나_03 the game changer 딥러닝 유태준대표
 
R 프로그래밍 기본 문법
R 프로그래밍 기본 문법R 프로그래밍 기본 문법
R 프로그래밍 기본 문법
 
인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝인공지능, 기계학습 그리고 딥러닝
인공지능, 기계학습 그리고 딥러닝
 
쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전쫄지말자딥러닝2 - CNN RNN 포함버전
쫄지말자딥러닝2 - CNN RNN 포함버전
 
catalog
catalogcatalog
catalog
 
Evolució del web
Evolució del webEvolució del web
Evolució del web
 
LA GIMNASIA
LA GIMNASIALA GIMNASIA
LA GIMNASIA
 
Top 8 front desk associate resume samples
Top 8 front desk associate resume samplesTop 8 front desk associate resume samples
Top 8 front desk associate resume samples
 
Internal Metrics for Civic Impact | Keith Cerny
Internal Metrics for Civic Impact | Keith CernyInternal Metrics for Civic Impact | Keith Cerny
Internal Metrics for Civic Impact | Keith Cerny
 
DRJ_INVITECARD2015[1]
DRJ_INVITECARD2015[1]DRJ_INVITECARD2015[1]
DRJ_INVITECARD2015[1]
 
Top 8 1st assistant director resume samples
Top 8 1st assistant director resume samplesTop 8 1st assistant director resume samples
Top 8 1st assistant director resume samples
 
От идеи до рабочей MVP
От идеи до рабочей MVPОт идеи до рабочей MVP
От идеи до рабочей MVP
 

Similar to How to do things with 'BigKinds'

7주차 뉴스 정보원 연결망 분석
7주차 뉴스 정보원 연결망 분석7주차 뉴스 정보원 연결망 분석
7주차 뉴스 정보원 연결망 분석Daemin Park
 
News Keyword Centric Network
News Keyword Centric NetworkNews Keyword Centric Network
News Keyword Centric NetworkDaemin Park
 
6주차 의미 연결망 분석 이론
6주차 의미 연결망 분석 이론6주차 의미 연결망 분석 이론
6주차 의미 연결망 분석 이론Daemin Park
 
1.3d Study for Smart Big Board System Development and Management
1.3d Study for Smart Big Board System Development and Management1.3d Study for Smart Big Board System Development and Management
1.3d Study for Smart Big Board System Development and ManagementNAP Events
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1Han Woo PARK
 
11주차 뉴스 중심어 연결망 분석
11주차 뉴스 중심어 연결망 분석11주차 뉴스 중심어 연결망 분석
11주차 뉴스 중심어 연결망 분석Daemin Park
 
부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)Webometrics Class
 
부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)Han Woo PARK
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Jiun Bae
 
News Big Data Analysis - Review
News Big Data Analysis - Review News Big Data Analysis - Review
News Big Data Analysis - Review Daemin Park
 
텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남datasciencekorea
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)Han Woo PARK
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
[2008] 민병국 - 주제검색과 오픈검색 (제안)
[2008] 민병국 - 주제검색과 오픈검색 (제안)[2008] 민병국 - 주제검색과 오픈검색 (제안)
[2008] 민병국 - 주제검색과 오픈검색 (제안)병국 민
 
Webonaver(2012-09-02)
Webonaver(2012-09-02)Webonaver(2012-09-02)
Webonaver(2012-09-02)Han Woo PARK
 
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"Tae Young Kang
 
시맨틱 소셜 네트워크 분석 사례 소개
시맨틱 소셜 네트워크 분석 사례 소개시맨틱 소셜 네트워크 분석 사례 소개
시맨틱 소셜 네트워크 분석 사례 소개webscikorea
 

Similar to How to do things with 'BigKinds' (20)

7주차 뉴스 정보원 연결망 분석
7주차 뉴스 정보원 연결망 분석7주차 뉴스 정보원 연결망 분석
7주차 뉴스 정보원 연결망 분석
 
News Keyword Centric Network
News Keyword Centric NetworkNews Keyword Centric Network
News Keyword Centric Network
 
6주차 의미 연결망 분석 이론
6주차 의미 연결망 분석 이론6주차 의미 연결망 분석 이론
6주차 의미 연결망 분석 이론
 
1.3d Study for Smart Big Board System Development and Management
1.3d Study for Smart Big Board System Development and Management1.3d Study for Smart Big Board System Development and Management
1.3d Study for Smart Big Board System Development and Management
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1
 
11주차 뉴스 중심어 연결망 분석
11주차 뉴스 중심어 연결망 분석11주차 뉴스 중심어 연결망 분석
11주차 뉴스 중심어 연결망 분석
 
부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)
 
부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)부록2 node xl 메뉴얼(11aug2011)
부록2 node xl 메뉴얼(11aug2011)
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
Memento
MementoMemento
Memento
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보
 
News Big Data Analysis - Review
News Big Data Analysis - Review News Big Data Analysis - Review
News Big Data Analysis - Review
 
텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남텍스톰을 이용한 SNA 분석 -전채남
텍스톰을 이용한 SNA 분석 -전채남
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
[2008] 민병국 - 주제검색과 오픈검색 (제안)
[2008] 민병국 - 주제검색과 오픈검색 (제안)[2008] 민병국 - 주제검색과 오픈검색 (제안)
[2008] 민병국 - 주제검색과 오픈검색 (제안)
 
Webonaver(2012-09-02)
Webonaver(2012-09-02)Webonaver(2012-09-02)
Webonaver(2012-09-02)
 
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
 
시맨틱 소셜 네트워크 분석 사례 소개
시맨틱 소셜 네트워크 분석 사례 소개시맨틱 소셜 네트워크 분석 사례 소개
시맨틱 소셜 네트워크 분석 사례 소개
 

More from Daemin Park

박대민(2019) 미디어 스타트업 투자 연결망 분석
박대민(2019) 미디어 스타트업 투자 연결망 분석박대민(2019) 미디어 스타트업 투자 연결망 분석
박대민(2019) 미디어 스타트업 투자 연결망 분석Daemin Park
 
8 week: Technology of Platformless Media Blockchain
8 week: Technology of Platformless Media Blockchain8 week: Technology of Platformless Media Blockchain
8 week: Technology of Platformless Media BlockchainDaemin Park
 
7주차: 플랫폼리스 미디어 블록체인 모형
7주차: 플랫폼리스 미디어 블록체인 모형7주차: 플랫폼리스 미디어 블록체인 모형
7주차: 플랫폼리스 미디어 블록체인 모형Daemin Park
 
Steemit and Governance for Creators (2019-S: Media Blockchain)
Steemit and Governance for Creators (2019-S: Media Blockchain)Steemit and Governance for Creators (2019-S: Media Blockchain)
Steemit and Governance for Creators (2019-S: Media Blockchain)Daemin Park
 
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)Daemin Park
 
4주차: 플랫폼리스 미디어 블록체인
4주차: 플랫폼리스 미디어 블록체인4주차: 플랫폼리스 미디어 블록체인
4주차: 플랫폼리스 미디어 블록체인Daemin Park
 
Platformless Mediablockchain (2019-S: Media Blockchain)
Platformless Mediablockchain (2019-S: Media Blockchain) Platformless Mediablockchain (2019-S: Media Blockchain)
Platformless Mediablockchain (2019-S: Media Blockchain) Daemin Park
 
Media Innovation Ecosystem (2019-S: Media Blockchain)
Media Innovation Ecosystem (2019-S: Media Blockchain) Media Innovation Ecosystem (2019-S: Media Blockchain)
Media Innovation Ecosystem (2019-S: Media Blockchain) Daemin Park
 
세션 3-2: 도시에도 OS가 필요하다 (홍주석)
세션 3-2: 도시에도 OS가 필요하다 (홍주석)세션 3-2: 도시에도 OS가 필요하다 (홍주석)
세션 3-2: 도시에도 OS가 필요하다 (홍주석)Daemin Park
 
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)Daemin Park
 
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)세션 3-1: 지역방송의 크로스미디어 전략 (하현제)
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)Daemin Park
 
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)Daemin Park
 
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)Daemin Park
 
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)Daemin Park
 
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)Daemin Park
 
10주차 뉴스 정보원-주제 연결망 분석
10주차 뉴스 정보원-주제 연결망 분석10주차 뉴스 정보원-주제 연결망 분석
10주차 뉴스 정보원-주제 연결망 분석Daemin Park
 
9주차 뉴스 주제 연결망 분석
9주차 뉴스 주제 연결망 분석9주차 뉴스 주제 연결망 분석
9주차 뉴스 주제 연결망 분석Daemin Park
 
5주차 인용문 수준의 뉴스 자연어처리와 시각화
5주차 인용문 수준의 뉴스 자연어처리와 시각화5주차 인용문 수준의 뉴스 자연어처리와 시각화
5주차 인용문 수준의 뉴스 자연어처리와 시각화Daemin Park
 
4주차 뉴스 기사 수준의 자연어처리와 시각화
4주차 뉴스 기사 수준의 자연어처리와 시각화4주차 뉴스 기사 수준의 자연어처리와 시각화
4주차 뉴스 기사 수준의 자연어처리와 시각화Daemin Park
 
3주차: 빅카인즈의 이용과 전처리
3주차: 빅카인즈의 이용과 전처리3주차: 빅카인즈의 이용과 전처리
3주차: 빅카인즈의 이용과 전처리Daemin Park
 

More from Daemin Park (20)

박대민(2019) 미디어 스타트업 투자 연결망 분석
박대민(2019) 미디어 스타트업 투자 연결망 분석박대민(2019) 미디어 스타트업 투자 연결망 분석
박대민(2019) 미디어 스타트업 투자 연결망 분석
 
8 week: Technology of Platformless Media Blockchain
8 week: Technology of Platformless Media Blockchain8 week: Technology of Platformless Media Blockchain
8 week: Technology of Platformless Media Blockchain
 
7주차: 플랫폼리스 미디어 블록체인 모형
7주차: 플랫폼리스 미디어 블록체인 모형7주차: 플랫폼리스 미디어 블록체인 모형
7주차: 플랫폼리스 미디어 블록체인 모형
 
Steemit and Governance for Creators (2019-S: Media Blockchain)
Steemit and Governance for Creators (2019-S: Media Blockchain)Steemit and Governance for Creators (2019-S: Media Blockchain)
Steemit and Governance for Creators (2019-S: Media Blockchain)
 
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)
6 week: Cryptoeconomics over the mechanism design (2019-S: Media Blockchain)
 
4주차: 플랫폼리스 미디어 블록체인
4주차: 플랫폼리스 미디어 블록체인4주차: 플랫폼리스 미디어 블록체인
4주차: 플랫폼리스 미디어 블록체인
 
Platformless Mediablockchain (2019-S: Media Blockchain)
Platformless Mediablockchain (2019-S: Media Blockchain) Platformless Mediablockchain (2019-S: Media Blockchain)
Platformless Mediablockchain (2019-S: Media Blockchain)
 
Media Innovation Ecosystem (2019-S: Media Blockchain)
Media Innovation Ecosystem (2019-S: Media Blockchain) Media Innovation Ecosystem (2019-S: Media Blockchain)
Media Innovation Ecosystem (2019-S: Media Blockchain)
 
세션 3-2: 도시에도 OS가 필요하다 (홍주석)
세션 3-2: 도시에도 OS가 필요하다 (홍주석)세션 3-2: 도시에도 OS가 필요하다 (홍주석)
세션 3-2: 도시에도 OS가 필요하다 (홍주석)
 
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)
세션 3-3 로컬 크리에이터, 힙스터인가 혁신가인가 (김혁주)
 
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)세션 3-1: 지역방송의 크로스미디어 전략 (하현제)
세션 3-1: 지역방송의 크로스미디어 전략 (하현제)
 
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)
 
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)
 
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)
 
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)
세션 1-1: 블록체인 환경에서 미디어의 미래전략연구(김상호)
 
10주차 뉴스 정보원-주제 연결망 분석
10주차 뉴스 정보원-주제 연결망 분석10주차 뉴스 정보원-주제 연결망 분석
10주차 뉴스 정보원-주제 연결망 분석
 
9주차 뉴스 주제 연결망 분석
9주차 뉴스 주제 연결망 분석9주차 뉴스 주제 연결망 분석
9주차 뉴스 주제 연결망 분석
 
5주차 인용문 수준의 뉴스 자연어처리와 시각화
5주차 인용문 수준의 뉴스 자연어처리와 시각화5주차 인용문 수준의 뉴스 자연어처리와 시각화
5주차 인용문 수준의 뉴스 자연어처리와 시각화
 
4주차 뉴스 기사 수준의 자연어처리와 시각화
4주차 뉴스 기사 수준의 자연어처리와 시각화4주차 뉴스 기사 수준의 자연어처리와 시각화
4주차 뉴스 기사 수준의 자연어처리와 시각화
 
3주차: 빅카인즈의 이용과 전처리
3주차: 빅카인즈의 이용과 전처리3주차: 빅카인즈의 이용과 전처리
3주차: 빅카인즈의 이용과 전처리
 

How to do things with 'BigKinds'

  • 1. How to do things with ‘BigKinds’ Daemin PARK Korea Press Foundation Senior Researcher 1
  • 2. 뉴스 빅데이터와의 만남 Content 키워드 트렌드 기능 How to do things with ‘BigKinds’ 2 뉴스 검색 및 인용문 검색 기능 뉴스 빅데이터 분석 뉴스 의미연결망의 분포 뉴스 의미연결망 분석 사례 부록: 자연어처리 성능, 기타 기능
  • 3. 뉴스 빅데이터와의 만남 : 정의, 유형, 특성 3
  • 4. News Big Data 4 NLP SNA Raw Meta
  • 5. News big data is dirty and dynamic 5 https://namu.wiki/w/무구정광대다라니경 http://www.imdb.com/title/tt0477347/mediaindex?ref_=tt_pv_mi_sm
  • 7. Analysis: Excel, Description, and Degree 7 井上雄彦(1993). < Slam Dunk>. 東京: 週刊少年ジャンプ.
  • 8. 키워드 트렌드 기능 : DB 한계 고려한 기술통계 8
  • 11. 매체별 수집 시기 박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥 재단. 11
  • 12. 데이터 수집 DB, 수집 일 박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥 재단. 12 - 데이터 수집 DB: <빅카인즈> - 데이터 수집 완료일: 2016년 10월 21일
  • 13. 매체별 기사 수 13 박대민(2016.4.18.). 신문 26년: 150만 건 기사의 뉴스 빅데이터로 본 신문의 역사. <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥재단.
  • 14. 검색 기사의 기술통계 박대민, 김옥태 (2016.12.5.). 뉴스 빅데이터로 본 아동 보도 20년: ‘결식아동’에서 ‘성범죄’를 거쳐 ‘아동학대’로 . <News Big Data Analytics & Insights>, 1권 4호. 서울: 한국언론진흥 재단. 14
  • 15. 뉴스 검색 및 인용문 검색 기능 : 다운로드, 전처리 15
  • 17. 뉴스 검색 다운로드 파일 17 수집된 메타데이터: 뉴스 식별자, 일자, 언론사, 기고자, 제목, 본문 지면: 통합분류1, 통합분류2, 통합분류3 사건/사고: 사건/사고1, 사건/사고2, 사건/사고3 개체명: 인물, 위치, 기관 주제: 키워드, 특성추출 (기사 수준)
  • 18. 뉴스 검색 데이터 변환 및 보완 18 변환 -수집데이터: 뉴스 식별자(ART_ID), 일자(ART_DATE), 언론사(ART_PROVIDER), 기고자(ART_BYLINE), 제목(ART_HEAD), 본문 (ART_CONTENT) -지면: 통합분류1(ART_CAT1), 통합분류2(ART_CAT2), 통합분류3(ART_CAT3) -개체명: 인물(ART_PERSON), 위치(ART_LOCATION), 기관(ART_ORGANIZATION) -주제(기사 수준) : 키워드(ART_TAG1, ART_TAG2, ART_TAG3) 삭제 -사건/사고1, 사건/사고2, 사건/사고3, 특성추출 보완 - 빅카인즈 내 원문 링크: NEWS_LINK
  • 20. 인용문 검색 파일 20 수집된 메타데이터: 뉴스 식별자, 일자, 언론사, 제목, 소스, 인용문 지면: 통합분류1, 통합분류2, 통합분류3 사건/사고: 사건/사고1, 사건/사고2, 사건/사고3 주제: 키워드, 특성추출 (인용문 수준)
  • 21. 인용문 검색 Data 변환 및 보완 21 변환 -수집된 메타데이터: 뉴스 식별자(ART_ID), 일자(ART_DATE), 언론사(ART_PROVIDER), 제목(ART_HEAD), 소스(INFOSRC), 인용문(STN_CONTENT) -지면: 통합분류1(ART_CAT1), 통합분류2(ART_CAT2), 통합분류3(ART_CAT3) 삭제 -사건/사고1, 사건/사고2, 사건/사고3, 키워드, 특성추출 보완 -인용문: SEN_ID(인용문 식별자) -주제(인용문 수준): SNT_TAG1, SNT_TAG2, SNT_TAG3 -정보원: INFOSRC_PER(정보원 인명), INFOSRC_ORG(정보원 기관), INFOSRC_OCCUPATION(직위/직함) -주제(기사 수준) : 키워드(ART_TAG1, ART_TAG2, ART_TAG3) -빅카인즈 내 원문 링크: NEWS_LINK
  • 22. Edge list 22 Semantic Network Data 생성 Linked list Matrix
  • 23. Semantic Network Data 생성 박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261. 23
  • 24. File Naming 24 reference_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xls(또는 xlsx) edgeList_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx degree_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx degreeExponent_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일]_[E].xlsx degreeUnitPeriod_[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일]_[단위 기간]_[디그리 최 소값].xlsx rank_[순위]__[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xls description__[노드 유형]_[시작 매체]_[끝 매체]_[시작 지면]_[끝 지면]_[시작 일]_[끝 일].xlsx
  • 25. 뉴스 빅데이터 분석 : 의미연결망 분석 25
  • 26. - 형태소분석, NER - 구문분석, 의미분석 - data cleansing - 프로그램 기획 개발 - Visualization - 정보원 분석 - 인용문 분석 - 담론분석 - 구조 파악 - Transpose, Diagonal, Dichotomize - centrality 01 02 03 04 Crawling NLP, Data cleansing Semantic Network Analysis Discourse Analysis 26 - 데이터 모델링 - 수작업, Crawler, 계약 - 자료는 충분히 많아야 함 Procedure of News Big Data Analytics 빅카인즈
  • 27. Transformation 27 빅카인즈: 데이터 수집, 자연어처리 뉴스젤리: 탐색적 연구 -형태소분석 - 워드클라우드 넷마이너: 행렬 변환 - file > import - transform > 2 mode - comembership-correlation-inner product - transform > value > diagonal - analyze > neighbor > degree UCINET: 파일 포맷 변환 - data > data editor > DL editor - data format > matrix > save
  • 28. Analysis & Visualization 28 NETDRAW: 연결망 분석 및 시각화 - file > open > ucinet dl text file > network (1-mode) - analysis > centrality measures > set node sizes by: degree - properties > nodes > label > size - properties > lines > size > tie strength - properties > lines > arrow heads > arrow heads off, apply to all -layout > graphic theoretic layout - layout > ego network - geodesic distance from ego: 1 or 2
  • 30. 뉴스 의미연결망의 분포 : 분석 수준, 두터운 꼬리, 동조화와 파편화 30
  • 32. Time Series 박대민(2016). 장기 시계열 내용 분석을 위한 뉴스 빅데이터 분석의 활용 가능성: 100만 건 기사의 정보원과 주제로 본 신문 26년. <한국언론학보>, 60권 5호, 353-407. 32
  • 33. Level of Analysis 박대민 등(2015) <뉴스 빅데이터 분석 시스템 연구>. 서울: 한국언론진흥재단. 33
  • 34. Dimension Reduction Nouns Net News Sources Net 34
  • 35. Maturity 35 Park, D.M., Kim, G.N., & On, B.W.(under review). Understanding the network fundamentals of the news sources associated with a specific topic. Information Sciences..
  • 37. Fat-tailed 연결정도(x축)에 따른 연결정도지수(y축)의 추이 박대민(2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션 이론>, 10권 1호, 295-324. 연결정도(x축)에 따른 연결정도지수(y축)의 추이 37
  • 39. 뉴스 의미연결망 분석 사례 : 정보원, 주제, 정보원-주제 39
  • 40. Fundamentals of News Source Network 박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261. 21 1 2 3 1 4 5 2 3 1 4 5 40 - 같은 기사에 두 정보원이 직접인용문으로 함께 인용됐을 경우 이 정보원들 간에 서로 의미론적인 관계가 있는 것으로 보고 간접적으로 만드는 준연결망(quasi network) - 기사공동출현에 의한 관계로 관계 방향이 양방향 내지 무방향인 연결망(undirected graph)
  • 41. Word Cloud 형태소 분석, 빈도분석 개념어 분석, 의미연결망분석 41
  • 42. Keyword-centric Network 박대민, 김선호(2015.9.). 청년실업 언론보도와 국민인식. <미디어이슈>, 1권 14호. 서울: 한국언론진흥재단. 42
  • 43. Keyword-centric Network 43 박대민, 오세욱 (2016.2.). AI 21년: 뉴스 빅데이터로 본 인공지능의 역사. <News Big Data Analytics & Insights>, 1권 2호. 서울: 한국언론진흥재단.
  • 44. News Source Network: Thoughtless Comments 44
  • 45. News Source Network Analysis 한겨레동아 박대민(2015). 사실기사의 직접인용에 대한 이중의 타당성 문제의 검토: 동아일보와 한겨레신문의 4대강 추진 논란 기사에 대한 뉴스 정보원 연결망 및 인용문 분석. <한국언론학 보>, 59권 5호, 121-151. 45
  • 46. Source-Topic Network 박대민(2015.8). 망언의 네트워크: 신문뉴스 빅데이터 분석으로 본 일본 망언보도 10년사. <미디어이슈>, 1권 12호. 서울: 한국언론진흥재단. 46
  • 47. Attribute 47 박대민 (2016.2.). 지난 10년간 새해 화두는 ‘경쟁력’과 ‘북한’: 신년사 보도에 대한 뉴스 빅데이터 분석으로 본 한국. <News Big Data Analytics & Insights>, 1권 0호. 서울: 한국언론진흥재단.
  • 48. Time-series Content Analysis 박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단. 48
  • 49. Time-series Content Analysis 박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단. 49
  • 50. Discourse Analysis 박대민(2014) <담론의 금융화: 서민주택담론을 통해 본 한국 금융통치성의 대두>. 서울대학교 사회과학대학원 박사학위논문. 50
  • 53. NLP 성능: 개체명 인식 53 솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
  • 54. NLP 성능: 지면 분류 54 솔트룩스(2015.10.). 자동분류 정확도 평가결과_1008
  • 55. NLP 성능: 인용구 추출 55 솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
  • 56. NLP 성능: 키워드 추출 56 Berlocher, I., Lee, K. I., & Kim, K. (2008, July). TopicRank: bringing insight to users. In Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval (pp. 703-704). ACM. ISO 690
  • 57. NLP 성능: 사건 사고 분류 57 솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5
  • 58. NLP 성능: 감성인식 58 솔트룩스(2015.7.). 언어자원 구축 지침서_V1.5