SlideShare a Scribd company logo
1 of 77
Download to read offline
JEROAN DRONE EMPRIT
NATURAL LANGUAGE PROCESSING,
SENTIMENT ANALYSIS, EMOTION
ANALYSIS, BOT DETECTION,
DEMOGRAPHY ANALYSIS
Ismail Fahmi, Ph.D.
Director PT. Media Kernels Indonesia
a.k.a Drone Emprit
Ismail.fahmi@gmail.com
WORKSHOP
21 MEI 2020
TENTANG DRONE EMPRIT
3
S2-S3
2003 - 2009
UNIVERSITY OF GRONINGEN
NETHERLANDS
4
Developer
2009 - 2014
5
Work Place
HOME
“Moonlighting”
2009 - 2014
6
PHP Perl
Natural Language
ProcessingSOLR
Zend Framework
Machine Learning
“Moonlighting”
2009 - 2014
2014 MEDIA KERNELS
7
News Crawler
Twitter Crawler
Twitter Streaming
FB Page Crawler
Data Pipeline
Data
SOLR Indexer 1 SOLR Indexer 2 SOLR Indexer 3 SOLR Indexer 4
Hadoop Framework
Physical Hardware
Insight
DataIngest
Management&Queue
RealtimeJob
Processing
Google Custom
Search
Database Framework
ScheduledJob
Processing
Map Reduce
Sentiment
Analysis
Other
Processings
Data&Workflow
Management
Access
Visualization
Other sources
Analytics UI
MEDIA KERNELS FEATURES
8
Trends
DASHBOARD
Comparison
Topic Map
NEWS PORTAL
Latest News
Media
ANALYTICS
News Sites
Page Ranks
Sentiment Analysis
PF-Chart
Engagement
Exposure
Retweets
TOPICS
Replies
Most Shared URLs
Most Shared Videos
Topic Map
Word Cloud
Impact
INFLUENCERS
Engagement
Reach
Most Engaged
Followers
Influencer Network
SNA
Topic Network
PR-Values
Reach
Hashtags Posts
Bubble Map
Twitter User Map
DEMOGRAPHY
User Locations
Edit Sentiments
MENTIONS
Training & Learning
Backtracking
Compare SNA
COMPARE
Compare Projects
Popularity vs
Favorability
Background Jobs
Upload Report
REPORTING
Download Report
User Management
ADMIN
Project Management
Client Management
Source Management
Label and Training
OPINION ANALYSIS
Opinion Chart
Insight Explorer
NATURAL LANGUAGE PROCESSING
NATURAL LANGUAGE PROCESSING
10
BASIC TEXT PROCESSING
• Regular Expressions
• Word Tokenization
• Word Normalization and Stemming
• Sentence Segmentation and Decision Trees
• Part-of-speech tagging (POS Tagging)
• Named Entity Recognition (NER)
• Dependency Parser
• Spell Checker
11
LIBRARY ARTIFICIAL INTELLIGENCE
12
KEMAMPUAN SPARK NLP DALAM
TEXT PROCESSING
13
SPARK NLP DAN SPARK ML
14
REQUIREMENT & INSTALLATION
15
CONTOH: NAMED ENTITY RECOGNITION
16
Inisiasi
Input Text
Anotasi (processing)
Tipe output
NER output
NLP DI DRONE EMPRIT / MEDIA KERNELS
ARSITEKTUR SISTEM
Ini adalah gambaran
sistem yang digunakan
untuk membangun
Knowledge Explorer
Indonesia OneSearch
(IOS). Khusus untuk IOS,
sumber datanya adalah
fullteks dalam bentuk
teks abstrak dan file PDF
dari artikel jurnal, tesis,
disertasi, dll.
18
TEKNOLOGI NLP
Teknologi yang digunakan untuk mengekstrak
fakta dari teks menggunakan NLP (Natural
Language Processing), yang meliputi proses-
proses berikut:
• Segmentation
• Part-Of-Speech (POS) Tagging
• Automatic Term Recognition (ATR)
• Named Entity Recognition (NER)
• Term Relationship Extraction
• Syntax Analysis (S-P-O)
19
Contoh: Unstructured Text
20
KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201
KEWALIAN DALAM TASAWUF NUSANTARA
Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat
dalam al-Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi
yang kompleks.
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal
bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian,
wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari
kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan
cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian
dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material
yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi
sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan.
Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali
Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
Segmentation: Paragraph
21
=====page1=====
-----------par----------
KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201
-----------par----------
KEWALIAN DALAM TASAWUF NUSANTARA
-----------par----------
Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al-
Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks.
-----------par----------
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan
dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang
yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai
penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang
sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan
bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi
di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari
sanalah dunia fi sik ini dikendalikan.
-----------par----------
Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali 1 Fakultas
Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
Segmentation: Sentence
22
-----------par----------
Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal
bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua
pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai
implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu.
Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak
lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia
manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi
di balik dunia fisik terdapat dunia metafi sik yang belum banyak diketahui manusia dan
dari sanalah dunia fisik ini dikendalikan.
Part-of-Speech Tagging
23
----------- par ----------
Sementara_SC dalam_IN kajian_NN tasawuf_VB di_IN Nusantara_NNP ,_Z sebutan_NN
wali_NN ini_PR sudah_MD mulai_VB dikenal_VB bersamaan_VB dengan_IN masuknya_X
Islam_NNP ke_IN negeri_NN ini_PR yang_SC mengacu_VB kepada_IN dua_CD
pengertian_NN ,_Z wali_NN sebagai_IN orang_NN yang_SC memiliki_VB kesaktian-
kesaktian_NN -LRB-_-LRB- occulties_FW -RRB-_-RRB- sebagai_IN implikasi_NN dari_IN
kekeramatan_NN dan_CC wali_NN sebagai_IN penguasa_NN wilayah_NN tertentu_PR ._Z
Terlepas_VB dari_IN pengertian_NN dan_CC cakupannya_NN ,_Z ajaran_NN kewalian_NN
yang_SC sesungguhnya_RB tidak_NEG lepas_VB dari_IN ajaran_NN tentang_IN
kenabian_NN dan_CC kerasulan_NN yang_SC menyiratkan_VB pesan_NN bahwa_SC
dunia_NN manusia_NN bukan_NEG hanya_RB dunia_NN material_NN yang_SC identik_JJ
dengan_SC kenikmatan_NN hedonis_JJ ,_Z tetapi_CC di_IN balik_NN dunia_NN fi_X sik_X
terdapat_VB dunia_NN metafi_VB sik_X yang_SC belum_NEG banyak_CD diketahui_VB
manusia_NN dan_CC dari_IN sanalah_NN dunia_NN fi_X sik_X ini_PR dikendalikan_VB ._Z
S-P-O TRIPLE
Grafik di kanan ini adalah tree-map, dari
relasi subyek, predikat, dan obyek yang
berhasil diekstrak dari fullteks.
Manfaat dari tree map ini adalah
pengguna bisa mendapat insight
dengan cepat tentang:
• Aktor person, organisasi, konsep
(subyek)
• Aktifitas terkait dengan aktor
• Obyek atau related entitis terkait
aktivitas subyek.
24
S
P
O
CO-OCCURRENCE ANTAR KONSEP
• Menampilkan aktor, lokasi, dan istilah
penting yang sering muncul
bersamaan (dalam kalimat atau
paragraph yang sama).
• Co-occurrence menjadi indikasi
adanya korelasi yang kuat antar pelaku
dan istilah.
• Namun, jenis korelasinya apa, belum
bisa dilihat di sini.
25
DIRECTED GRAPH
Grafik ini menghubungkan
Subyek dan Obyek yang
saling berhubungan
melalui predikat. Dalam
grafik, predikat ditampilkan
sebagai garis yang
memiliki anak panah, dari
subyek ke obyek.
Relasi antar S dan O
dalam sebuah knowledge
base yang besar bisa
memperlihatkan relasi
dalam lingkup yang lebih
besar.
26
ONTOLOGY GRAPH
Ontology adalah informasi
tentang kategori dan relasi
antar segala sesuatu.
Ontology Graph
menampilkan apakah
sesuatu itu PERSON,
ORG, atau konsep, dan
bagaimana relasinya
dengan sesuatu yang lain.
27
EXPLORER.ONESEARCH.ID
USER INTERFACE
Halaman muka Knowledge
Explorer IOS.
• Tiap folder berisi artikel
yang sudah diproses
menggunakan NLP dan
fact mining.
• Kolom sebelah kiri untuk
pencarian dan filtering.
• Menu di sebelah atas
untuk menampilkan jenis
analisis.
29
SPO TREE REPOSITORI
• Klik salah satu folder.
• Analisis pertama yang
ditampilkan adalah SPO
Tree.
• Di bagian tengah
ditampilkan 30 subyek
yang paling sering muncul
dalam folder repositori.
• Di sisi kanan ditampilkan
daftar artikel, repositori,
institusi, author, dll yang
bisa digunakan untuk
memfilter cakupan
dokumen yang akan
dianalisis.
30
SPO TREE: EXPLORE
• Untuk melihat apa predikat
dari sebuah subyek, klik
subyek yang Anda ingin
ketahui, lalu akan muncul
daftar predikat.
• Dan untuk melihat daftar
obyek, klik predikat,
sehingga ditampilkan SPO
tree seperti di samping.
• Klik obyek, maka akan
tampil halaman dari
dokumen yang berisi triple
SPO tersebut.
31
SPO TREE DOKUMEN
• Untuk melihat SPO Tree
dari sebuah dokumen, klik
judul dokumen di kolom
sebelah kanan.
• Maka grafik akan
diperbarui dengan SPO
yang baru.
32
SEARCH
• Untuk menampilkan
analisis terhadap dokumen
yang mengandung kata
kunci tertentu, masukkan
kata kunci ke dalam kolom
Cari, lalu enter.
• Maka analisis akan
dibatasi pada dokumen
hasil pencarian saja.
33
PROXIMITY
• Secara default, proximity atau
cakupan pencarian dilakukan
pada seluruh dokumen.
• Kita bisa mengubah proximity
menjadi lebih ketat, dengan
memilih cakupan pada kolom
‘Di dalam’:
• Dokumen
• Halaman
• Paragraph
• Kalimat
• Contoh di gambar kanan, untuk
pencarian obligasi kita set
proximity pada level ‘kalimat’.
Artinya, SPO yg ditampilkan
hanya dari kalimat yang
mengandung kata kunci saja.
34
FILTER SPO
• Filter Subyek, Predikat, dan
Obyek berguna untuk
menampilkan relasi SPO yang
mengandung kata kunci dari
kolom yang terkait.
• Contoh, pada kata kunci
obligasi di samping, kita ingin
melihat semua subyek yang
mengandung kata kunci
‘investor’.
35
CO-OCCURRENCE
• Klik menu ‘Co-occurrence’,
maka akan ditampilkan network
graph dari konsep-konsep yang
sering muncul bersamaan
dalam paragraph.
• Contoh untuk kata kunci
‘obligasi’, gambar di samping
memperlihatkan bagaimana
’perusahaan’ sering ditemukan
dengan konsep lain seperti
Investor, struktur modal, pasar
modal, dll.
36
CLUSTERING
• Pilih mode Clustering yang
ingin digunakan. Ada beberapa
pilihan:
• Tanpa cluster
• Institusi
• Repositori
• Dokumen
• Dalam contoh di sampingkita
mengelompokkan cooccurrence
untuk kata kunci ‘obligasi’
berdasarkan Dokumen.
Maksimal kita bisa lihat 5 item
dalam satu perbandingan.
• Dari clusterin ini, kita bisa lihat
dan bandingkan konsep2 utama
yang sering muncul bersamaan
dalam dokumen.
37
NETWORK GRAPH
• Klik menu ‘Network Graph’, dan
akan ditampilkan relasi antara
Subyek dan Object dalam triple
yang berhasil diekstrak dari
dokumen.
• Predikat tidak ditampilkan, dan
ditunjukkan sebagai garis
penghubung saja.
• Pada gambar di samping, kita
lihat Network Graph dari
dokumen yang mengandung
kata kunci ‘obligasi’.
• Tampak mana subyek atau
obyek yang paling dominan
dalam dokumen.
38
NETWORK ACTIVITY GRAPH
• Klik menu ‘Network Activity
Graph’, maka akan ditampilkan
relasi antara Subyek, Predikat,
dan Obyek, yang masing-
masing sebegai node.
• Contoh di samping adalah
Activity graph dari triples yg
ditemukan dalam dokumen
yang mengandung kata kunci
‘obligasi’.
39
SENTIMENT ANALYSIS
Sentiment Analysis
41
Positif
Negatif
Netral
?
MENTIONS
Sentiment Analysis
42
Positif
?
MENTIONS
Untuk Setya Novanto
Sentiment Analysis
43
Negatif?
MENTIONS
Untuk KPK
Sentiment Analysis
44
Netral
?
MENTIONS
Untuk Hakim Cepi Iskandar
Sentiment Analysis Techniques
45
http://www.sciencedirect.com/science/article/pii/S2090447914000550
Evaluasi
46
http://www.sciencedirect.com/science/article/pii/S2090447914000550
”one model for all” tidak bisa
memberi label yang tepat untuk
setiap subyek.
Lexicon base tergantung dari
keberadaan kata dalam kamus sentimen,
tidak bisa memberi label yang tepat
untuk subyek yang berbeda.
Sentiment Analysis Tools
47
https://breakthroughanalysis.com/2012/01/08/what-are-
the-most-powerful-open-source-sentiment-analysis-tools/
Text Mining
Module
Sentiment Analysis: Drone Emprit
48
Adaptive Multiple Models
Training Data
49DOI: 10.1109/ICMLA.2015.22
81.000
EDIT SENTIMENT LABEL (DEA)
50
HASIL SENTIMENT ANALYSIS
51
BACKTRACK & ANALYSIS
52
EMOTION ANALYSIS
PERSEPSI: PEMERINTAH VS PUBLIK
54
Plutchik’s Wheel of Emotions
55
https://www.6seconds.org/2017/04/27/plu
tchiks-model-of-emotions/
LEXICON BASED ANALYSIS
• JOY
• senang, bahagia, suka, seneng, hepi, menyenangkan, happy,
menggembirakan, gembira, fun, sukacita, riang, ceria, …
• TRUST
• FEAR
• SURPRISE
• SADNESS
• DISGUST
• ANGER
• ANTICIPATION
56
EMOTION ANALYSIS DI DEA
57
DEMOGRAPHY ANALYSIS
59
60
GITHUB LIBRARY
61
https://github.com/euagendas/m3inference
DEMOGRAPHY ANALYSIS: DEA
• Fitur ini sudah 80% dikembangkan, dan dalam waktu dekat akan
ditambahkan ke delam dashboard Drone Emprit Academic.
62
BOT ANALYSIS
BOT ANALYSIS DI DEA
64
METODE
65
Botometer
Profile + 200 twits
Bot scores
https://rapidapi.com/OSoMe/api/botometer
API
HOW IT WORKS
• Botometer is a machine learning algorithm trained to classify an
account as bot or human based on tens of thousands of labeled
examples.
• When you check an account, you fetches its public profile and
hundreds of its public tweets and mentions using the Twitter API.
• This data is passed to the Botometer API, which extracts about
1,200 features to characterize the account's profile, friends,
social network structure, temporal activity patterns, language,
and sentiment.
• Finally, the features are used by various machine learning
models to compute the bot scores.
66
VISUALISASI HASIL BOT ANALYSIS
67
HUMAN
CYBORG
ROBOT
REFERENSI BOTOMETER
68
DRONE EMPRIT ACADEMIC
DRONE EMPRIT ACADEMIC
FREE SOCIAL MEDIA (TWITTER) DATA ANALYTICS
70
JOIN DRONE EMPRIT ACADEMIC
https://dea.uii.ac.id
71
HOW IT WORKS
72
STEPS:
• Registration
• Propose keywords
• Analysis and publication
Dashboard
Access
REQUIREMENTS:
• Publish their analysis for public
using any medium.
USERS
• Students
• Researchers
• Lecturers
• Journalists
• Blogger
• Hoax buster
Admin
TOPICS BASED ON SDGs
(Sustainable Development Goals)
73
DRONE EMPRIT ACADEMIC DASHBOARD
74
Saat ini ada
285 project
ANGGOTA DEA
75
69 MEMBER
250 MEMBER
240 MEMBER
559 MEMBER
BOOKS “READING INDONESIA”
76
TERIMAKASIH
Ismail Fahmi, PhD.

More Related Content

What's hot

What's hot (20)

CHATGPT DAN TANTANGAN BAGI OTORITAS KEAGAMAAN
CHATGPT DAN TANTANGAN BAGI OTORITAS KEAGAMAANCHATGPT DAN TANTANGAN BAGI OTORITAS KEAGAMAAN
CHATGPT DAN TANTANGAN BAGI OTORITAS KEAGAMAAN
 
Politik di Media Sosial
Politik di Media SosialPolitik di Media Sosial
Politik di Media Sosial
 
Presentasi Internet Sehat untuk Anak SD
Presentasi Internet Sehat untuk Anak SDPresentasi Internet Sehat untuk Anak SD
Presentasi Internet Sehat untuk Anak SD
 
Literasi Digital - Menjadi Netizen Cerdas
Literasi Digital - Menjadi Netizen CerdasLiterasi Digital - Menjadi Netizen Cerdas
Literasi Digital - Menjadi Netizen Cerdas
 
Literasi Digital untuk Remaja
Literasi Digital untuk RemajaLiterasi Digital untuk Remaja
Literasi Digital untuk Remaja
 
Sosialisasi Internet Sehat dan Aman
Sosialisasi Internet Sehat dan AmanSosialisasi Internet Sehat dan Aman
Sosialisasi Internet Sehat dan Aman
 
Media Digital Kawan atau Lawan
Media Digital Kawan atau LawanMedia Digital Kawan atau Lawan
Media Digital Kawan atau Lawan
 
Struktur Data Tree
Struktur Data TreeStruktur Data Tree
Struktur Data Tree
 
Realitas Demokrasi - Hoaks dan Ujaran Kebencian
Realitas Demokrasi - Hoaks dan Ujaran KebencianRealitas Demokrasi - Hoaks dan Ujaran Kebencian
Realitas Demokrasi - Hoaks dan Ujaran Kebencian
 
Materi 4 (TOT Literasi Digital): Jejak Digital dan Konten Positif
Materi 4 (TOT Literasi Digital): Jejak Digital dan Konten PositifMateri 4 (TOT Literasi Digital): Jejak Digital dan Konten Positif
Materi 4 (TOT Literasi Digital): Jejak Digital dan Konten Positif
 
Influence of Social Media and Mainstream Media in Indonesia
Influence of Social Media and Mainstream Media in IndonesiaInfluence of Social Media and Mainstream Media in Indonesia
Influence of Social Media and Mainstream Media in Indonesia
 
How Big Data Can Impact The Society
How Big Data Can Impact The SocietyHow Big Data Can Impact The Society
How Big Data Can Impact The Society
 
Presentasi Literasi Digital.ppt
Presentasi Literasi Digital.pptPresentasi Literasi Digital.ppt
Presentasi Literasi Digital.ppt
 
Internet Sehat bikin Hebat
Internet Sehat bikin HebatInternet Sehat bikin Hebat
Internet Sehat bikin Hebat
 
literasi digital disekolah.pptx
literasi digital disekolah.pptxliterasi digital disekolah.pptx
literasi digital disekolah.pptx
 
Literasi Digital.pptx
Literasi Digital.pptxLiterasi Digital.pptx
Literasi Digital.pptx
 
Literasi Digital: Membekali Anak Kita dengan Kemampuan Digital
Literasi Digital: Membekali Anak Kita dengan Kemampuan DigitalLiterasi Digital: Membekali Anak Kita dengan Kemampuan Digital
Literasi Digital: Membekali Anak Kita dengan Kemampuan Digital
 
basis data lanjut modul
 basis data lanjut modul basis data lanjut modul
basis data lanjut modul
 
Materi 2 (TOT Literasi Digital): Hati-Hati di Dunia SIber
Materi 2 (TOT Literasi Digital): Hati-Hati di Dunia SIberMateri 2 (TOT Literasi Digital): Hati-Hati di Dunia SIber
Materi 2 (TOT Literasi Digital): Hati-Hati di Dunia SIber
 
Etika dalam menggunakan jejaring sosial
Etika dalam menggunakan jejaring sosialEtika dalam menggunakan jejaring sosial
Etika dalam menggunakan jejaring sosial
 

Similar to Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis

Memantapkan budaya ilmu dalam kalangan pelajar
Memantapkan budaya ilmu dalam kalangan pelajarMemantapkan budaya ilmu dalam kalangan pelajar
Memantapkan budaya ilmu dalam kalangan pelajar
Angah Mzack
 
5822-Article Text-16968-3-10-20200531.pdf
5822-Article Text-16968-3-10-20200531.pdf5822-Article Text-16968-3-10-20200531.pdf
5822-Article Text-16968-3-10-20200531.pdf
TaufikRahman392594
 
Filsafat pendidikan islam
Filsafat pendidikan islamFilsafat pendidikan islam
Filsafat pendidikan islam
Idrus Abidin
 
Makalah aika 3 niken , rani neww
Makalah aika 3 niken , rani newwMakalah aika 3 niken , rani neww
Makalah aika 3 niken , rani neww
rani etika
 

Similar to Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis (20)

Manual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearchManual Explorer Indonesia OneSearch
Manual Explorer Indonesia OneSearch
 
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network AnalysisMembaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
Membaca Peta di Media Sosial Melalui Analisa Teks dan Social Network Analysis
 
Diskusi Repositori Institusi di ITB
Diskusi Repositori Institusi di ITB Diskusi Repositori Institusi di ITB
Diskusi Repositori Institusi di ITB
 
Analisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan OnlineAnalisis Teks Media Sosial dan Online
Analisis Teks Media Sosial dan Online
 
Linguistik Komputasi
Linguistik KomputasiLinguistik Komputasi
Linguistik Komputasi
 
Data Science: Memahami Perilaku Sosial Masyarakat Melalui Medsos
Data Science: Memahami Perilaku Sosial Masyarakat Melalui MedsosData Science: Memahami Perilaku Sosial Masyarakat Melalui Medsos
Data Science: Memahami Perilaku Sosial Masyarakat Melalui Medsos
 
04 agama dan pst
04 agama dan pst 04 agama dan pst
04 agama dan pst
 
Peran Agama Dalam Meningkatkan Iptrk
Peran Agama Dalam Meningkatkan IptrkPeran Agama Dalam Meningkatkan Iptrk
Peran Agama Dalam Meningkatkan Iptrk
 
Memantapkan budaya ilmu dalam kalangan pelajar
Memantapkan budaya ilmu dalam kalangan pelajarMemantapkan budaya ilmu dalam kalangan pelajar
Memantapkan budaya ilmu dalam kalangan pelajar
 
TEORI STRUKTUR SOSIAL DARI RADCLIFFE BROWN DAN LEVI.pptx
TEORI STRUKTUR SOSIAL DARI RADCLIFFE BROWN DAN LEVI.pptxTEORI STRUKTUR SOSIAL DARI RADCLIFFE BROWN DAN LEVI.pptx
TEORI STRUKTUR SOSIAL DARI RADCLIFFE BROWN DAN LEVI.pptx
 
Indonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric AnalysisIndonesia OneSearch dan Biblio Metric Analysis
Indonesia OneSearch dan Biblio Metric Analysis
 
Makalah 03
Makalah 03Makalah 03
Makalah 03
 
Tugasan krb 3063 karya agung melayu
Tugasan krb 3063 karya agung melayuTugasan krb 3063 karya agung melayu
Tugasan krb 3063 karya agung melayu
 
5822-Article Text-16968-3-10-20200531.pdf
5822-Article Text-16968-3-10-20200531.pdf5822-Article Text-16968-3-10-20200531.pdf
5822-Article Text-16968-3-10-20200531.pdf
 
integrasi interkoneksi.docx
integrasi interkoneksi.docxintegrasi interkoneksi.docx
integrasi interkoneksi.docx
 
Ilmu dawkah
Ilmu dawkahIlmu dawkah
Ilmu dawkah
 
Filsafat pendidikan islam
Filsafat pendidikan islamFilsafat pendidikan islam
Filsafat pendidikan islam
 
Pengaruh islam dalam kebudayaan masa kini (iptek dan media sosial)
Pengaruh islam dalam kebudayaan masa kini (iptek dan media sosial)Pengaruh islam dalam kebudayaan masa kini (iptek dan media sosial)
Pengaruh islam dalam kebudayaan masa kini (iptek dan media sosial)
 
Makalah aika 3 niken , rani neww
Makalah aika 3 niken , rani newwMakalah aika 3 niken , rani neww
Makalah aika 3 niken , rani neww
 
Ilmu dawkah dan kom
Ilmu dawkah dan komIlmu dawkah dan kom
Ilmu dawkah dan kom
 

More from Ismail Fahmi

ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
Ismail Fahmi
 

More from Ismail Fahmi (20)

HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
HARNESSING AI FOR ENHANCED MEDIA ANALYSIS A CASE STUDY ON CHATGPT AT DRONE EM...
 
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
RESPONSE NETIZEN ATAS SIDANG PUTUSAN PHPU MK 2024
 
Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024Different Frontiers of Social Media War in Indonesia Elections 2024
Different Frontiers of Social Media War in Indonesia Elections 2024
 
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINEANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
ANALISIS ISU KECURANGAN PEMILU DI MEDIA SOSIAL & ONLINE
 
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
ANALISIS SIREKAP DI MEDIA SOSIAL TWITTER, TIKTOK, YOUTUBE 14-15 FEBRUARI 2024
 
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
SUARA NETIZEN HARI PENCOBLOSAN PEMILU 2024
 
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO  5-12 FEBRUARI 2024
TIGA CAPRES DI DALAM PLATFORM SNACK VIDEO 5-12 FEBRUARI 2024
 
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
DIRTY VOTE TWITTER, NEWS, TIKTOK 10-12 Februari 2024
 
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
UPDATE JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
 
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
JIS VS GBK DALAM KAMPANYE TERAKHIR PILPRES 2024
 
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON PASCA DEBAT DI YOUTUBE 4 - 6 FEBRUARI 2024
 
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
TREN JUMLAH VIDEO PER JAM DI TIKTOK 1 – 5 FEBRUARI 2024
 
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
ANALISIS DEBAT KELIMA CAPRES PEMILU 2024 - 4 FEBRUARI 2024
 
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS  - TWITTER 3 – 4 Februari 2024
ANALISIS PRA DEBAT KELIMA CAPRES PEMILU 2024 NEWS - TWITTER 3 – 4 Februari 2024
 
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI YOUTUBE - 25 JANUARI - 3 FEBRUARI 2024
 
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
ANALISIS KONTEN DAN INTERAKSI KETIGA PASLON DI TIKTOK 1-3 FEBRUARI 2024
 
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
PERBANDINGAN KETIGA PASLON DI TIKTOK - 21 JANUARI - 3 FEBRUARI 2024
 
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
PERBANDINGAN KETIGA PASLON DI INSTAGRAM DARI 21 JAN-3 FEB 2024
 
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAMMUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
MUNDURNYA MAHFUD MD SEBAGAI MENKOPOLHUKAM
 
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
ANALISIS TRENDING TOPIC HARIAN INDONESIA DAN CAPRES 02
 

Jeroan Drone Emprit: NLP, Sentiment, Emotion, Bot, dan Demography Analysis

  • 1. JEROAN DRONE EMPRIT NATURAL LANGUAGE PROCESSING, SENTIMENT ANALYSIS, EMOTION ANALYSIS, BOT DETECTION, DEMOGRAPHY ANALYSIS Ismail Fahmi, Ph.D. Director PT. Media Kernels Indonesia a.k.a Drone Emprit Ismail.fahmi@gmail.com WORKSHOP 21 MEI 2020
  • 3. 3 S2-S3 2003 - 2009 UNIVERSITY OF GRONINGEN NETHERLANDS
  • 6. 6 PHP Perl Natural Language ProcessingSOLR Zend Framework Machine Learning “Moonlighting” 2009 - 2014
  • 7. 2014 MEDIA KERNELS 7 News Crawler Twitter Crawler Twitter Streaming FB Page Crawler Data Pipeline Data SOLR Indexer 1 SOLR Indexer 2 SOLR Indexer 3 SOLR Indexer 4 Hadoop Framework Physical Hardware Insight DataIngest Management&Queue RealtimeJob Processing Google Custom Search Database Framework ScheduledJob Processing Map Reduce Sentiment Analysis Other Processings Data&Workflow Management Access Visualization Other sources Analytics UI
  • 8. MEDIA KERNELS FEATURES 8 Trends DASHBOARD Comparison Topic Map NEWS PORTAL Latest News Media ANALYTICS News Sites Page Ranks Sentiment Analysis PF-Chart Engagement Exposure Retweets TOPICS Replies Most Shared URLs Most Shared Videos Topic Map Word Cloud Impact INFLUENCERS Engagement Reach Most Engaged Followers Influencer Network SNA Topic Network PR-Values Reach Hashtags Posts Bubble Map Twitter User Map DEMOGRAPHY User Locations Edit Sentiments MENTIONS Training & Learning Backtracking Compare SNA COMPARE Compare Projects Popularity vs Favorability Background Jobs Upload Report REPORTING Download Report User Management ADMIN Project Management Client Management Source Management Label and Training OPINION ANALYSIS Opinion Chart Insight Explorer
  • 11. BASIC TEXT PROCESSING • Regular Expressions • Word Tokenization • Word Normalization and Stemming • Sentence Segmentation and Decision Trees • Part-of-speech tagging (POS Tagging) • Named Entity Recognition (NER) • Dependency Parser • Spell Checker 11
  • 13. KEMAMPUAN SPARK NLP DALAM TEXT PROCESSING 13
  • 14. SPARK NLP DAN SPARK ML 14
  • 16. CONTOH: NAMED ENTITY RECOGNITION 16 Inisiasi Input Text Anotasi (processing) Tipe output NER output
  • 17. NLP DI DRONE EMPRIT / MEDIA KERNELS
  • 18. ARSITEKTUR SISTEM Ini adalah gambaran sistem yang digunakan untuk membangun Knowledge Explorer Indonesia OneSearch (IOS). Khusus untuk IOS, sumber datanya adalah fullteks dalam bentuk teks abstrak dan file PDF dari artikel jurnal, tesis, disertasi, dll. 18
  • 19. TEKNOLOGI NLP Teknologi yang digunakan untuk mengekstrak fakta dari teks menggunakan NLP (Natural Language Processing), yang meliputi proses- proses berikut: • Segmentation • Part-Of-Speech (POS) Tagging • Automatic Term Recognition (ATR) • Named Entity Recognition (NER) • Term Relationship Extraction • Syntax Analysis (S-P-O) 19
  • 20. Contoh: Unstructured Text 20 KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201 KEWALIAN DALAM TASAWUF NUSANTARA Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al-Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks. Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan. Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
  • 21. Segmentation: Paragraph 21 =====page1===== -----------par---------- KANZ PHILOSOPHIA, Volume 3, Number 2, December 2013 201 -----------par---------- KEWALIAN DALAM TASAWUF NUSANTARA -----------par---------- Artikel ini mendiskusikan dokrin Kewalian (al-walāyah) yang mempunyai basis yang kuat dalam al- Qur’an dan hadis dan isu ini secara sistematis dibahas melalui ajaran Ibn ‘Arabi yang kompleks. -----------par---------- Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fi sik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fi sik ini dikendalikan. -----------par---------- Kata-kata Kunci : wali, karamah, Nur Muhammad, kewalian, kenabian, penutup para wali 1 Fakultas Ushuluddin, UIN Syarif Hidayatullah. E-mail : yunasrilali@ymail.com
  • 22. Segmentation: Sentence 22 -----------par---------- Sementara dalam kajian tasawuf di Nusantara, sebutan wali ini sudah mulai dikenal bersamaan dengan masuknya Islam ke negeri ini yang mengacu kepada dua pengertian, wali sebagai orang yang memiliki kesaktian-kesaktian (occulties) sebagai implikasi dari kekeramatan dan wali sebagai penguasa wilayah tertentu. Terlepas dari pengertian dan cakupannya, ajaran kewalian yang sesungguhnya tidak lepas dari ajaran tentang kenabian dan kerasulan yang menyiratkan pesan bahwa dunia manusia bukan hanya dunia material yang identik dengan kenikmatan hedonis, tetapi di balik dunia fisik terdapat dunia metafi sik yang belum banyak diketahui manusia dan dari sanalah dunia fisik ini dikendalikan.
  • 23. Part-of-Speech Tagging 23 ----------- par ---------- Sementara_SC dalam_IN kajian_NN tasawuf_VB di_IN Nusantara_NNP ,_Z sebutan_NN wali_NN ini_PR sudah_MD mulai_VB dikenal_VB bersamaan_VB dengan_IN masuknya_X Islam_NNP ke_IN negeri_NN ini_PR yang_SC mengacu_VB kepada_IN dua_CD pengertian_NN ,_Z wali_NN sebagai_IN orang_NN yang_SC memiliki_VB kesaktian- kesaktian_NN -LRB-_-LRB- occulties_FW -RRB-_-RRB- sebagai_IN implikasi_NN dari_IN kekeramatan_NN dan_CC wali_NN sebagai_IN penguasa_NN wilayah_NN tertentu_PR ._Z Terlepas_VB dari_IN pengertian_NN dan_CC cakupannya_NN ,_Z ajaran_NN kewalian_NN yang_SC sesungguhnya_RB tidak_NEG lepas_VB dari_IN ajaran_NN tentang_IN kenabian_NN dan_CC kerasulan_NN yang_SC menyiratkan_VB pesan_NN bahwa_SC dunia_NN manusia_NN bukan_NEG hanya_RB dunia_NN material_NN yang_SC identik_JJ dengan_SC kenikmatan_NN hedonis_JJ ,_Z tetapi_CC di_IN balik_NN dunia_NN fi_X sik_X terdapat_VB dunia_NN metafi_VB sik_X yang_SC belum_NEG banyak_CD diketahui_VB manusia_NN dan_CC dari_IN sanalah_NN dunia_NN fi_X sik_X ini_PR dikendalikan_VB ._Z
  • 24. S-P-O TRIPLE Grafik di kanan ini adalah tree-map, dari relasi subyek, predikat, dan obyek yang berhasil diekstrak dari fullteks. Manfaat dari tree map ini adalah pengguna bisa mendapat insight dengan cepat tentang: • Aktor person, organisasi, konsep (subyek) • Aktifitas terkait dengan aktor • Obyek atau related entitis terkait aktivitas subyek. 24 S P O
  • 25. CO-OCCURRENCE ANTAR KONSEP • Menampilkan aktor, lokasi, dan istilah penting yang sering muncul bersamaan (dalam kalimat atau paragraph yang sama). • Co-occurrence menjadi indikasi adanya korelasi yang kuat antar pelaku dan istilah. • Namun, jenis korelasinya apa, belum bisa dilihat di sini. 25
  • 26. DIRECTED GRAPH Grafik ini menghubungkan Subyek dan Obyek yang saling berhubungan melalui predikat. Dalam grafik, predikat ditampilkan sebagai garis yang memiliki anak panah, dari subyek ke obyek. Relasi antar S dan O dalam sebuah knowledge base yang besar bisa memperlihatkan relasi dalam lingkup yang lebih besar. 26
  • 27. ONTOLOGY GRAPH Ontology adalah informasi tentang kategori dan relasi antar segala sesuatu. Ontology Graph menampilkan apakah sesuatu itu PERSON, ORG, atau konsep, dan bagaimana relasinya dengan sesuatu yang lain. 27
  • 29. USER INTERFACE Halaman muka Knowledge Explorer IOS. • Tiap folder berisi artikel yang sudah diproses menggunakan NLP dan fact mining. • Kolom sebelah kiri untuk pencarian dan filtering. • Menu di sebelah atas untuk menampilkan jenis analisis. 29
  • 30. SPO TREE REPOSITORI • Klik salah satu folder. • Analisis pertama yang ditampilkan adalah SPO Tree. • Di bagian tengah ditampilkan 30 subyek yang paling sering muncul dalam folder repositori. • Di sisi kanan ditampilkan daftar artikel, repositori, institusi, author, dll yang bisa digunakan untuk memfilter cakupan dokumen yang akan dianalisis. 30
  • 31. SPO TREE: EXPLORE • Untuk melihat apa predikat dari sebuah subyek, klik subyek yang Anda ingin ketahui, lalu akan muncul daftar predikat. • Dan untuk melihat daftar obyek, klik predikat, sehingga ditampilkan SPO tree seperti di samping. • Klik obyek, maka akan tampil halaman dari dokumen yang berisi triple SPO tersebut. 31
  • 32. SPO TREE DOKUMEN • Untuk melihat SPO Tree dari sebuah dokumen, klik judul dokumen di kolom sebelah kanan. • Maka grafik akan diperbarui dengan SPO yang baru. 32
  • 33. SEARCH • Untuk menampilkan analisis terhadap dokumen yang mengandung kata kunci tertentu, masukkan kata kunci ke dalam kolom Cari, lalu enter. • Maka analisis akan dibatasi pada dokumen hasil pencarian saja. 33
  • 34. PROXIMITY • Secara default, proximity atau cakupan pencarian dilakukan pada seluruh dokumen. • Kita bisa mengubah proximity menjadi lebih ketat, dengan memilih cakupan pada kolom ‘Di dalam’: • Dokumen • Halaman • Paragraph • Kalimat • Contoh di gambar kanan, untuk pencarian obligasi kita set proximity pada level ‘kalimat’. Artinya, SPO yg ditampilkan hanya dari kalimat yang mengandung kata kunci saja. 34
  • 35. FILTER SPO • Filter Subyek, Predikat, dan Obyek berguna untuk menampilkan relasi SPO yang mengandung kata kunci dari kolom yang terkait. • Contoh, pada kata kunci obligasi di samping, kita ingin melihat semua subyek yang mengandung kata kunci ‘investor’. 35
  • 36. CO-OCCURRENCE • Klik menu ‘Co-occurrence’, maka akan ditampilkan network graph dari konsep-konsep yang sering muncul bersamaan dalam paragraph. • Contoh untuk kata kunci ‘obligasi’, gambar di samping memperlihatkan bagaimana ’perusahaan’ sering ditemukan dengan konsep lain seperti Investor, struktur modal, pasar modal, dll. 36
  • 37. CLUSTERING • Pilih mode Clustering yang ingin digunakan. Ada beberapa pilihan: • Tanpa cluster • Institusi • Repositori • Dokumen • Dalam contoh di sampingkita mengelompokkan cooccurrence untuk kata kunci ‘obligasi’ berdasarkan Dokumen. Maksimal kita bisa lihat 5 item dalam satu perbandingan. • Dari clusterin ini, kita bisa lihat dan bandingkan konsep2 utama yang sering muncul bersamaan dalam dokumen. 37
  • 38. NETWORK GRAPH • Klik menu ‘Network Graph’, dan akan ditampilkan relasi antara Subyek dan Object dalam triple yang berhasil diekstrak dari dokumen. • Predikat tidak ditampilkan, dan ditunjukkan sebagai garis penghubung saja. • Pada gambar di samping, kita lihat Network Graph dari dokumen yang mengandung kata kunci ‘obligasi’. • Tampak mana subyek atau obyek yang paling dominan dalam dokumen. 38
  • 39. NETWORK ACTIVITY GRAPH • Klik menu ‘Network Activity Graph’, maka akan ditampilkan relasi antara Subyek, Predikat, dan Obyek, yang masing- masing sebegai node. • Contoh di samping adalah Activity graph dari triples yg ditemukan dalam dokumen yang mengandung kata kunci ‘obligasi’. 39
  • 46. Evaluasi 46 http://www.sciencedirect.com/science/article/pii/S2090447914000550 ”one model for all” tidak bisa memberi label yang tepat untuk setiap subyek. Lexicon base tergantung dari keberadaan kata dalam kamus sentimen, tidak bisa memberi label yang tepat untuk subyek yang berbeda.
  • 48. Sentiment Analysis: Drone Emprit 48 Adaptive Multiple Models
  • 55. Plutchik’s Wheel of Emotions 55 https://www.6seconds.org/2017/04/27/plu tchiks-model-of-emotions/
  • 56. LEXICON BASED ANALYSIS • JOY • senang, bahagia, suka, seneng, hepi, menyenangkan, happy, menggembirakan, gembira, fun, sukacita, riang, ceria, … • TRUST • FEAR • SURPRISE • SADNESS • DISGUST • ANGER • ANTICIPATION 56
  • 59. 59
  • 60. 60
  • 62. DEMOGRAPHY ANALYSIS: DEA • Fitur ini sudah 80% dikembangkan, dan dalam waktu dekat akan ditambahkan ke delam dashboard Drone Emprit Academic. 62
  • 64. BOT ANALYSIS DI DEA 64
  • 65. METODE 65 Botometer Profile + 200 twits Bot scores https://rapidapi.com/OSoMe/api/botometer API
  • 66. HOW IT WORKS • Botometer is a machine learning algorithm trained to classify an account as bot or human based on tens of thousands of labeled examples. • When you check an account, you fetches its public profile and hundreds of its public tweets and mentions using the Twitter API. • This data is passed to the Botometer API, which extracts about 1,200 features to characterize the account's profile, friends, social network structure, temporal activity patterns, language, and sentiment. • Finally, the features are used by various machine learning models to compute the bot scores. 66
  • 67. VISUALISASI HASIL BOT ANALYSIS 67 HUMAN CYBORG ROBOT
  • 70. DRONE EMPRIT ACADEMIC FREE SOCIAL MEDIA (TWITTER) DATA ANALYTICS 70
  • 71. JOIN DRONE EMPRIT ACADEMIC https://dea.uii.ac.id 71
  • 72. HOW IT WORKS 72 STEPS: • Registration • Propose keywords • Analysis and publication Dashboard Access REQUIREMENTS: • Publish their analysis for public using any medium. USERS • Students • Researchers • Lecturers • Journalists • Blogger • Hoax buster Admin
  • 73. TOPICS BASED ON SDGs (Sustainable Development Goals) 73
  • 74. DRONE EMPRIT ACADEMIC DASHBOARD 74 Saat ini ada 285 project
  • 75. ANGGOTA DEA 75 69 MEMBER 250 MEMBER 240 MEMBER 559 MEMBER