SlideShare a Scribd company logo
1 of 30
Download to read offline
Data- ja
informaatioanalytiikka
5.4.2016
Sosiaalisen median analytiikka
TkT Jari Jussila
Big Data transaktioista interaktioihin
WEB
BIG DATA
Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013
ERP
CRM
ostotiedot
maksutiedot
segmentointi
tarjoustiedot
asiakaskohtaamiset
tukikontaktit
weblogit
tarjoushistoria A/B testaaminen
Dynaaminen
hinnoittelu
Hakukonemarkkinointi
ja optimointi
Mainosverkostot
Käyttäytymispohjainen
kohdentaminen
Dynaamiset
funnellit
Ulkopuolinen demografia
Kuvat ja videot
Puheen muuttaminen tekstiksi
Feedit
Anturi/sensoridata
Tuote / palvelu logit
SMS/MMS
Käyttäjien luoma sisältö
Mobiilidata
Klikkivirran analyysi
Sijaintidata
Sosiaaliset verkostot
Sosiaalinen mediaSentimentti
Sentimenttianalyysi
Sentiment Analysis
Sentimenttianalyysi
PositiivinenNeutraaliNegatiivinen
Esimerkki Twitter keskusteluiden
sentimenttianalyysista
Lähde: NEMO Sentiment & Data analyzer
Sentimentti aikajana
esityksenä
Lähde: NEMO Sentiment & Data analyzer
TOP 10 henkilöä viestien
määrän suhteen
Lähde: NEMO Sentiment & Data analyzer
Mitä hyötyä voisi olla
sentimenttianalyysistä?
Viikkoharjoitus 4:
Tee-se-itse sentimenttianalyysi
•  Vaihtoehtoja sentimenttianalyysin tekemiseen
a)  Analytiikkasovellukset (advanced analytics)
•  SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html
•  SPSS Text Analytics for Surveys
http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys
•  RapidMiner https://rapidminer.com/solutions/sentiment-analysis/
b)  Sosiaalisen median analytiikkasovellukset
•  Hootsuite https://hootsuite.com/products/insights
•  Meltwater http://www.meltwater.com/fi/
•  …
c)  Sentimenttianalyysisovellukset
•  NEMO Sentiment & Data analyzer http://seda.cloudapp.net/
•  SentiStrenght http://sentistrength.wlv.ac.uk/
•  …
d)  Ohjelmalliset lähestymistavat
•  R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/
•  Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/
•  …
9/6
Sentimenttianalyysi live
demo
Sentiment Analysis in Tableau
using R
Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s
Sentimenttianalyysia
Tableaussa käyttäen R
•  Asenna seuraavat ohjelmistot:
–  R https://www.r-project.org/
–  Rstudio https://www.rstudio.com/
•  ja tarvittavat R-kirjastot
–  TM, NLP ja Rserve
–  Rstem
https://cran.r-project.org/src/contrib/Archive/Rstem/
–  Sentiment
https://cran.r-project.org/src/contrib/Archive/
sentiment/
Ota kirjastot käyttöön ja käynnistä
R palvelu (run.Rserve)
Yhdistä Tableau ja R (Manage R
Connection)
Luo Tableaussa uusi
laskennallinen kenttä
•  SCRIPT_STR('classify_polarity(.arg1,algorith
m="bayes", verbose=TRUE)[,
4]',ATTR([Text]))
Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/
Verkostoanalyysi
Social Network Analysis (SNA)
Solmut, yhteydet ja verkostot
Tähti
Ympyrä
Ketju
Maksimaalisen keskittynyt,
kaikki solmut jäsentyvät
yhden keskeisen solmun
ympärille
Keskittyneisyys äärimmäisen
vähäinen, solmut kytkeytyvät
toisiinsa ilman, että yksikään
solmu olisi keskeisempi kuin
toinen
Löyhempi kuin tähti,
mutta keskittyneempi
kuin ympyrä
0 1 1 1 1 1 1
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
1 0 0 0 0 0 0
0 1 0 0 0 0 1
1 0 1 0 0 0 0
0 1 0 1 0 0 0
0 0 0 1 0 1 0
0 0 0 0 1 0 1
1 0 0 0 0 1 0
0 1 1 0 0 0 0
1 0 0 1 0 0 0
1 0 0 0 1 0 0
0 1 0 0 0 1 0
0 0 1 0 0 0 1
0 0 0 1 0 0 0
0 0 0 0 1 0 0
18/6
Verkostojen anatomia
Keskeisempiä käsitteitä
liittyen verkostoanalyysiin
19
KESKEISYYS ARVOSTUS
TÄRKEYS
Lähde: Wasserman & Faust 1994
Keskeisyysaste Läheisyys Degree
Prestige
Proximity
Prestige
Välillisyys Informaation
keskeisyys
Status or Rank
Prestige
•  Keskeisyysaste (degree)
•  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin
toimijoihin
•  Jos verkostoaineisto on suunnattu, voidaan laskea
erikseen lähettäjäkeskeisyys (outdegree) ja
vastaanottajakeskeisyys (indegree)
•  Keskeisyysastetta läheinen indeksi on ego tiheys (ego
density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys
on suhdeluku toimijan suorista yhteyksistä kaikkiin
mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.
20
Keskeisyysaste (asteluku)
Lähde: Wasserman & Faust 1994
•  Ideana on, että toimija on keskeinen jos se kykenee
nopeasti vuorovaikutukseen muiden kanssa
•  Läheisyys (closeness) on toimijan lyhyimpien polkujen
summa kaikkiin verkoston muihin toimijoihin
•  dij on lyhyimmän polun pituus i:n ja j:n välillä
•  Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä
pistettä
∑=
=
n
ij
iji dc
Läheisyys
Lähde: Wasserman & Faust 1994
•  Välillisyys (betweenness) mittaa, kuinka monen
toimijaparin välisen lyhyimmän polun varrelle toimija
sijoittuu
•  Jos piste sijaitsee useiden muiden pisteiden välillä, se
pystyy säätelemään esim. tiedon kulkua näiden välillä
(portinvartijat)
•  Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen
välillisyys voi silti olla hyvin suuri
22
Välillisyys
Lähde: Wasserman & Faust 1994
Viikkoharjoitus 3:
Tee-se-itse Twitter verkostoanalyysi
– markkinoinnin näkökulmasta
•  Asenna seuraavat ohjelmistot
– Anaconda Python 2.7
https://www.continuum.io/downloads
– Gephi https://gephi.org/
•  Kerää data
– Tätä varten tarvii luoda Twitter sovellus (App)
https://apps.twitter.com/
– Nouda twiitit käyttäen seuraavaa skriptiä
https://github.com/jukkahuhtamaki/pcm-demo/
tree/master/twitter-api
Hyödynnetään #ohsiha
oppeja ja työkaluja
Ohjelmallinen sisällönhallinta 2016
Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016
Valitse itselle/ryhmälle
mieleinen firma/organisaatio
Muokkaa Python koodia
Spyderillä ja aja se
Avaa gexf (Graph Exchange
XML Format) tiedosto Gephillä
Laske verkostometriikat ja
visualisoi verkosto
Kiitokset
•  Jukka Huhtamäki @jnkka #ohsiha
•  Harri Jalonen @Jalonen #nemohanke
•  Jayesh Gupta @jyshgupta

More Related Content

More from Jari Jussila

Social media analysis and document based research
Social media analysis and document based researchSocial media analysis and document based research
Social media analysis and document based researchJari Jussila
 
Social media impact after publishing
Social media impact after publishingSocial media impact after publishing
Social media impact after publishingJari Jussila
 
Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Jari Jussila
 
Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Jari Jussila
 
Literature review on customer emotions in social media
Literature review on customer emotions in social mediaLiterature review on customer emotions in social media
Literature review on customer emotions in social mediaJari Jussila
 
SAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiSAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiJari Jussila
 
Deeva project introduction
Deeva project introductionDeeva project introduction
Deeva project introductionJari Jussila
 
Digitaalinen arvonluonti - tunneympyräsovellus
Digitaalinen arvonluonti -  tunneympyräsovellusDigitaalinen arvonluonti -  tunneympyräsovellus
Digitaalinen arvonluonti - tunneympyräsovellusJari Jussila
 
Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Jari Jussila
 
A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes Jari Jussila
 
Big social data analytics - social network analysis
Big social data analytics - social network analysis Big social data analytics - social network analysis
Big social data analytics - social network analysis Jari Jussila
 
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Jari Jussila
 
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusSosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusJari Jussila
 
Computational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workComputational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workJari Jussila
 
Someanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaSomeanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaJari Jussila
 
Value assessment of e-government service from municipality perspective
Value assessment of e-government service from municipality perspectiveValue assessment of e-government service from municipality perspective
Value assessment of e-government service from municipality perspectiveJari Jussila
 
Workathlon24 oivalluksia
Workathlon24 oivalluksiaWorkathlon24 oivalluksia
Workathlon24 oivalluksiaJari Jussila
 
Teknologia, tunteet ja hyvinvointi työssä
Teknologia, tunteet ja hyvinvointi työssäTeknologia, tunteet ja hyvinvointi työssä
Teknologia, tunteet ja hyvinvointi työssäJari Jussila
 
Mini Track on Big Social Data Analytics
Mini Track on Big Social Data AnalyticsMini Track on Big Social Data Analytics
Mini Track on Big Social Data AnalyticsJari Jussila
 
Digitaaliset palvelut
Digitaaliset palvelutDigitaaliset palvelut
Digitaaliset palvelutJari Jussila
 

More from Jari Jussila (20)

Social media analysis and document based research
Social media analysis and document based researchSocial media analysis and document based research
Social media analysis and document based research
 
Social media impact after publishing
Social media impact after publishingSocial media impact after publishing
Social media impact after publishing
 
Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...
 
Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...
 
Literature review on customer emotions in social media
Literature review on customer emotions in social mediaLiterature review on customer emotions in social media
Literature review on customer emotions in social media
 
SAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiSAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-Foorumi
 
Deeva project introduction
Deeva project introductionDeeva project introduction
Deeva project introduction
 
Digitaalinen arvonluonti - tunneympyräsovellus
Digitaalinen arvonluonti -  tunneympyräsovellusDigitaalinen arvonluonti -  tunneympyräsovellus
Digitaalinen arvonluonti - tunneympyräsovellus
 
Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...
 
A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes
 
Big social data analytics - social network analysis
Big social data analytics - social network analysis Big social data analytics - social network analysis
Big social data analytics - social network analysis
 
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
 
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimusSosiaalisen median analysointi ja dokumenttipohjainen tutkimus
Sosiaalisen median analysointi ja dokumenttipohjainen tutkimus
 
Computational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workComputational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge work
 
Someanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaSomeanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassa
 
Value assessment of e-government service from municipality perspective
Value assessment of e-government service from municipality perspectiveValue assessment of e-government service from municipality perspective
Value assessment of e-government service from municipality perspective
 
Workathlon24 oivalluksia
Workathlon24 oivalluksiaWorkathlon24 oivalluksia
Workathlon24 oivalluksia
 
Teknologia, tunteet ja hyvinvointi työssä
Teknologia, tunteet ja hyvinvointi työssäTeknologia, tunteet ja hyvinvointi työssä
Teknologia, tunteet ja hyvinvointi työssä
 
Mini Track on Big Social Data Analytics
Mini Track on Big Social Data AnalyticsMini Track on Big Social Data Analytics
Mini Track on Big Social Data Analytics
 
Digitaaliset palvelut
Digitaaliset palvelutDigitaaliset palvelut
Digitaaliset palvelut
 

Sosiaalisen median analytiikka

  • 2. Big Data transaktioista interaktioihin WEB BIG DATA Lähde: Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013 ERP CRM ostotiedot maksutiedot segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit weblogit tarjoushistoria A/B testaaminen Dynaaminen hinnoittelu Hakukonemarkkinointi ja optimointi Mainosverkostot Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit Ulkopuolinen demografia Kuvat ja videot Puheen muuttaminen tekstiksi Feedit Anturi/sensoridata Tuote / palvelu logit SMS/MMS Käyttäjien luoma sisältö Mobiilidata Klikkivirran analyysi Sijaintidata Sosiaaliset verkostot Sosiaalinen mediaSentimentti
  • 7. TOP 10 henkilöä viestien määrän suhteen Lähde: NEMO Sentiment & Data analyzer
  • 8. Mitä hyötyä voisi olla sentimenttianalyysistä?
  • 9. Viikkoharjoitus 4: Tee-se-itse sentimenttianalyysi •  Vaihtoehtoja sentimenttianalyysin tekemiseen a)  Analytiikkasovellukset (advanced analytics) •  SAS® Text Miner http://www.sas.com/en_us/software/analytics/text-miner.html •  SPSS Text Analytics for Surveys http://www-03.ibm.com/software/products/fi/spss-text-analytics-surveys •  RapidMiner https://rapidminer.com/solutions/sentiment-analysis/ b)  Sosiaalisen median analytiikkasovellukset •  Hootsuite https://hootsuite.com/products/insights •  Meltwater http://www.meltwater.com/fi/ •  … c)  Sentimenttianalyysisovellukset •  NEMO Sentiment & Data analyzer http://seda.cloudapp.net/ •  SentiStrenght http://sentistrength.wlv.ac.uk/ •  … d)  Ohjelmalliset lähestymistavat •  R Sentiment package https://cran.r-project.org/src/contrib/Archive/sentiment/ •  Python NLTK-trainer http://nltk-trainer.readthedocs.org/en/latest/ •  … 9/6
  • 11. Sentiment Analysis in Tableau using R Lähde: https://www.youtube.com/watch?v=YkO6IXacK7s
  • 12. Sentimenttianalyysia Tableaussa käyttäen R •  Asenna seuraavat ohjelmistot: –  R https://www.r-project.org/ –  Rstudio https://www.rstudio.com/ •  ja tarvittavat R-kirjastot –  TM, NLP ja Rserve –  Rstem https://cran.r-project.org/src/contrib/Archive/Rstem/ –  Sentiment https://cran.r-project.org/src/contrib/Archive/ sentiment/
  • 13. Ota kirjastot käyttöön ja käynnistä R palvelu (run.Rserve)
  • 14. Yhdistä Tableau ja R (Manage R Connection)
  • 15. Luo Tableaussa uusi laskennallinen kenttä •  SCRIPT_STR('classify_polarity(.arg1,algorith m="bayes", verbose=TRUE)[, 4]',ATTR([Text])) Lähde: https://boraberan.wordpress.com/2013/12/24/sentiment-analysis-in-tableau-with-r/
  • 17. Solmut, yhteydet ja verkostot Tähti Ympyrä Ketju Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen Löyhempi kuin tähti, mutta keskittyneempi kuin ympyrä 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0
  • 19. Keskeisempiä käsitteitä liittyen verkostoanalyysiin 19 KESKEISYYS ARVOSTUS TÄRKEYS Lähde: Wasserman & Faust 1994 Keskeisyysaste Läheisyys Degree Prestige Proximity Prestige Välillisyys Informaation keskeisyys Status or Rank Prestige
  • 20. •  Keskeisyysaste (degree) •  Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin •  Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree) •  Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa. 20 Keskeisyysaste (asteluku) Lähde: Wasserman & Faust 1994
  • 21. •  Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa •  Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin •  dij on lyhyimmän polun pituus i:n ja j:n välillä •  Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä ∑= = n ij iji dc Läheisyys Lähde: Wasserman & Faust 1994
  • 22. •  Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu •  Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat) •  Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri 22 Välillisyys Lähde: Wasserman & Faust 1994
  • 23. Viikkoharjoitus 3: Tee-se-itse Twitter verkostoanalyysi – markkinoinnin näkökulmasta •  Asenna seuraavat ohjelmistot – Anaconda Python 2.7 https://www.continuum.io/downloads – Gephi https://gephi.org/ •  Kerää data – Tätä varten tarvii luoda Twitter sovellus (App) https://apps.twitter.com/ – Nouda twiitit käyttäen seuraavaa skriptiä https://github.com/jukkahuhtamaki/pcm-demo/ tree/master/twitter-api
  • 25. Ohjelmallinen sisällönhallinta 2016 Lähde: http://iislab.ee.tut.fi/piiri/groups/ohjelmallinen-sisällönhallinta-2016
  • 28. Avaa gexf (Graph Exchange XML Format) tiedosto Gephillä
  • 30. Kiitokset •  Jukka Huhtamäki @jnkka #ohsiha •  Harri Jalonen @Jalonen #nemohanke •  Jayesh Gupta @jyshgupta