Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Analytiikka toiminnan kehittämisessä

2,251 views

Published on

Analytiikka toiminnan kehittämisessä esitys Data-analytiikka PK-yritysten toiminnan kehittämisessä 4.12.2014.

Published in: Business
  • Login to see the comments

Analytiikka toiminnan kehittämisessä

  1. 1. Analytiikka toiminnan kehittämisessä Jari Jussila Novi tutkimuskeskus Data-analytiikka PK-yritysten toiminnan kehittämisessä 4.12.2014
  2. 2. Johdanto •Big Datan ja analytiikkamaailman käsitteiden läpikäyminen •Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat •Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 8.12.2014 2
  3. 3. Big datan ja analytiikkamaailman käsitteet 8.12.2014 3
  4. 4. Päätöksenteon tukijärjestelmät ja johdon tietojärjestelmät ”1970-1990” 8.12.2014 4 vrt. erilaiset johdon työpöydät, kuten markkinoinnin työpöytä Vierailut Toiminnot sivustolla Liidit Mahdollisuudet Voitot Metriikka Tavoitteen saavuttaminen 64 % 51 % 70 % 29 % 35 % Myyntisuppilo Lähde: erilaisia esimerkkejä nähtävillä esim. Klipfolion sivuilla (ks. Dashboards); ks. myös Visualisointi ja tiedon jakamisen käytännöt (Aho 2014)
  5. 5. Kuutioiden mallinnus - OLAP (online analytical processing) 8.12.2014 5 Tuote Aika Markkinat image Athanasios Kastanidis ”1980-1990”
  6. 6. OLAP-kuutioiden perusidea •OLAP-tekniikka poikkeaa perinteisestä tilastoinnista ja raportoinnista siten, että käyttäjä voi vaihtaa näkökulmaa tiedontarpeensa mukaan. •Esimerkiksi analyytikko voi lähteä 1) tarkastelemaan tuoteryhmien myyntiä maittain, 2) filtteröidä aineisto tiettyihin maihin 3) joista löytää jotain esimerkiksi myyntitavoitteista poikkeavaa. Tämän jälkeen 4) porautua esimerkiksi myyntiin tietyissä kaupungeissa. 5) Vaihtaa näkökulmaa liikevoittoon tuoteryhmittäin, jne. 8.12.2014 6 ”1980-1990”
  7. 7. Liiketoimintatiedon hallinnan ulottuvuudet 8.12.2014 7 Organisaation sisäinen Organisaation ulkoinen TIEDON KOHDE Määrällinen Laadullinen TIEDON TYYPPI Organisaation sisäinen Organisaation ulkoinen TIEDON LÄHDE Lähde: [Hannula 2005]; image Athanasios Kastanidis ”1989-2005”
  8. 8. Tiedon arvoketju liiketoimintatiedon hallinnan näkökulmasta 8.12.2014 8 Lähde: [Myllärniemi 2012]
  9. 9. Minkälaista tietoa tarvitaan? Tieto, joka on pystytty hankkimaan Tieto, joka todella tarvitaan Tieto, joka määritellään tarpeelliseksi 8.12.2014 9 Lähde: [Hannula 2005]
  10. 10. Liiketoimintatiedon hallinnan prosessimalli ja keskeiset tehtävät 8.12.2014 10 Lähde: Tietojohtaminen [Laihonen et al. 2013]
  11. 11. Tiedonlouhinta, data mining, knowledge discovery in databases (KDD) ”1990-2007” 8.12.2014 11 10-20 % 20-30 % 50-70 % 10-20 % 10-20 % 5-10 % 1. Liiketoiminnan ymmärtäminen 2. Datan ymmärtäminen 3. Datan valmistelu 3. Mallinnus, tiedonlouhinta 5. Arviointi 6. Tulosten julkaisu Lähde: The CRISP-DM Model [Shearer 2000], [Aho 2014]
  12. 12. CRISP-DM referenssimalli CRISP-DM referenssimallin tehtävät Liiketoiminnan ymmärtäminen Datan ymmärtäminen Datan valmistelu Mallinnus, tiedonlouhinta Arviointi Tulosten julkaisu Määritä liiketoiminnan tavoitteet Tee tilannearvio Määritä tiedonlouhinnan tavoitteet Laadi projektisuunnitelma Kerää alustava data Kuvaa data Tutki dataa Varmista datan laatu Datasetin kuvaus Datan valinta Datan siivous Datan rakentaminen Datan integrointi Datan formatointi Valitse mallinnus menetelmä Suunnittele koe Rakenna malli Arvioi mallia Arvioi tuloksia Arvioi ja varmista tiedonlouhintaprosessin laatu Määrittele seuraavat stepit Suunnittele mallin julkaisu (esim. verkkosivuna) asiakkaalle Suunnittele mallin ylläpito Laadi loppuraportti Arvioi projekti 8.12.2014 12 Lähde: The CRISP-DM Model [Shearer 2000]
  13. 13. Analytiikka ”2005-2010” •Deskriptiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää dataa ja analysoida liiketoiminnan suoriutumiskykyä •Diagnostiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää mitä on tapahtunut ja miksi •Prediktiivinen analytiikka: tekniikoita joiden avulla voidaan analysoida nyky- ja historiatietoa jotta voidaan päätellä mitä todennäköisesti tapahtuu tai ei tapahdu •Preskriptiivinen analytiikka: tekniikoita joiden avulla voidaan laskennallisesti kehittää ja analysoida vaihtoehtoja organisaation toiminnalle •Päätöksentekoa tukeva analytiikka: tekniikoita joiden avulla voidaan visualisoida informaatiota päätöksen teon tueksi 8.12.2014 13 Lähde: Big Data and Analytics [Kaisler et al. 2014]
  14. 14. Analytiikkasykli 1.Määrittele liiketoimintaongelma tai kysymys johon haluat vastauksen 2.Tunnista, kerää, siivoa ja valmistele data kysymyksen vastausta varten 3.Deskriptiivinen analytiikka –Perehdy dataan (descriptives, correlations, factor analysis, cluster analysis, ym.) –Luo mahdollisia hypoteeseja (data mining ym.) 4.Prediktiivinen analytiikka –Muodosta hypoteesit –Tunnista soveltuvimmat analytiikkamenetelmät –Kehitä analyyttiset mallit (multivariate regression, logistic regression, forecasting, non-linear models, decision trees, ym.) –Aja mallit ja luo ennusteet 5.Preskriptiivinen analytiikka –Kehitä päätös- ja optimointimallit –Hyödynnä koneoppimista päätöksien ohjelmointiin 6.Kirjoita johtopäätökset ja suositukset 8.12.2014 14 Lähde: Introduction to Big Data [Kaisler et al. 2014]
  15. 15. Big Data ”2010-” 8.12.2014 15 Volyymi Vauhti Variaatio Varmuus Data at Rest Data in Motion Data in Many Forms Data in Doubt Terabittejä olemassa olevaa dataa prosessoitavaksi Striimattua dataa, nopea vasteaika millisekunneista sekunteihin Strukturoitua, ei- strukturoitua, ja semistrukturoitua dataa Epävarmuutta liittyen datan epätäydellisyyteen, puutteellisuuteen, tai virheellisyyteen Lähde: [Breuker 2014; Laney, Meta Group 2001 (3V:tä)]
  16. 16. Big Data transaktioista interaktioihin 8.12.2014 16 WEB BIG DATA Lähde: mukaillen [Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013] ERP CRM ostotiedot maksutiedot segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit weblogit tarjoushistoria A/B testaaminen Dynaaminen hinnoittelu Hakukonemarkkinointi ja optimointi Mainosverkostot Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit Sentimentti Ulkopuolinen demografia Kuvat ja videot Puheen muuttaminen tekstiksi Feedit Anturi/sensoridata Tuote / palvelu logit SMS/MMS Sosiaaliset verkostot Sosiaalinen media Käyttäjien luoma sisältö Mobiilidata Klikkivirran analyysi Sijaintidata
  17. 17. Datan lajeja Datan laji Muoto Volyymi Kuvaus Esimerkkejä Master Data Strukturoitu Matala Yritystason dataa jolla on strategista arvoa organisaatiolle Asiakas, tuote, toimittaja Transaktiodata Struktoroitu & semi- strukturoitu Keskinkertainen - korkea Transaktiot joita syntyy liiketoiminta-prosesseissa Tilaukset, ostot, maksut Referenssidata Struktoroitu & semi- strukturoitu Matala – keskin- kertainen Faktoja jotka tukevat organisaation kykyä tehokkaasti prosessoida transaktioita, hallita masterdataa ja tukea päätöksiä Demografiset kentät Metadata Strukturoitu Matala ”Dataa datasta” Datan nimi, datan dimensiot tai yksiköt, ym. Analytiikkadata Strukturoitu Keskinkertainen - korkea Liiketoimintaoperaatiosta tai transaktioista jalostettua tietoa raportoinnin ja analytiikan tarpeisiin Data joka sijaitsee tietovarastoissa ja päätöksenteon tukijärjestelmissä Big Data Struktoroitu, semi- strukturoitu ja ei strukturoitu Korkea Isoja data settejä, joita on haastava tallentaa, etsiä, jakaa, visualisoida ja analysoida Ihmisten ja koneiden luomaa dataa sosiaalisesta mediasta, webistä, mobiililaitteista, sensoreista, ym. 8.12.2014 17 Lähde: Big Data and Analytics [Kaisler et al. 2014]
  18. 18. Master data •organisaation ydintieto on usein kaikkein tärkeintä liiketoiminnalle ja siinä menestymiselle sekä data-lähtöiselle päätöksenteolle •ydintietoa käytetään useissa yrityksen prosesseissa ja tietojärjestelmissä, joten ydintietojen muotojen standardointi ja arvojen synkronointi on kriittistä järjestelmien onnistuneelle integroinnille •ydintiedoksi mielletään usein esimerkiksi asiakastiedot ja tuotetiedot 8.12.2014 18 Lähde: [Vilminko-Heikkinen & Pekkola 2013]
  19. 19. Datan käyttöön ja analysointiin liittyvää terminologiaa Termi Ajanjakso Kuvaus Päätöksenteon tuki [Decision Support] 1970-1985 Hyödynnetään data analyysiä tukemaan päätöksentekoa Johdon tukijärjestelmät [Executive Support Systems] 1980-1990 Fokus data analyysissä ylemmän johdon tueksi Kuutioiden mallinnus [Online Analytical Processing OLAP] 1990-2000 Ohjelmistoja multidimensionaalisten data taulujen analysointiin Liiketoimintatiedon hallinta [Business Intelligence] 1989-2005 Työkaluja tukemaan datalähtöistä päätöksentekoa, painopiste raportoinnissa Analytiikka [Analytics] 2005-2010 Fokus tilastollisessa ja matemaattisessa analyysissä päätöksenteon tueksi Massadata [Big Data] 2010- Fokus erittäin isossa, monimuotoisessa ja nopeasti liikkuvassa datassa 8.12.2014 19 Lähde: Big Data at Work [Davenport, 2014]
  20. 20. Kuinka liiketoimintatiedon hallinta on muuttunut massadatan myötä? Massadata Business analytiikka Liiketoimintatiedon hallinta Vanhaa •Relaatiotietokannat •SQL •Tietovarastot •Tiedonlouhinta •Kvantitatiivinen analyysi •Tilastotiede •Operaatiotutkimus •Päätöksenteon tukijärjestelmät •Johdon tietojärjestelmät •OLAP Uutta •4V:tä •Monimuotoista dataa •Vähemmän struktuuria •Big Data teknologiat (MapReduce, Hadoop, NoSQL, ym.) •Ei strukturoitua dataa •Dataa monesta lähteestä •Monimuotoista dataa •Data liikkeessä •Tekstianalytiikka •Visuaalinen analytiikka •Sosiaalisen median analytiikka •Helppokäyttöisyys •Visuaalisuus •Dynaamisuus •Kattaa organisaation prosessit •Koneoppiminen •RTAP 8.12.2014 20 Lähde: mukailtu Introduction to Big Data [Kaisler et al. 2014]
  21. 21. Big Data, data-analytiikka ja lähikäsitteet •Big Data can be defined as the amount of data just beyond technology’s capability to store, manage and process efficiently. (Kaisler et al. 2014) •Data analytics is the science of examining raw data with the purpose of drawing conclusions about that information. (Rouse 2008) •Business analytics is the scientific process of transforming data into insight for making better decisions (INFORMS) •Tiedonlouhinta (engl. data mining) on kokoelma menetelmiä, jotka valikoivat, kuvailevat ja mallintavat suuria tietomääriä tavoitteenaan löytää tiedon omistajalle uusia ja hyödyllisiä säännönmukaisuuksia ymmärrettävässä muodossa (Hand et al. 2001) •Business Intelligence refers to the technologies, applications, and processes for gathering, storing, accessing, and analyzing data to help its users make better decisions (Wixom and Watson, Teradata University Network 2012) 8.12.2014 21
  22. 22. Ymmärrys Tiedon tasot 8.12.2014 22 Data Informaatio Tietämys Lähde: [Laihonen et al. 2013; Tuomi 1999; Thierauf 1999; Ackoff 1989]
  23. 23. Tiedon tasot esimerkein avattuna 8.12.2014 23 Informaatio Data Tietämys Ymmärrys A X1 X2 1 1 300 2 0 159 … … … 100 1 501 A X1 X2 1 1 300 2 0 159 … … … 100 1 501 A = asiakasnumero X1 = sukupuoli (0=nainen, 1=mies) X2 = kk-ostot •”Meillä on tietokannassamme 100 asiakkuutta” •”85% asiakkaistamme on naisia” •”Keskimääräiset kk-ostot ovat 250€” •”Suurin osa asiakkaistamme on naisia, vaikka tuotteemme ovat suunnattu pääasiassa miehille -?!@%!” Lähde: [Väisänen 2011]
  24. 24. Tiedonhallinnan tasot 8.12.2014 24 Innovoiva Erottuva Arkistoiva Mallinnus Visualisointi Ennustaminen Optimointi Raportointi ”Löytyisikö täältä jotain?” ”Tiedän mitä tarvitsen mutta haluan tehdä sen kilpailijoita paremmin" ”Tätä tarvitaan mutta tällä ei erotuta" Lähde: Informaatiosta kilpailuetua teollisuusyrityksiin [Valli & Ahlgren 2013] tieto, joka on tallennettava esimerkiksi määräysten perusteella tieto, jonka avulla voidaan edistää ja parantaa nykyistä liiketoimintaa tieto, jonka avulla voidaan innovoida uutta liiketoimintaa
  25. 25. Lähteitä •Breuker, D. 2014. Towards Model-Driven Engineering for Big Data Analytics – An Exploratory Analysis of Domain- Specific Languages for Machine Learning. 47th Hawaii International Conference on System Sciences. •Davenport, T. H., Patil, D. J. 2012. Data Scientist. The Sexiest Job of the 21st Century. Harvard Business Review. October 2012. •Davenport, T. H. 2014. Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business Review. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Introduction to Big Data. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Big Data and Analytics. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Advanced Analytics – Issues and Challenges in the Global Environment. 47th Hawaii International Conference on System Sciences. •Hannula, M. 2005. Tieto- ja liiketoiminta. Tekniset välineet ja sovellukset. Luento 23.10.2005. •Laihonen, H., Hannula, M; Helander, N; Ilvonen, I; Jussila, J; Kukko, M; Kärkkäinen, H; Lönnqvist, A; Myllärniemi, J; Pekkola, S; Virtanen, P; Vuori, V; Yliniemi, T. 2013. Tietojohtaminen. Laitosraportti. Tampereen teknillinen yliopisto. •Laney, D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. Retrieved 6 February 2001. •Loukides, M. 2010. What is Data Science? O’ Reilly, Cambridge. http://www.kiwidatascience.it/wp- content/uploads/2013/05/What_Is_Data_Science_.pdf •Yli-Pietilä & Backman 2013. Management by analytics. Commercial and technical applications in the Big Data era. Teradata •Valli, K., Alhgren 2013. Informaatiosta kilpailuetua teollisuusyrityksiin. Teknologiateollisuus. http://www.teknologiateollisuus.fi/file/16270/Informaatiostakilpailuetua.pdf.html •Vilminko-Heikkinen, R., Pekkola, S. 2013. Establishing an Organization’s Master Data Management Function: A Step-wise Approach. 46th Hawaii International Conference on System Sciences. •Väisänen, J. 2011. Tiedonlouhinta. Luentomateriaali. 8.12.2014 25
  26. 26. Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat 8.12.2014 26
  27. 27. Raportoinnista operationaaliseen data-analytiikkaan 8.12.2014 27 Raportit RAPORTOIDAAN MITÄ tapahtui? ANALYSOIDAAN MIKSI se tapahtui? Ad hoc BI työkalut ENNUSTETAAN MITÄ TULEE tapahtumaan? Ennustavat mallit OPERATIONALISOIDAAN MITÄ ON tapahtumassa nyt? Linkki operatiivisiin järjestelmiin AKTIVOIDAAN PISTETÄÄN tapahtumaan Automaattiset linkitykset STRATEGINEN ÄLYKKYYS OPERATIONAALINEN ÄLYKKYYS Lähde: mukaillen [Yli-Pietilä & Backman 2013]
  28. 28. Tiedonlouhinnan menetelmiä 8.12.2014 28 Suunnattu Ei-suunnattu Ad Hoc Strateginen suunnittelu Ennustaminen Segmentointi Klusterointi Visualisointi OLAP Neuroverkot Regressio Lähde: [Kudyba & Hoptroff, 2001; Väisänen, 2011]
  29. 29. Klusterointi •Kuvailevaa tiedonlouhintaa / deskriptiivistä analytiikkaa •Tavoitteena klusteroida (luokitella) datamatriisin havainnot siten, että jokaisen klusterin sisällä olevat havainnot ovat mahdollisimman homogeenisia, ja jokainen klusteri mahdollisimman heterogeeninen muiden klusterien kanssa •Yleisiä käyttötarkoituksia –asiakkaiden segmentointi –myymälöiden ryhmittely menestyksen mukaan esimerkiksi kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin [Niemijärvi 2013] 8.12.2014 29
  30. 30. Esimerkki hierarkkisesta klusteroinnista 8.12.2014 30 Klusterien lukumäärä Klusterit 5 (1) (2) (3) (4) (5) 4 (1,2) (3) (4) (5) 3 (1,2) (3,4) (5) 2 (1,2) (3,4,5) 1 (1,2,3,4,5) 1 2 3 4 5 Lähde: [Väisänen, 2011]
  31. 31. Assosiaatiosäännöt •Tarkoituksena löytää havaintoja, jotka esiintyvät yhdessä useammin kuin muut •Usein käytettyjä sovelluksia –Ostoskorianalyysi, engl. market basket analysis (MBA), ks. Esim. [Niemijärvi 2014]; [Ollikainen 2013] –Klikkivirran analyysi, engl. web clickstream analysis (WCA) [Paananen 2006] •Normaaleista tietokannoista poiketen assosiaatiosääntöjä tarkastellaan transaktio- ei asiakaspohjaisesti –MBA:ssa yksi datamatriisin rivi vastaa yhtä kassalla käyntiä –WCA:ssa yksi datamatriisin rivi vastaa yhtä vierailua verkkosivuille 8.12.2014 31
  32. 32. Assosiaatiosäännöt •Assosiaatiosääntö on todennäköisyyteen perustuva lausuma tiettyjen tapahtumien samanaikaisesta tapahtumisesta: •JOS A=1 ja B=1, NIIN (tietyllä todennäköisyydellä p) C=1 •Todennäköisyys, että ostetaan tavara X, kun tavara Y on ostettu: X → Y •Esim. (Maito & Tee) → Keksejä (assosioaatiosääntö) •Säännön oikealla puolella yleensä vain yksi tekijä •Säännön vasemmalla puolella harvoin kolmea tekijää enempää (3. asteen sääntö) •Todennäköisyydet tavaroiden ostamiselle saadaan jakamalla ostotapahtumien esiintymistiheys kaikkien ostotapahtumien lukumäärällä 8.12.2014 32 Lähde: [Väisänen, 2011]
  33. 33. •Tuki (”Support”) {A → B} = P(A ja B) –Todennäköisyys, että tuotteet A ja B löytyvät satunnaisesta ostoskorista. Jos 40% ostoksista sisältää sekä maitoa että leipää, tuki {maitoa→ leipää} = 0.4 •Symmetrinen, eli tuki {leipää → juustoa} = tuki {juustoa → leipää} •Jos tuki kovin alhainen, ei säännöllä välttämättä ole kovin suurta käytännön merkitystä •Luottamus (”Confidence”) {A → B} = tuki {A → B} / tuki {A} –Todennäköisyys, että satunnaisesta ostoskorista löytyy tuote B, jos siellä on tuote A –Jos 80 % ostoksista sisältää leipää, mutta vain 40 % sisältää sekä leipää että maitoa, luottamus {leipää → maitoa} = 0.4 / 0.8 = 0.5 –Luku ei välttämättä ole symmetrinen •Noste (”Lift”) {A → B} = luottamus {A → B} / tuki {B} –Normalisoitu luku, joka ilmaisee, kuinka paljon tuotteen A ostaminen vaikuttaa tuotteen B ostamiseen –Jos luottamus {leipää → maitoa} = 0.5 ja 40 % ostoksista sisältää maitoa, noste {leipää → maitoa} = 0.5 / 0.4 = 1.25 –Eli henkilöt, jotka ostelevat leipää, ostelevat 1.25-kertaisesti maitoa verrattuna koko porukkaan 8.12.2014 33 Assosiaatiosäännöt Lähde: [Väisänen, 2011]
  34. 34. Regressio •Lineaarinen regressio auttaa ennustamaan toisen muuttujan arvoja toisen muuttujan arvoilla •Logistisen regression avulla voidaan selittää/ennustaa binääristä muuttujaa •Kuinka mallinnuksen avulla ennustetaan asiakkaan ostotodennäköisyys? [Ollikainen 2014] 8.12.2014 34
  35. 35. Puumallit •Yhdistetään regressio ja klusterointi –Jaetaan havaintoja osajoukkoihin (klusterointi) tietyn ennustettavan muuttujan mukaan (regressio) •Käytetään usein asiakkaiden luokitteluun, kun tiedetään, minkä ominaisuuden mukaan halutaan luokitella –Puhelinoperaattorilla tiedossa, että 70 % asiakkaista maksaa laskunsa myöhässä, ja nyt halutaan tietää, keitä nämä ihmiset oikein ovat, ja miten voidaan ennustaa, maksaako uusi asiakas mahdollisesti laskunsa ajoissa –Asiakastiedoista valitaan ne muuttujat, joiden arvellaan olevan keskeisessä roolissa. Oletetaan, että seuraavat muuttujat voisivat vaikuttaa siihen, maksaako asiakas laskunsa ajoissa (0= ei maksa ajoissa, 1= maksaa ajoissa) 1.Keskimääräinen puhelimen käyttöaste (min/kk) 2.Ikä (1 = alle, 30v. 2 = yli 30v.) 3.Siviilisääty (1 = naimaton, 2 = naimisissa) 8.12.2014 35 Lähde: [Väisänen, 2011]
  36. 36. 8.12.2014 36 •Puhelinoperaattoriesimerkki jatkuu… –Alussa meillä on kaikki havainnot (10 000) yhdessä, joista siis 3 000 maksaa laskunsa ajoissa –Puumalli jaottelee kaikki 10 000 havaintoa parhaiten kohdemuuttujaa (laskun ajoissa maksu) luokittelevalla muuttujalla 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 11.7% 460 0: 88.3% 3480 Yht. 100% 3940 1: 41.9% 2540 0: 58.1% 3520 Yht. 100% 6060 Ikä 2 1 Ikä (1 = alle, 30v. 2 = yli 30v.) Puumallit Lähde: [Väisänen, 2011]
  37. 37. 8.12.2014 37 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 11.7% 460 0: 88.3% 3480 Yht. 100% 3940 1: 41.9% 2540 0: 58.1% 3520 Yht. 100% 6060 2 1 1: 67.1% 490 0: 32.9% 240 Yht. 100% 730 1: 38.5% 2050 0: 61.5% 3280 Yht. 100% 5330 1: 9.3% 310 0: 90.7% 3030 Yht. 100% 3340 1: 25.0% 150 0: 75.0% 450 Yht. 100% 600 Puh. käyttö Ikä Siviili- sääty 1 2 1 2 •Puhelinoperaattoriesimerkki jatkuu… •Lopullinen malli voi näyttää tältä Siviilisääty (1 = naimaton, 2 = naimisissa) Ikä (1 = alle, 30v. 2 = yli 30v.) Keskimääräinen puhelimen käyttöaste (1 = <300, 2 = >300 ) Puumallit Lähde: [Väisänen, 2011]
  38. 38. Puumallit •Mitä saatiin selville? –91 % alle kolmekymppisistä naimattomista ei maksa laskuaan ajoissa –Ainoa ryhmä, joka maksaa laskunsa ennemmin ajoissa kuin myöhässä on yli kolmekymppiset alle 300min/kk puhujat –Ikä on silti tärkein kriteeri 8.12.2014 38 Lähde: [Väisänen, 2011]
  39. 39. Ennakoiva analytiikka •Millä ohjelmistoilla ennakoiva analytiikka onnistuu ja millä ei? –Onnistuu: RapidMiner, SAS, SPSS, MS analysis services, R, AnyLogic.. –Ei onnistu: IBM Cognos, Qlikview, Business Objects, MS reporting services, Tableau, Oracle OBIEE… •Vinkki: Jos myyntimies vakuuttaa, että heidän softa tekee ennakoivaa analytiikkaa, niin kysy mm. seuraavien ennustemenetelmien sisältymisestä ohjelmistoon: –Luokittelumuuttujille - naive bayes, neuroverkko, logistinen regressio, päätöspuut.. –Jatkuville muuttujille - erilaiset regressioanalyysit, neuroverkot.. •Jos ei löydy, niin kyseessä lienee raportointiohjelmisto. •Milloin kannattaisi investoida ennakoivaan analytiikkaan? –Silloin kun sinulla on edellytyksiä hyödyntää tuloksia, esim. •Voit toteuttaa ennakoivan huollon ennen laitteen vikaantumista •Voit torjua asiakaspoistumaa tai ostoskorin hylkäämistä aktiivisilla toimenpiteillä •Kykenet kohdistettuun myyntiin ja markkinointiin.. 8.12.2014 39 Muokattu lähteestä: [Laukkanen]
  40. 40. Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 8.12.2014 40
  41. 41. Hakukoneoptimointi •Esimerkkejä analytiikkatyökaluista hakukoneoptimointiin –Google Analytics –Google Webmaster Tools –ClickHeat –ks. esim. Konsepton blogi (Paltamaa 2010) 8.12.2014 41
  42. 42. Sosiaalisen median analytiikka esimerkki 8.12.2014 42 Impressions -number of times users saw the Tweet on Twitter Engagements -number of times users have interacted with a Tweet, e.g. clicks, retweets, replies…
  43. 43. Myynti ja web-analytiikka 8.12.2014 43 Prospektit Suspektit Liidit Liidit Liidit Awareness Interest Desire Action Impressions Bounce rate Engagements Shopping area traction Shopping cart actions Payments Repeat visits Asiakkaat Satisfaction Recommendations
  44. 44. Starbucks hinnoittelun korjaaminen twiittien perusteella 8.12.2014 44 Lähde: [Kaisler 2014] Introduction to Big Data •Huoli siitä kuinka asiakkaat pitävät uuden kahvituotteen mausta •Seurattiin sosiaalista mediaa •Maku oli hyvä, mutta hinta oli liian suuri •Hinta laskettiin saman päivän aikana
  45. 45. Linkkejä lisätietoon 8.12.2014 45 Twitter: @Noviresearch ja @tietojohtaminen Novi tutkimuskeskuksen kotisivut: https://www.tut.fi/novi/ Slideshare: http://www.slideshare.net/Noviresearch YouTube: http://youtube.com/noviresearch

×