Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Datan rooli koneoppimisessa ja tekoälyssä

SolitaHUB: Datan tulevaisuus -aamiaistilaisuus järjestettiin Oulussa 27.3.2019. Tutkijatohtori Satu Tamminen Oulun yliopistolta puhui tapahtumassa datan roolista koneoppimisessa ja tekoälyssä. .
Lue lisää tapahtumasta: https://www.solita.fi/tapahtumat/solita-hub-datan-tulevaisuus-oulu/

  • Login to see the comments

  • Be the first to like this

Datan rooli koneoppimisessa ja tekoälyssä

  1. 1. #Solita SATU TAMMINEN D.SC. (TECH), M.SC. (MATH) OULUN YLIOPISTO Datan rooli koneoppimisessa ja tekoälyssä
  2. 2. University of Oulu DATAN TULEVAISUUS Satu Tamminen Oulun yliopisto / BISG 27.3.2019
  3. 3. University of Oulu3 DATAN ROOLI KONEOPPIMISESSA JA TEKOÄLYSSÄ
  4. 4. University of Oulu Vale, emävale ja tilasto? ‒ Data ei valehtele, mutta tarinan voi kertoa väärin ‒ Malli oppii datan perusteella: - Sisältääkö data tietoa tutkittavasta asiasta? - Onko kyseessä edustava otos tutkitusta populaatiosta? - Onko mittausväli ajallisesti riittävän pitkä tai muuttujien mahdollisen vaihteluvälin kattava? - Sisältyykö mittauksiin epävarmuustekijöitä? 4
  5. 5. University of Oulu5
  6. 6. University of Oulu6 TEKOÄLY JA KONEOPPIMINEN
  7. 7. University of Oulu Käsitteitä TEKOÄLY ‒ Älykkyys tuottaa järkevää toimintaa ‒ Älykäs kone, laite, ohjelma, järjestelmä tai palvelu osaa valita parhaan mahdollisen toimintaratkaisun tilanteen mukaan. Russel and Norvig: Artificial Intelligence: A Modern Approach 7 KONEOPPIMINEN ‒ Tietokonetekniikan osa-alue, jossa yleensä käytetään tilastotieteen menetelmiä ‒ Antaa tietokoneille kyvyn ”oppia” datasta (parantaa suorituskykyään tietyn tehtävän suorittamisessa) ilman eksplisiittistä ohjelmointia. VTT: Tekoälyn käsitekartta
  8. 8. University of Oulu Data-analyysi 8 DATA-ANALYYSI Datan hallinta ja esikäsittely Yhdistäminen, muokkaus ja suodatus Tarkistus, puhdistus ja annotointi Hankinta ja tallennus Visualisointi Analyysi ja tulkinta Mallinnus ja analyysi Tulkinta MATEMATIIKKA TILASTOTIEDE TIETOJÄRJESTELMÄTIEDE DATATIEDE VTT Tekoälyn käsitekartta
  9. 9. University of Oulu Koneoppiminen 9 Koneoppiminen ja hahmontunnistus Ohjaamaton oppiminen k-means, PCA, LCA, SOM, GAN Anomalioiden havaitseminen Vahvistava oppiminen (Reinforcement learning) Ohjattu oppiminen Logistinen regressio, lin. regressio, SVM Neuroverkot ja syväoppiminen Boosting ja bagging Osittain VTT Tekoälyn käsitekartta
  10. 10. University of Oulu10 DATAN ESIKÄSITTELY
  11. 11. University of Oulu Miksi? Kun dataa kerätään eri lähteistä se voi olla ‒ Puutteellista - Mittausarvoja puuttuu - Kiinnostavia muuttujia puuttuu - Raakamittausten sijaan on tallennettu vain aggregoituja arvoja ‒ Kohinaista - Virheellisiä arvoja - Outliereita ‒ Yhteensopimatonta - Eri formaateissa - Samoja muuttujia eri nimillä ‒ Biasoitunutta, epänormaalia tai täysin irrelevanttia ‒ Esikäsittely parantaa datan laatua 11
  12. 12. University of Oulu Datan esikäsittely ESIKÄSITTELYN TEHTÄVIÄ: - Eri tietolähteiden integrointi yhteen - Datan siivous - Annotointi - Transformointi - Datamäärän tiivistäminen 4/9/1812 ‒ Datan määrä ei korvaa laatua ‒ Garbage in = garbage out - Datan analysointi onnistuu, kun data on hyvin esikäsitelty ‒ More is more ‒ Kuinka paljon tulisi käyttää aikaa datan esikäsittelyyn? - Mitä siitä seuraa, jos käyttää huonoa dataa?
  13. 13. University of Oulu Esikäsittely opettaa Kun data valmistellaan hyvin analysointia tai malleja varten, myös datan käyttäjä oppii! → Datan esikäsittely varmistaa, että analysointimenetelmät ja mallit toimivat oikein → Käyttäjä oppii tuntemaan sovellusalueen ja varmistuu, että on valittu oikeat menetelmät ja mallit 13
  14. 14. University of Oulu14 TEKOÄLY PÄÄTÖKSENTEON TUKENA
  15. 15. University of Oulu Koneoppimisen hyödyt ‒ Koneoppimisen huimat mahdollisuudet - Laskentavoiman kehittyminen - Uudet ja entistä monimutkaisemmat algoritmit - Lähes loppumaton datan määrä ‒ Monimutkaisten, epälineaaristen järjestelmien mallinnus on perinteisillä tilastollisilla menetelmillä vaikeaa tai mahdotonta ‒ Muuttuvat ympäristöt vaativat vuorovaikutusta, dynaamisuutta ja jatkuvaa oppimista 15
  16. 16. University of Oulu Tulosten tulkinta ‒ Mallin hyvyys ei ole riittävä mittari kuvaamaan tulosten luotettavuutta ‒ Keskimääräinen hyvyys ei kerro yksittäisen ennusteen hyvyydestä ‒ Jos tiedät, mihin ennuste perustuu, opit ilmiöstäkin enemmän ‒ Voit paremmin tunnistaa opetusdataan liittyviä ongelmia, ja korjata ne ‒ Black box –malleista läpinäkyvyyteen 4/9/1816
  17. 17. University of Oulu Opi enemmän ilmiöistä ennustemallien avulla ‒ Datapohjaisia malleja terästuotteen laadun ennustamiseen (SSAB, Outokumpu ja Ovako) - Erilaisen mekaaniset ominaisuudet - Profiili - Tasomaisuus - Karheus - Keskilinjan paikka - Lämpötila ‒ Malleista voidaan johtaa myös riskitodennäköisyyden ennusteita ‒ Monimutkaisten teollisuus- prosessien mallintaminen vaatii tehokkaita koneoppimis- menetelmiä 17
  18. 18. University of Oulu Valoa mustaan laatikkoon 4/9/1818
  19. 19. University of Oulu194/9/18 Interaktiot
  20. 20. University of Oulu Mihin ennuste perustuu? 20
  21. 21. University of Oulu214/9/18
  22. 22. University of Oulu Kokemuksiamme ‒ Ennustemallit voivat muodostaa herätteen tekoälylle, kun halutaan ennakoida ‒ Ennustemallit tuottavat tietoa myös mallinnettavasta prosessista ‒ Tarvitaan historiadataa, mielellään kaikista mahdollisista toimintatilanteista 22 ‒ Dynaamiset ja oppivat mallit voivat mukautua muuttuviin tilanteisiin tai ne voidaan personoida yksilöllisiksi ‒ Mallille voidaan antaa palautetta, jolla opetusta tehostetaan ‒ Mallit voivat olla digitaalisen kaksosen pohjana

×