Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Science is tango betweendata and theory.James Kobielus, IBMs big data evangelist
Shall we danceJosef Šlerka, New Media Inspiration 2013Studia nových médií, Ataxo Interactive a.s.
Všechno co potřebujivědět o datech...... mne naučili filosofie
Myšlenky bez obsahu jsouprázdné, názory bez pojmůjsou slepé.Immanuel Kant, německý osvícenecký filosof
Obrazotvornost!
Žádný algoritmus z nebenespadl...staré programátorské přísloví
Sémiotická průpravaTypologie znaků a otázka sémiosisS čím si obrazotvornost hraje
A sign, or representamen, issomething which stands tosomebody for something insome respect or capacity.Charles Sanders Pei...
Typologie znakůznak (sign), jeho Objekt a jeho interpretantsémiosis je činnost, která spojuje Z-O-Isémiosis je potencionál...
Ikon a indexIkon je znak, který se vztahuje k Objektu a denotuje hojen díky svým vlastním rysům, které má bez ohledu nato,...
SymbolSymbol je znak, který se vztahuje k Objektu adenotuje ho díky zákonu, většinou asociaci všeobecnéideje a tento zákon...
Data jsou symbolická(konvenční) vyjádřeníindexů reality, už obsahujíurčitý pohled. Ale nicneříkají.
Nejsou data jako data.
Poslední filosofickálekce....
There are only two hardthings in ComputerScience: cache invalidationand naming thingsPhil Karlton, computer programmer
... programátoři jsouvlastně filosofové
Facebook normalizeddistance ...... příběh jedné hypotézy a problémy, které jí provázejía provazely
Google distancepočítá se sémantická vzdálenostautory jsou Rudi Cilibrasi a Paul M. B. Vitanyipodobné věci sdílí stejné vla...
NGD je vyjádřená vzorcem:m = log10(počet všech indexovaných stránek);fx = log10(počet výsledků pro slovo X);fy = log10(poč...
http://www.mechanicalcinderella.com/
FNDFacebook normalized distance vychází z Googlenormalized distanceLidé komentují na stránkách kandidátů, vůči kterým sepř...
FND je vyjádřená vzorcem:m = log10(počet všech českých účtů);fx = log10(počet komentujících na stránce X);fy = log10(počet...
Aplikacebuď objevování příbuzných stránek a tématči k mapování vztahů mezi stránkami
VyhledáváníNajdi mi stránky, které mají blízko k mojí
VztahováníKde se nachází moje stránka mezi ostatními
Mediální mapa FBJaké typy stránek máme mezi FB stránkami serveru
Velká mapa stránekNeziskovky, strany, média....
Případová studiePrezidentské volby 2013
Mapa prezidentských kandidátů 14. 1. 2013
Mapa prezidentských kandidátů 14. 1. 2013
Validace?zatím nepříméanalýza chování fanoušků při přesunu mezi voliči strana kandidátů (bude o ní mluvit Kamil Gregor)ana...
Hlavní úskalívelikosti korpus a průniku (vzorec funguje “vždy”)validaceúplnost korpusu při objevovánírelativní drahost
A ještě jedna ...Jak je to s fanoušky prezidentů teď...
Mapa prezidentských kandidátů 18. 1. 2013
Věda je tango mezi teorií adaty. To tango, které hraje jeale lidská představivost.Bez ní je věda nemožná.
Děkuji za pozornost!Otázky? Odpovědi?
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Shall we dance
Upcoming SlideShare
Loading in …5
×

Shall we dance

2,355 views

Published on

Science is tango between data and theory.
James Kobielus, IBM's big data evangelist

Published in: Education

Shall we dance

  1. 1. Science is tango betweendata and theory.James Kobielus, IBMs big data evangelist
  2. 2. Shall we danceJosef Šlerka, New Media Inspiration 2013Studia nových médií, Ataxo Interactive a.s.
  3. 3. Všechno co potřebujivědět o datech...... mne naučili filosofie
  4. 4. Myšlenky bez obsahu jsouprázdné, názory bez pojmůjsou slepé.Immanuel Kant, německý osvícenecký filosof
  5. 5. Obrazotvornost!
  6. 6. Žádný algoritmus z nebenespadl...staré programátorské přísloví
  7. 7. Sémiotická průpravaTypologie znaků a otázka sémiosisS čím si obrazotvornost hraje
  8. 8. A sign, or representamen, issomething which stands tosomebody for something insome respect or capacity.Charles Sanders Peirce, semiotik
  9. 9. Typologie znakůznak (sign), jeho Objekt a jeho interpretantsémiosis je činnost, která spojuje Z-O-Isémiosis je potencionálně nekonečnákomplexní systém znakůnejznámější ikon, index, symbol
  10. 10. Ikon a indexIkon je znak, který se vztahuje k Objektu a denotuje hojen díky svým vlastním rysům, které má bez ohledu nato, zda nějaký Objekt skutečně existuje anebo ne.Index je znak, který se vztahuje na Objekt a denotujeho tím, že je jím skutečně ovlivněný. Příkladem indexuje klepání na dveře.Ikony ani indexy však nic netvrdí, nýbrž ukazují.
  11. 11. SymbolSymbol je znak, který se vztahuje k Objektu adenotuje ho díky zákonu, většinou asociaci všeobecnéideje a tento zákon způsobuje interpretaci. Jinýmislovy znak tu nemá vztah ani podobnosti a ani faktickésouvislosti, ale jaké si značky pravidla, které námumožňuje spojení mezi jinak nespojitými věcmi.
  12. 12. Data jsou symbolická(konvenční) vyjádřeníindexů reality, už obsahujíurčitý pohled. Ale nicneříkají.
  13. 13. Nejsou data jako data.
  14. 14. Poslední filosofickálekce....
  15. 15. There are only two hardthings in ComputerScience: cache invalidationand naming thingsPhil Karlton, computer programmer
  16. 16. ... programátoři jsouvlastně filosofové
  17. 17. Facebook normalizeddistance ...... příběh jedné hypotézy a problémy, které jí provázejía provazely
  18. 18. Google distancepočítá se sémantická vzdálenostautory jsou Rudi Cilibrasi a Paul M. B. Vitanyipodobné věci sdílí stejné vlastnostitudíž se o nich mluví častěji dohromadydvě reprezentace jsou si tím podobnější, čím méněsložitých změn je třeba k převodu jedné v druhou
  19. 19. NGD je vyjádřená vzorcem:m = log10(počet všech indexovaných stránek);fx = log10(počet výsledků pro slovo X);fy = log10(počet výsledků pro slovo Y);fxy = log10(počet výsledků pro slovo X a Y);GND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  20. 20. http://www.mechanicalcinderella.com/
  21. 21. FNDFacebook normalized distance vychází z Googlenormalized distanceLidé komentují na stránkách kandidátů, vůči kterým sepředevším pozitivně, ale i negativně vymezují.Pohybují se v určitých myšlenkovinách rovinách čidiskursech
  22. 22. FND je vyjádřená vzorcem:m = log10(počet všech českých účtů);fx = log10(počet komentujících na stránce X);fy = log10(počet komentujících na stránce Y);fxy = log10(počet společných komentujících);FND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  23. 23. Aplikacebuď objevování příbuzných stránek a tématči k mapování vztahů mezi stránkami
  24. 24. VyhledáváníNajdi mi stránky, které mají blízko k mojí
  25. 25. VztahováníKde se nachází moje stránka mezi ostatními
  26. 26. Mediální mapa FBJaké typy stránek máme mezi FB stránkami serveru
  27. 27. Velká mapa stránekNeziskovky, strany, média....
  28. 28. Případová studiePrezidentské volby 2013
  29. 29. Mapa prezidentských kandidátů 14. 1. 2013
  30. 30. Mapa prezidentských kandidátů 14. 1. 2013
  31. 31. Validace?zatím nepříméanalýza chování fanoušků při přesunu mezi voliči strana kandidátů (bude o ní mluvit Kamil Gregor)analýza zájmů fanoušků (bude mluvit o ní JanSchmid)validace smysluplností
  32. 32. Hlavní úskalívelikosti korpus a průniku (vzorec funguje “vždy”)validaceúplnost korpusu při objevovánírelativní drahost
  33. 33. A ještě jedna ...Jak je to s fanoušky prezidentů teď...
  34. 34. Mapa prezidentských kandidátů 18. 1. 2013
  35. 35. Věda je tango mezi teorií adaty. To tango, které hraje jeale lidská představivost.Bez ní je věda nemožná.
  36. 36. Děkuji za pozornost!Otázky? Odpovědi?

×