Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Data, informace, 
zákony a indexy 
Josef Šlerka, Studia nových médií, Socialbakers
Obsah 
1. DIKW aneb obecný rámec 
2. Zákony a paradoxy (a slepé cesty) 
3. Social Heatlh Index - případová studie 
4. Disk...
1. DIKW 
Data, Information, Knowledge, Wisdom
2. Zákony a paradoxy 
(a také slepé cesty)
Zákony a paradoxy 
2.1. Medián a průměr 
2.2. Zákon velkých čísel 
2.3. Benfordův zákon 
2.4. Simpsonův paradox 
2.5. Mato...
2.1. Medián a průměr 
Malá cesta v čase... To psal rok 2013 a my jsme s 
Eliškou Hutníkovou prezentovali data o českém 
Fa...
Tisíce fanoušků má 
přeci každá stránka, 
tak proč my ne!
Ověření 
analýza informací o FB stránkách přes API 
celkem indexujeme něco přes 23.000 stránek 
jen něco přes 11.000 bylo ...
Zjištění 
průměrně má česká aktivní stránka 4.169 
fanoušků 
median je 356, tedy více než 10x méně 
skoro 90 procent strán...
2.1. Medián a průměr 
Medián je hodnota, jež dělí řadu vzestupně 
seřazených výsledků na dvě stejně početné poloviny. 
Ve ...
2.1. Medián a průměr 
Aritmetický průměr je statistická veličina, která v jistém 
smyslu vyjadřuje typickou hodnotu popisu...
2.2. Zákon velkých čísel 
Když máte fanoušky, kteří mají hodně followerů, asi 
jsou kvalitěnější (známější, vlivnější)...
2.2. Zákon velkých čísel 
Vezměme čtyři účty: 
@O2GuruCZ (cca 1.700) 
@o2_cz (cca 6.500) 
@tmobile_cze (cca 4.200) 
@Vodaf...
2.2. Zákon velkých čísel
2.2. Zákon velkých čísel 
In probability theory, the law of large numbers (LLN) is 
a theorem that describes the result of...
2.3. Benfordův zákon 
Benfordův zákon je matematický zákon, který říká, že 
v mnoha souborech přirozených dat (ale ne ve v...
2.4. Simpsonův paradox 
KLM AirFrance 
Ruzyň 30% 25% 
Frankfurt 100% 75% 
kdo je lepší průměr 65%? průměr 50%? 
Kolik letů...
2.4. Simpsonův paradox 
... no vida? 
KLM AirFrance 
Ruzyň 2 z 6 1 ze 4 
Frankfurt 2 ze 2 12 z 16 
kdo je lepší 4 z 8 (50%...
2.4. Simpsonův paradox 
Simpsonův paradox je statistický paradox při 
porovnání úspěšností dvou individuí (skupin) během 
...
2.5. Matoušův efekt 
In sociology, the Matthew effect (or accumulated 
advantage) is the phenomenon where "the rich get 
r...
2.5. Matoušův efekt 
>1 0 a 1 
18% 
82% 
@tmobile_cze 
>1 0 a 1 
17% 
83% 
@o2_cz
2.5. Matoušův efekt 
>1 0 a 1 
49% 51% 
@radeksikorski 
(sample) 
>1 0 a 1 
51% 49% 
@Vodafone_cz 
(sample)
2.6. Bonus 
Social network analysis a profiling vlivných účtů pro 
@stunome...
3. Social Health Index 
SoHI aneb případová studie: Socialbakers a Lenovo
3. Social Health Index 
Vstupní požadavky: vytvořit metriku, která bude 
nakonec redukovatelná na jedno číslo, které zárov...
3. Social Health Index 
Obecně chce většina firem na sítích: 
získávat nové klienty a 
udržet si stávající a 
zapojit je a...
3. Social Health Index 
P - participace 
A - akvizice 
R - retence 
S - sdílení 
a KPI plus shluky
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index 
Vypadá to jednoduše, že? 
Ale nakonec to bylo pět měsíců diskusí a vývoje. 
Speciální díky patří E...
Král indexů....
4. Diskuse 
tedy pokud to technicky jde...
Děkuji za pozornost! 
@josefslerka
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Data, informace, zákony a indexy
Upcoming SlideShare
Loading in …5
×

Data, informace, zákony a indexy

1,724 views

Published on

Pár poznámek datům a jedna případová studie.

Published in: Data & Analytics
  • Be the first to comment

Data, informace, zákony a indexy

  1. 1. Data, informace, zákony a indexy Josef Šlerka, Studia nových médií, Socialbakers
  2. 2. Obsah 1. DIKW aneb obecný rámec 2. Zákony a paradoxy (a slepé cesty) 3. Social Heatlh Index - případová studie 4. Diskuse 5. Konec
  3. 3. 1. DIKW Data, Information, Knowledge, Wisdom
  4. 4. 2. Zákony a paradoxy (a také slepé cesty)
  5. 5. Zákony a paradoxy 2.1. Medián a průměr 2.2. Zákon velkých čísel 2.3. Benfordův zákon 2.4. Simpsonův paradox 2.5. Matoušův efekt 2.6. Bonus
  6. 6. 2.1. Medián a průměr Malá cesta v čase... To psal rok 2013 a my jsme s Eliškou Hutníkovou prezentovali data o českém Facebooku....
  7. 7. Tisíce fanoušků má přeci každá stránka, tak proč my ne!
  8. 8. Ověření analýza informací o FB stránkách přes API celkem indexujeme něco přes 23.000 stránek jen něco přes 11.000 bylo za poslední měsíc alespoň jednou aktivních pro analýzu jsme využili jen stránky aktivní v minulém měsící
  9. 9. Zjištění průměrně má česká aktivní stránka 4.169 fanoušků median je 356, tedy více než 10x méně skoro 90 procent stránek na českém Facebooku má méně fanoušků než je průměr jen horních 7 procent jich má více než 10.000 v případě počtu fanoušků Facebook stránek je metrika průměru naprostej bullshit
  10. 10. 2.1. Medián a průměr Medián je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd. (Wikipedie)
  11. 11. 2.1. Medián a průměr Aritmetický průměr je statistická veličina, která v jistém smyslu vyjadřuje typickou hodnotu popisující soubor mnoha hodnot. Aritmetický průměr se obvykle značí vodorovným pruhem nad názvem proměnné, popř. řeckým písmenem μ. Definice aritmetického průměru je (...) součet všech hodnot vydělený jejich počtem. V běžné řeči se obvykle obecným slovem průměr myslí právě aritmetický průměr. (Wikipedie)
  12. 12. 2.2. Zákon velkých čísel Když máte fanoušky, kteří mají hodně followerů, asi jsou kvalitěnější (známější, vlivnější)...
  13. 13. 2.2. Zákon velkých čísel Vezměme čtyři účty: @O2GuruCZ (cca 1.700) @o2_cz (cca 6.500) @tmobile_cze (cca 4.200) @Vodafone_cz (cca 32.400)
  14. 14. 2.2. Zákon velkých čísel
  15. 15. 2.2. Zákon velkých čísel In probability theory, the law of large numbers (LLN) is a theorem that describes the result of performing the same experiment a large number of times. According to the law, the average of the results obtained from a large number of trials should be close to the expected value, and will tend to become closer as more trials are performed. (http://en.wikipedia.org/wiki/ Law_of_large_numbers)
  16. 16. 2.3. Benfordův zákon Benfordův zákon je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) čísla mnohem častěji začínají číslicí 1 než na jiné číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší je počáteční číslice, tím méně pravděpodobněji se na začátku čísel objevuje. (http://cs.wikipedia.org/wiki/ Benford%C5%AFv_z%C3%A1kon)
  17. 17. 2.4. Simpsonův paradox KLM AirFrance Ruzyň 30% 25% Frankfurt 100% 75% kdo je lepší průměr 65%? průměr 50%? Kolik letů bylo zpožděných...
  18. 18. 2.4. Simpsonův paradox ... no vida? KLM AirFrance Ruzyň 2 z 6 1 ze 4 Frankfurt 2 ze 2 12 z 16 kdo je lepší 4 z 8 (50%) 13 z 20 (65%)
  19. 19. 2.4. Simpsonův paradox Simpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval. (http://cs.wikipedia.org/wiki/Simpson
  20. 20. 2.5. Matoušův efekt In sociology, the Matthew effect (or accumulated advantage) is the phenomenon where "the rich get richer and the poor get poorer". In both its original and typical usage it is meant metaphorically to refer to issues of fame or status but it may also be used literally to refer to cumulative advantage of economic capital. (Wikipedia)
  21. 21. 2.5. Matoušův efekt >1 0 a 1 18% 82% @tmobile_cze >1 0 a 1 17% 83% @o2_cz
  22. 22. 2.5. Matoušův efekt >1 0 a 1 49% 51% @radeksikorski (sample) >1 0 a 1 51% 49% @Vodafone_cz (sample)
  23. 23. 2.6. Bonus Social network analysis a profiling vlivných účtů pro @stunome...
  24. 24. 3. Social Health Index SoHI aneb případová studie: Socialbakers a Lenovo
  25. 25. 3. Social Health Index Vstupní požadavky: vytvořit metriku, která bude nakonec redukovatelná na jedno číslo, které zároveň bude mít smysl, zároveň bude umožňovat porovnat výkon kampaní v sociálních sítích s konkurencí, bude transparentní, bude umžňovat porovnání klastrů, půjde rozšířit a bude stabilní proti výkyvům. Proč? Protože současné obecné metriky (Klout a spol.) řadu těchto požadavků nesplňují
  26. 26. 3. Social Health Index Obecně chce většina firem na sítích: získávat nové klienty a udržet si stávající a zapojit je a udělat z nich obhájce a měřit svůj výkon proti konkurenci a počítat finančně svůj výkon
  27. 27. 3. Social Health Index P - participace A - akvizice R - retence S - sdílení a KPI plus shluky
  28. 28. 3. Social Health Index
  29. 29. 3. Social Health Index
  30. 30. 3. Social Health Index
  31. 31. 3. Social Health Index
  32. 32. 3. Social Health Index
  33. 33. 3. Social Health Index
  34. 34. 3. Social Health Index Vypadá to jednoduše, že? Ale nakonec to bylo pět měsíců diskusí a vývoje. Speciální díky patří Elišce Hutníkové!
  35. 35. Král indexů....
  36. 36. 4. Diskuse tedy pokud to technicky jde...
  37. 37. Děkuji za pozornost! @josefslerka

×