2. 2
Tärkeys
• Yksi graafiteorian pääkäyttökohteista sosiaalisten verkostojen
analyysissa on sosiaalisen verkoston tärkeimpien toimijoiden
tunnistaminen.
• Tärkeyden (importance, prominence) määritelmiä on useita,
mutta yhteistä niille on, että ne yrittävät kuvata ja mitata ”toimijan
sijainnin” ominaisuuksia sosiaalisessa verkostossa.
Varhaisempia esimerkkejä Morenon (1934) ”tähdet” ja
”eristäytyneet”.
• Käydään läpi käsitteet:
• keskeisyysaste (degree)
• closeness (läheisyys)
• välisyys (betweenes)
• informaation keskeisyys (information)
3. 3
Toimijan keskeisyys
• Tärkeät toimijat ovat laajasti osallisia yhteyksiin toisten toimijoiden
kanssa.
• Osallisuus tekee toimijoista enemmän näkyviä muille toimijoille.
• Toimijan keskeisyydessä ei ole väliä, onko toimija lähettänyt vai
vastaanottanut yhteyden. Soveltuu hyvin suuntaamattomille verkostoille,
joissa ei tehdä eroa lähettämisen ja vastaanottamisen välille.
• Suuntaamattomissa verkostoissa keskeinen toimija on siis sellainen, joka
on osallisena monissa yhteyksissä.
• Toimijan keskeisyys soveltuu esimerkiksi resurssien hallinnan ja pääsyn
sekä informaation välittämisen mittaamiseen (Knoke & Burt, 1983).
• Freeman (1977, 1979) on esittänyt seuraavaan notaation toimijan
keskeisyyden mitaksi:
• C on keskeisyyden mitta ni:n funktiona, jonka alaindeksi CA ilmaisee mittauksen
tyypin. Indeksi i saa arvot 1 – g.
4. 4
Toimijan arvostus
• Suunnatuissa verkostoissa erotetaan toisistaan yhteyksien lähettäminen
ja vastaanottaminen. Arvostettuja toimija on sellainen, joka on useampien
yhteyksien vastaanottaja.
• Toisin sanottuna arvostettu toimija on sellainen, jolla on suuri tuontiluku
(indegree).
• Huomaa, että jos tarkastellaan negatiivisia suhteita, kuten ”vihaa” tai ”ei
halua olla ystävä”, niin tällöin arvostetut toimijat eivät ole vertaistensa
kovasti arvostamia.
• Toimijan arvostusta on myös kutsuttu statukseksi (Moreno, 1934; Zeleny,
1940, 1941, 1960; Proctor & Loomis, 1951; Katz, 1953; Harary, 1959).
Wasserman & Faust (1994) sen sijaan puhuvat mielummin sijasta (rank).
• Olkoon, P, arvostuksen mittaus, joka määritellään toimijalle ni.
5. 5
Kertaus: Vienti- ja tuontiluvut (Miilumäki
2009)
• Suunnatuille verkoistoille solmujen vienti- (outdegree)
ja tuontiluvut (indegree) ovat helposti laskettavissa
sosiomatriisin X avulla.
• dO = solmun vientiluku
• dI = solmun tuontiluku
• Arvostetut toimijat ovat yleensä niitä, joilla on suuret
tuontiluvut, tai joihin kohdistuu suuri määrä
vastaanotettuja ”valintoja”.
6. 6
Tärkeyden mitta
• Hubbelin (1965) ja Friedkinin (1991) mukaan tärkeyden mittauksessa
pitää ottaa huomioon suorien (direct) ja viereisten (adjacent) yhteyksien
lisäksi epäsuorat polut .
• Esim. LinkedIn:
7. 7
Keskeisyys ja keskittyneisyys
• Keskeisyys (centrality) on toimijan ominaisuus
• Keskittyneisyys (centralisation) on koko verkoston
ominaisuus
• Keskittyneisyys mittaa koko verkoston tasolla, missä
määrin yksittäiset toimijat hallitsevat muiden välistä
kanssakäymistä.
• ”Tähti” on kaikkein keskittynein verkosto ja ”pyörä” kaikkein
vähiten keskittynyt.
Siivonen 2003
8. Kolme havainnollista verkostoa 8
keskeisyyden (keskittyneisyyden) ja
arvostuksen tutkimiseen
Tähti Maksimaalisen keskittynyt, 0111111
kaikki solmut jäsentyvät 1000000
yhden keskeisen solmun 1000000
ympärille 1000000
1000000
1000000
0100001
Pyörä Keskittyneisyys äärimmäisen 1010000
vähäinen, solmut kytkeytyvät 0101000
toisiinsa ilman, että yksikään 0001010
solmu olisi keskeisempi kuin 0000101
toinen 1000010
0110000
1001000
1000100
Ketju Löyhempi kuin tähti, 0100010
mutta keskittyneempi 0010001
kuin pyörä 0001000
0000100
9. 9
Näkyvyys ja tärkeys -käsitteet
Knoke and Burt 1983 Wasserman & Faust 1994
Visibility
(superordinate concept) = Prominence
(superordinate concept)
CAN BE CAN BE
STUDIED BY STUDIED BY
Centrality Prestige Centrality Prestige
(level two concept) (level two concept) (level two concept) (level two concept)
Käsitekartta: Novak 1998
10. 10
Prominence: Centrality and Prestige
Prominence
Centrality Prestige
Degree Closeness Betweeness Information Degree Proximity Status or Rank
Centrality Centrality Centrality Centrality Prestige Prestige Prestige
Wasserman & Faust 1994
11. 11
Tärkeys: keskeisyys ja arvostus
Tärkeys
Keskeisyys Arvostus
Keskeisyysaste Läheisyys Välillisyys Informaation Degree Proximity Status or Rank
keskeisyys Prestige Prestige Prestige
Wasserman & Faust 1994
12. 12
Keskeisyysaste
• Keskeisyysaste (degree)
• Kertoo, kuinka monta suoraa yhteyttä toimijalla on
muihin toimijoihin
• Jos verkostoaineisto on suunnattu, voidaan
laskea erikseen lähettäjäkeskeisyys (outdegree)
ja vastaanottajakeskeisyys (indegree)
• Keskeisyysastetta läheinen indeksi on ego tiheys
(ego density) (Burt 1982, Knoke & Kuklinski
1982). Ego tiheys on suhdeluku toimijan suorista
yhteyksistä kaikkiin mahdollisiin yhteyksiin
suuntaamattomissa verkostoissa.
13. 13
Keskeisyysasteen mitta
• Standardi mittana Wasserman & Faust (1994) esittävät seuraavan
kaavan:
d (n )
C (n )
' i
g 1
D i
• Joka kuvaa osuutta solmuja jotka ovat viereisiä ni. C’D(ni) on itsenäinen
g:stä, jolloin sitä voidaan verrata eri kokoisiin verkostoihin.
• Esimerkiksi asteluku seitsemälle toimijalle tähtigraafissa ovat 6 (ni:lle) ja 1
(n2-n7). Jolloin jakaja standardoidulle toimija indeksille C’D(ni) on g-1=6.
Standardoitu indeksi saa arvot {1.0, 0.167, 0.167, 0.167, 0.167, 0.167,
0.167).
• Pyörägraafille asteluku on kaikille d(ni)=2, joten kaikki indeksit ovat
yhtäsuuria: C’D(ni) = 0.333.
• Vastaavasti ketjugraafissa n1-n5 on kaikilla : C’D(ni) = 0.333, mutta kaksi
viimeistä toimijaa C’D(n6) = C’D(n7) = 0.167 –ovat vähemmän keskeisiä.
15. 15
Läheisyys
• Ideana on, että toimija on keskeinen jos se
kykenee nopeasti vuorovaikutukseen muiden
kanssa
• Läheisyys (closeness) on toimijan lyhyimpien
polkujen summa kaikkiin verkoston muihin
toimijoihin
• dij on lyhyimmän polun pituus i:n ja j:n välillä
n
ci d ij
j i
• Huomaa tulkinnassa, että pieni arvo tarkoittaa
keskeistä pistettä
16. 16
Läheisyyden mitta
• Sabidussin (1966) esittämä läheisyys:
g
CC (ni ) [ d (ni , n j )]1
j 1
• ja Beauchamp (1965) esittämä ”standardi” läheisyys:
CC (ni ) ( g 1)CC (ni )
'
• Tämä standardoitu indeksi saa arvot välillä 0 ja 1, ja se voidaan ajatella
käänteisenä etäisyynä toimija i:stä muihin toimijoihin.
17. 17
Kertaus: Geodeesit ja etäisyys
(Miilumäki 2009)
• Geodeesit eli solmujen lyhimmät etäisyydet
esitetään usein etäisyysmatriisin (distance
matrix) avulla
• Etäisyysmatriisin alkiot d(i, j) ilmoittavat solmujen
ni ja nj välisemmän lyhimmän etäisyyden
pituuden
18. 18
Välillisyys
• Välillisyys (betweenness) mittaa, kuinka monen
toimijaparin välisen lyhyimmän polun varrelle
toimija sijoittuu
• Jos piste sijaitsee useiden muiden pisteiden
välillä, se pystyy säätelemään esim. tiedon
kulkua näiden välillä (portinvartijat)
• Piste voi olla (lokaalisti) hyvin epäkeskeinen,
mutta sen välillisyys voi silti olla hyvin suuri
19. 19
Välillisyyden mitta
• Esimerkiksi solmujen lyhimmät etäisyydet (geodeesi) toimijoiden n2 ja n3
välillä on n2n1n4n3 – eli lyhyn polku näiden kahden toimijan välillä kulkee
kahden toimijan n1 ja n4 kautta- voidaan sanoa, että n1 ja n4 on vaikutusta
n2 ja n3 välisessä vuorovaikutuksessa.
• Toimija on siis keskeinen jos sen on useiden toimijoiden ja niiden
geodeesien välissä, jolloin toimijalla on suuri keskeisyys välillisyys.
• Välillisyyden mitta voidaan pukea seuraavaan kaavaan:
CB (ni ) g jk (ni ) / g jk
j k
• jossa gjk on j ja k toimijoiden yhdistävien geodeesien lukumäärä. Koska
mikä tahansa geodeesi on yhtä todennäköinen, niin todennäköisyys
minkä tahansa geodeesin kautta on 1 / gjk (Freeman)
• joka on standardoituna:
CB (ni ) CB (ni ) /[( g 1)( g 2) / 2]
'
20. 20
Kritiikkiä Freemanin (1979)
välillisyydelle
• Freeman (1979) olettaa, että kaikki geodeesit ovat yhtä todennäköisiä,
huomioimatta toimijoita. Jotkut toimijat saattavat kuintenkin olla
keskeisempiä keskeisyysasteeltaan, esim. jonkun toimijan keskeisyysaste
voi olla 10 kun toisen toimijan 3, tällöin yleensä sellainen toimija valitaan
todennäköisemmin joka on keskeisempi.
• Freeman (1979) olettaa myös, että aina mennään lyhintä reittiä pitkin, eli
keskitityyn vain geodeeseihin, vaikka jossain tapauksissa pidemmän reitit
tai polut saattavat olla todennäköisempiä.
21. 21
Informaation keskeisyys
• Stephensonin ja Zelenin (1989) keskeisyyden indeksi vastaa tähän
kritiikiin, ja huomioi kaikki polut sekä niiden painoarvot.
• Geodeeseille yleensä annetaan painoarvoina niiden yhteneväisyydet.
Kun taas poluille joiden pituus on pidempi kuin geodeesin pituus
annetaan pienemmät painoarvot sen mukaan mitä informaatiota ne
sisältävät. Polun informaatio on yksinkertaisesti määritelty sen pituuden
inverssinä.
22. 22
Informaation keskeisyyden mitta
• Informaatio keskeisyyden laskemiseksi tarvitaan kaksi välillistä arvoa.
Nämät ovat summa-arvoja: C : T g ja R g
c i 1 ii
c j 1 ij
• T on yksinkertaisesti summa kaikista matriisin diagonaalisista arvoista, ja
R on joku rivi summista (kaikki rivi summat ovat yhtäsuuria). Näiden
kahden arvojen avulla voidaan vihdoin laskea informaation keskeisyys
indeksi toimijalle i: 1
CI (ni )
cii (T 2 R) / g
• Tämä indeksi mittaa kuinka paljon informaatiota sisältyy polkuihin jotka
alkavat (ja päättyvät) tiettyyn toimijaan. Indeksin minimiarvo on 0, mutta
sillä ei ole maksimiarvoa; jos T = 2R, ja Cii = 0, niin indeksi on ääretön.
Stephenson ja Zelen (1989) suosittelevat että käytetään suhteellista
informaatio indeksi, joka saadaan jakamalla jokainen indeksi (CI(ni)
kaikilla indekseillä: C (n )
CI' (ni) I i
C (n )
i I i
23. 23
Lähteet
• Johanson, J-E., Mattila, M., Uusikylä, P. 1995. Johdatus
verkostoanalyysiin. http://www.valt.helsinki.fi/vol/kirja/.
• Novak, J.D. 1998. Learning, Creating and Using Knowledge: Concept
Maps as Facilitative Tools in Schools and Corporations. New York,
Lawrence Erlbaum Associates.
• Miilumäki, T. 2009. Matriisit verkostojen mallintamisessa.
• Siivonen, V. 2003. Johdatus verkostoanalyysiin.
http://www.valt.helsinki.fi/blogs/ville.siivonen/Luento%202.pdf
• Wasserman, S., Faust, K. 1994. Social Network Analysis, Methods and
Applications.