Intervento di Chiara Faggiolani, Lorenzo Verna e Maurizio Vivarelli al convegno Open Data, Machine Learning e Biblioteche (7 novembre 2016, Biblioteca Sormani, Milano)
Ricerca dell'informazione specialistica nelle banche dati e nel web
Chiara Faggiolani, Lorenzo Verna, Maurizio Vivarelli. Lettura e big data: lavori in corso
1. Lettura e big data: lavori in corso
Chiara Faggiolani, Università La Sapienza, Roma
Lorenzo Verna, Tykli
Maurizio Vivarelli, Università di Torino
Open Data, Machine Learning e Biblioteche. Milano, 7 novembre 2016, Biblioteca Sormani, Sala del Grechetto
7. - 37%
I dati della lettura
LISU’s UK Statistics. Public and Academic Library Statistics, 2015
<http://www.lboro.ac.uk/microsites/infosci/lisu/lisu-statistics/lisu-uk-library-statistics.pdf>
Fonte: CIPFA. Performance in public services
- 28%
- 47%
- 40% + 3%
11. I libri più recensiti
La tabella mostra i libri più recensiD dagli
utenD italiani, in cui si intrecciano casi
le?erari (La solitudine dei numeri primi,
Harry Po4er), best seller effimeri (Fai bei
sogni), long seller (Siddharta, Il piccolo
principe, 1984).
Come si vede Gomorra si colloca al decimo
posto dell’elenco.
Sarebbe interessante, ad esempio, valutare
comparaDvamente questo elenco con quelli
o?enibili a parDre dai daD dei presDD delle
biblioteche.
12. Le recensioni di Gomorra
Gomorra. Viaggio nell'impero economico e nel
sogno di dominio della camorra è il primo romanzo
di Roberto Saviano, pubblicato da Mondadori nel
2006.
Ha venduto oltre 2 milioni di copie in Italia, ed oltre
10 nelle varie traduzioni.
Dal libro sono stati tratti un film, diretto da Matteo
Garrone (2008), ed una serie televisiva (2014).
Altre informazioni sul blog di Roberto Saviano,
http://www.robertosaviano.com/gomorra/.
13. Le recensioni di Gomorra
Pagina dedicata ad una edizione
italiana di Gomorra e accanto alcuni
esempi di recensioni, che contengono
l’indicazione della pagina del libro cui
sono riferite.
14. Gomorra, prima di aNobii
Un arDcolo
dedicato alla
storia di Gomorra
scri?o da
Edoardo
Brugnatelli,
h?ps://medium.com/
italia/roberto-saviano-
gomorra-le?ere-
inedite-7412f0f87464#.
647q6wuo2
15. La distribuzione delle recensioni
Il grafico mostra la
distribuzione delle
recensioni di Gomorra in
aNobii. La tecnica utilizzata
è quella del Ciclo dell’Hype.
Fonte: Edoardo Brugnatelli, Chiara
Faggiolani, Gomorra: 10 anni di
conversazioni su aNobii, in Le reti
della lettura, a cura di Chiara
Faggiolani e Maurizio Vivarelli, Milano,
Bibliografica, in corso di stampa.
16. Gomorra: le parole delle recensioni
Tabella che mostra la distribuzione
nel corpus delle «parole» nelle
recensioni, elencando i primi type,
ottenuti dopo il processo di
lemmatizzazione.
La ricerca è stata effe?uata con il
sojware open source IRaMuTeQ
(h?p://www.iramuteq.org/) , che
consente l’analisi staDsDca di daD
testuali.
Fonte: Edoardo Brugnatelli, Chiara Faggiolani,
Gomorra: 10 anni di conversazioni su Anobii,
in Le reti della lettura
TYPE OCCORRENZE FORMA GRAMMATICALE
LIBRO 1289 nom
SAVIANO 760 nr
LEGGERE 758 ver
CAMORRA 515 nom
PERCHÉ 410 nr
GOMORRA 358 nr
SCRIVERE 342 ver
DOVERE 340 ver
REALTÀ 261 nr
PRIMO 247 adj
RACCONTARE 242 ver
MONDO 225 nom
PROPRIO 221 adj
SISTEMA 209 nom
CAPIRE 206 ver
PARLARE 196 ver
PAROLA 193 nom
18. Metodologia dell’analisi di aNobii. 1
Qual è la natura dei daD abbiamo di fronte?
Abbiamo contenuD e metadaD Dpici di una pia?aforma social.
La scelta metodologica è stata quella di concentrarsi sull’ elemento
atomico centrale, cosDtuito dai metadaD che descrivono i ‘far’, le azioni
compiute in modo autonomo dai singoli utenD.
Possiamo considerare ognuno di quesD far come un traccia digitale.
Ciascuna traccia sedimenta nella pia?aforma un frammento informaDvo
eterogeneo: ad esempio un utente esprime una valutazione per un certo
libro, un utente segue un altro utente, un utente inizia a leggere un nuovo
libro, un utente esprime un commento, etc.
Abbiamo scelto di uDlizzare il formalismo delle ReD come supporto per
descrivere un sistema complesso, ed in tal modo perme?ere ai diversi
elemenD di relazionarsi.
19. Metodologia dell’analisi di aNobii. 1
Fase 1: la rete che si auto-genera
ParDamo con la definizione di una rete omnicomprensiva, ‘pia?a’, in cui non esiste
una gerarchia di relazioni, ed i cui nodi sono di diverso Dpo: libro, autore,
commentatore, commento, testo, conce?o, parola, etc.
Questa prima rete rappresenta i frammen2 e gli atomi del dato sorgente che si
organizzano in un sistema complesso. Le relazioni tra quesD nodi frammentaD ed
eterogenei sono date dalle azioni e interazioni che compiono gli utenD della
pia?aforma social.
Costruiamo questa rete lasciando che si auto-generi alimentandola con il contenuto e
i metadaD di ogni singolo commento espresso in lingua italiana.
Tur i frammenD–bit di informazione definiD dai daD e metadaD che corrispondono a
ciascun commento formano una rete molto estesa che al crescere del numero di
ogger che la alimentano andrà ad acquisire una propria stru?ura i cui nodi, ovvero gli
elemenD del sistema, avranno ruoli e dinamiche proprie.
20. Metodologia dell’analisi di aNobii. 2
Fase 2: la selezione del punto di vista e l’accesso ai da2
Dalla rete plain auto-generata calcoliamo e generiamo nuove reD specifiche i
cui nodi sono scelD a priori in base all’interesse del ricercatore rispe?o ad un
preciso tema di analisi. In queste nuove reD le relazioni sono calcolate sulla
base del comportamento di ciascuna coppia di nodi sulla rete plain originaria.
Abbiamo così la possibilità di generare la rete dei libri (Fig. 1), la rete dei le?ori
(Fig. 2), e la rete dei concer (Fig. 3).
21. Metodologia dell’analisi di aNobii. 2
La rete dei libri
Ciascun link è calcolato con una funzione di
network analysis per cui ad ogni enDtà è
associato un peso che ne specifica la forza. Ad
esempio il libro A e il libro B sono collegaD tra
loro con una certa intensità che esprime il
numero e la distanza dei nodi vicini sulla rete di
partenza. Cioè il libro A ed il libro B sono
collegaD con una forza di intensità 50 se
condividono il 50% dei le?ori, ovvero in questo
caso gli autori dei commenD che li riguardano.
In questo modo o?eniamo una nuova rete fa?a
di relazioni latenD non espresse in modo
esplicito nell’osservazione originaria del dato.
I grafi sono stati realizzati da Lorenzo Verna, Tykli.
Fig. 1
Fig. 1: la rete
dei libri
22. Fig. 2
Fig. 2: la rete
dei lettori
Fig. 3
Fig. 3: la rete
dei concetti
23. Metodologia dell’analisi di aNobii. 3
Fase 3: l’analisi dei da2
Dopo aver scelto una tra le reD possibili,
effe?uiamo l’analisi dei daD con gli
strumenD classici della Network Analysis.
Le misure di densità e di centralità ci
consentono di individuare le comunità di
nodi fortemente connessi tra loro, e di
valutare per ciascun nodo il loro grado di
importanza nella rete. Tornando alla rete
dei libri (Fig. 1), sono state individuate 15
classi (o comunità di libri), rappresentate
nella figura da colori diversi. Nella tabella
a fianco vengono elencaD alcuni libri
rappresentaDvi delle prime due classi.
24. Metodologia dell’analisi di aNobii. 4
Fase 4: la valutazione dei risulta2
L’ulDma fase prevede l’interpretazione dei risultaD emersi dall’analisi delle reD
descri?a in precedenza. Nel caso dei libri, ad esempio, abbiamo osservato come in
modo automaDco si siano formaD dei cluster sulla base del comportamento dei
le?ori rispe?o ai libri stessi.
Non si tra?a di libri che necessariamente immagineremmo ogge?o del medesimo
comportamento da parte del le?ore, eppure i daD lasciaD liberi di esprimersi ci
offrono una prospeLva inedita, che ci consente di effe?uare farsi domande ed
effe?uare ipotesi sulle relazioni tra i daD emerse.
Cosa hanno in comune l’autobiografia di un famosissimo tennista – Open di Andre
Agassi – e quello che è stato descri?o come «il più grande romanzo americano di cui
non avete mai senDto parlare», Stoner di John Edward Williams ?
25. Metodologia dell’analisi di aNobii. 4
Fase 4: la valutazione dei risulta2
Possiamo interpretare entrambi i volumi come collegaD al
campo di una «narraDva» di qualità che, evidentemente,
conDnua a vivere nei pensieri di molD le?ori, accomunaD dal
conta?o con opere in apparenza eterogenee e distanD.
Il professore universitario William Stoner e uno dei più grandi
e celebri tennisD di tur i tempi, Andre Agassi, toccano nel
le?ore sensibilità, ed arvano specifici modelli di ricezione.
Il le?ore me?e probabilmente la propria storia vicino a quella
dei due protagonisD dei libri, trovando in essi una
rappresentazione esterriorizzata delle proprie emozioni.