Sunteți pe pagina 1din 25

ANALIZA RETELELOR SOCIALE

Modelarea Proceselor sociale


Metode de analiza
Statistica: ncearc s determine proprietile statistice
ale reelelor complexe, proprieti cu ajutorul crora
putem caracteriza structura i comportamentul
sistemelor care includ astfel de reele;
Modelare: ncearc creeze modele ale reelelor cu
ajutorul crora s nelegem mai bine proprietile
reelelor i efectele lor asupra sistemelor complexe.
Analitica: ncearc s gseasc regulile i legitile care
guverneaz evoluia reelelor, astfel nct s se poat
stabili modul n care aceste reguli i legiti
influeneaz vrfurile individuale sau o parte a reelei.

TIPURI DE RETELE
Reele sociale:
Colaborarea actorilor;
Comitete de direcie;
Contacte tiinifice;
Mesaje e-mail;
Contacte sexuale .a.
Reele informaionale:
World Wide Web;
Reele de citri;
Reele tehnologice:
Internetul;
Reeaua de calculatoare Grid;
Pachetele software;
Circuitele electronice;
Reeaua de aeroporturi europene;
Reeaua de cale ferat dintr-o tara;
Reele biologice:
Reele metabolice;
Reele genetice;
Reele neurale;
Reele ecologice etc.
PROPRIETATI ALE RETELELOR
Conectivitatea = gradul n care vrfurile unei
reele sunt conectate direct. O reea cu o
conectivitate nalt are un numr mare de
laturi n raport cu numrul de vrfuri. Pentru a
calcula conectivitatea unei reele cu N vrfuri
i k laturi, avem:

) 1 (
=
N N
k
C
Distribuia gradelor
- Gradul unui vrf ntr-o reea este dat de
numrul de laturi sau conexiuni ale unui nod.
- Funcia de distribuie P(k) d probabilitatea ca
un vrf ales in mod aleatoriu s aib exact k
laturi.
- Reprezentarea lui P(k) pentru o reea
complex formeaz o histogram a gradelor
asociate vrfurilor, aceasta reprezentnd
distribuia gradelor sau numrul de vrfuri
care au acelai numr de laturi din reea.
Drumul mediu de lungime minim
Lungimea drumului mediu, L , reprezint numrul
mediu de laturi sau arce dintre vrfuri, care
trebuie s fie strbtute pe drumul cel mai scurt
dintre dou vrfuri oarecare dintr-o reea. Acest
numr se calculeaz cu ajutorul relaiei:


unde l
min
(i,j) este distana minim dintre vrfurile v
i

i v
j
iar N(N-1)/2 este numarul perechilor de
noduri.
) , (
) 1 (
2
1 1
min
j i l
N N
L
N
i
N
j

= =

=
Diametrul reelei
Diametrul unei reele, D este cel mai lung drum
minim dintre doua noduri din reea. Diametrul
este definit ca:


Unde xi si xj sunt cele mai indepartate 2 noduri
din retea.
) , ( max
min
,
j i l D
j i
=
Coeficientul de clusterizare
- Pentru un vrf dat, v
i
dintr-o reea cu k
i
vecini,
gradul de clusterizare n jurul vrfului v
i
este
definit ca raportul dintre numrul de legturi
existente n realitate intre cei k
i
vecini i
numrul total de legturi poteniale dintre
acestia.
- Fie E
i
numrul de legturi existente ntre cei ki
vecini. Coeficientul de clusterizare este atunci
dat de:

=

=
N
i
i i
i
k k
E
N
CC
1
) 1 (
1
Subgrafuri
- subgraf = submultime de noduri a unui graf impreuna cu arcele adiacente
acestor noduri din graful total care au anumite proprieti comune ale
vrfurilor i/sau laturilor.
- un graf G
i
constnd dintr-o mulime de vrfuri V
i
i o mulime de laturi E
i

se numete subgraf al lui G={V, E} dac V
i
inclus in V i E
i
inclus in E.
- cele mai simple exemple de subgrafe sunt ciclurile, arborii i subgrafurile
complete.
- Graf partial: subgraf in care V
i
= V
- ciclu = drum nchis de k laturi, astfel nct diecare dou laturi consecutive
au doar un vrf comun.
- arbore = graf conex fara cicluri. Gradul mediu al unui arbore de ordin k
este dat de:


si tinde ctre 2 cu ct arborele are dimensiuni mai mari.
- subgraf complet de ordin k: are k vrfuri i toate laturile posibile ntre
acestea toate vrfurile din subgraful complet sunt conectate la celelalte
vrfuri.

k
k
2
2 = ) (
Mrimea componentei gigant
- n general, o reea complex poate conine pri care pot fi deconectate (separate) de
reea atunci cnd analiza o impune.
- component puternic conectat = un cluster de vrfuri din care se poate atinge oricare
vrf al acestui cluster.
- Dac cea mai mare component puternic conectat conine o parte finit a mulimii
vrfurilor dintr-o reea, aceasta se numete component puternic conectat gigant.








Clusterele conectate obinute dintr-o reea complex orientat prin ignorarea direciei
arcelor acesteia se numesc componente slab conectate i se poate defini componenta
slab conectat gigant ca acea component slab conectat care are vrfurile cele mai
multe.
Criticalitatea = existena unui prag critic ncepnd de la care se formeaz componentele
gigant. Sub acest prag, reeaua exist sub forma unor subgrafe deconectate. Peste acest
prag, graful se transform ntr-un cluster complet conectat.



Criticalitatea
Consta in existena unui prag critic ncepnd de
la care se formeaz componentele gigant. Sub
acest prag, reeaua exist sub forma unor
subgrafe deconectate. Peste acest prag, graful
se transform ntr-un cluster complet
conectat.

Figura 4.11 Fenomene critice n reele complexe
4.4 Modelarea evoluiei reelelor complexe
4.4.1 Modelul grafelor aleatoare (Erds i Renyi)
Modelul minimal al grafelor aleatoare are N noduri (vrfuri) legate ntre ele
prin arce sau laturi plasate ntre perechi de vrfuri alese aleator.
Fie G
N,p
graful n care ntre dou vrfuri exist un arc cu o probabilitate egal cu
p. De fapt, G
N,p
reprezint o mulime de grafe cu N vrfuri, n care fiecare
graf are o anumit probabilitate de apariie a laturilor.
Vom exprima proprietile lui G
N,p
n funcie de p, care este gradul mediu al
unui vrf, adic numrul mediu de laturi incidente acelui vrf.
Numrul de arce dintr-un graf aleator este dat de
iar numrul de terminaii ale laturilor este 2, deoarece fiecare latur are dou
puncte terminale (dou vrfuri n care incepe i se termin). Astfel, vom
avea un numr de N/2 astfel de terminaii.
2
) 1 ( p N N
Atunci gradul mediu al unui vrf oarecare se scrie:


deoarece N este foarte mare.
Deci, dac cunoatem numrul de vrfuri N, atunci orice proprietate care poate
fi exprimat n funcie de acesta poate fi exprimat i n funcie de gradul
mediu al unui vrf, z. z se mai numete i numr de coordonare al reelei.
Probabilitatea p
k
ca un vrf dintr-o reea aleatoare s aib gradul egal exact cu
k este dat de distribuia de probabilitate binomial:


Atunci cnd numrul de vrfuri din reea, N este mult mai mare dect kz,
distribuia de probabilitate a gradelor medii ale vrfurilor devine:


care este distribuia de probabilitate Poisson.
Np p N
N
p N N
z ~ =

= ) 1 (
) 1 (
( )
k N k N
k k
p p p

= ) 1 (
! k
e z
p
z k
k

=
Grafele aleatoare au anumite proprieti interesante. De exemplu, dac o
persoan A dintr-un astfel de graf are z vecini i fiecare vecin al su are, de
asemenea, z vecini, atunci A are z
2
vecini de ordinul doi. Extinznd
argumentaia, A are z
3
vecini de ordinul trei, z
4
vecini de ordinul patru
.a.m.d. Deoarece multe persoane au ntre 100 i 1000 de cunotine, rezult
c z
4
este ntre 108 i 1012 (dac z = 100 = 10
2
atunci z
4
= 108 i dac z =
1000 = 10
3
atunci z
4
= 10
12
) mrimi care sunt comparabile cu ntreaga
populaie a omenirii.
Notnd cu S gradul de separare care constituie puterea lui z pentru care se
poate atinge ntreaga populaie, atunci , de unde obinem prin
logaritmare
Creterea logaritmic a numrului de grade de separare odat cu creterea
mrimii reelei complexe se numete efect de lume mic (small-world effect)
i este una dintre cele mai interesante proprieti ale unor astfel de reele.
Deoarece log N crete lent odat cu creterea lui N, rezult c numrul de
grade de separare rmne mic chiar i n condiiile n care N devine foarte
mare.
N z
S
=
. log / log z N S =
O alt proprietate a grafelor aleatoare ca modele ale reelelor sociale complexe
se refer la faptul c cercurile de cunotine ale persoanelor tind s se
suprapun n mare parte. Prietenii prietenilor ti pot fi i prietenii ti. Acest
lucru face ca n reelele sociale reale s nu fie adevrat c o persoan are z
2

vecini de ordinul doi, deoarece multe dintre aceste persoane se regsesc i
printre vecinii de ordinul unu ai lui A. o astfel de proprietate se numete
clusterizarea reelelor.
Un graf aleatoriu nu are proprietatea de clusterizare deoarece probabilitatea ca
doi dintre prietenii lui A s fie prieteni unul cu cellalt nu este mai mare
dect probabilitatea ca dou persoane alese aleatoriu s fie prieteni. Pe de
alt parte, clusterizare apare n mod clar ntr-un numr de reele complexe
reale.
tim c coeficientul de clusterizare, C a fost definit ca fracia medie a perechilor
de vecini ai unui vrf care sunt, de asemenea, vecini unul cu cellalt. ntr-o
reea complet conectat, deci n care fiecare vrf este conectat cu toate
celelalte, C = 1; ntr-un graf aleator ns C = z/N , care este foarte mic pentru
reele de dimensiuni mari.
O alt diferen dintre grafele aleatoare i reelele reale este n ceea ce
privete distribuia gradelor care, n cazul reelelor foarte mari este de
tip Poisson n cazul primelor i o distribuie de tip putere n cazul al
doilea. O distribuie a gradelor de tip putere este de forma:


unde este un numr real mai mare ca zero.
Reelele aleatoare se pot realiza i cu ajutorul calculatorului, plecnd de la o
latice (o mulime de puncte uniform distribuite, de exemplu sub form
de cerc) ntre care se duc arce prin alegerea aleatoare a dou puncte ale
laticei. n figura 4.12 se reprezint un astfel de graf aleator obinut dintr-
o latice cu probabilitile de conectare pk egale cu 0.0, 0.05, 0.10 i,
respectiv, 0.15.
o
~ k p
k
Se observ c cu ct p
k
este ales mai mare, graful i pierde caracterul de latice i se
apropie tot mai mult de forma unui graf aleator. De fapt, pentru o valoare relativ mic
a lui p
k
, graful are o distan medie scurt ntre vrfuri fr o schimbare apreciabil a
gradului de clusterizare.
Acest lucru explic efectul de lume mic despre care am mai vorbit i care a dus la
apariia unei alte clase de modele ale reelelor.
4.4.2 Modelul reelelor lumii mici
Ctre sfritul anilor 60 ai secolului trecut, Milgram (1967) a efectuat un
experiment devenit faimos. Dei nu exista o reea fizic n spatele acestui
experiment, rezultatele arat fora deosebit a structurii reelelor sociale
complexe.
n esen, experimentul examineaz lungimea drumurilor dintre vrfurile unei
reele sociale, cerndu-se participanilor la acest experiment s trimit o
scrisoare unuia dintre cunoscuii si direci, cu rugmintea ca aceasta s fie
transmis mai departe n acelai mod, pn cnd i atinge inta,
reprezentat de un destinatar final. Dei multe scrisori s-au pierdut pe
drum i nu au mai ajuns la destinaie, aproape un sfert dintre ele i-au atins
inta.
n medie, o scrisoare a trebuit s treac prin minile a cinci sau ase persoane
pn cnd a ajuns la destinaie. Acest experiment a reprezentat sursa
popularului concept de ase grade de separare.
Dac considerm o reea neorientat i L este distana medie geodezic (cea
mai scurt) dintre perechile de vrfuri ale reelei, atunci:

>

=
j i
ij
d
N N
L
) 1 (
2
unde d
ij
reprezint distana geodezic de la vrful i la vrful j. Se observ c n
aceast medie se include i distanta la un vrf la al nsui (care este zero).
n tabelul 4.2 sunt date distanele medii geodezice pentru cteva tipuri de
reele complexe.
TIPUL DE REEA N
\(Numrul de vrfuri)
M
(Numrul de arce)
L
(Distana medie
geodezic)
Reeaua actorilor de
film
449913 25316482 3.48
Directori de companii
7673 55392 4.60
Mesaje e-mail
59912 86300 4.95
Internet
10697 31992 3.31
Reea de ci ferate
587 19603 2.16
Reea metabolic
765 3686 2.56
Reea neuronal
307 2359 3.97
Reea ecologic
submarin
135 598 2.56
Relaii interstudeni
573 477 16.01
Studiile fcute pe diferite tipuri de reele reale au artat c efectul de lume
mic este aproape general. n tabelul 4.2 se prezint cteva valori calculate
ale lui L i se observ c pot exista i reele n care efectul de lume mic s
nu apar. Chiar dac el nu apare la nivelul ntregii reele, ca n cazul reelei
de relaii dintre studeni, acest efect este prezent la nivelul componentei
gigant a reelei respective. Aceast component gigant reprezint
subreeaua format de cel mai numeros grup de prieteni care poate fi
extras din mulimea total a studenilor.
Efectul de lume mic are implicaii mari asupra dinamicii proceselor care se
petrec ntr-o reea. De exemplu, dace consider procesul de difuzare a
informaiei sau al oricrui lucru din cadrul reelei, efecul de lume mic
implic faptul c acest proces se desfoar cu o vitez mare n cadrul
ntregii reele. Vor fi necesari maximum ase pai pentru ca informaia s
ajung la orice vrf din cadrul reelei. Acest efect se aplic nu numai
informaiei, dar i reelelor Internet, n care sunt necesare maximum ase
calculatoare provider prin care un pachet de informaii trebuie s treac
pentru a ajunge la orice destinatar din reea, numrului de pai necesari
pentru a strbate lumea utiliznd reeaua de aeroporturi, de exemplu,
timpului necesar unei boli molipsitoare pentru a se rspndi n ntreaga
populaie a unei regiuni etc.
4.4.3 Modelul reelelor libere de scal
Am artat mai sus c n cazul reelelor reale de dimensiuni mari, distribuia
gradelor este de tip putere, , unde reprezint un coeficient
pozitiv adimensional.
Cel mai vechi exemplu de reea n care avem o astfel de distribuie este cea
construit de Price plecnd de la citrile ntre lucrrile tiinifice
menionate n revistele ISI. El a gsit o valoare a lui egal cu 2.5 pn la
3 i a reprezentat distribuia de tip putere a numrului de citri
bibliografice din fiecare lucrare aprut n reviste ISI ntr-un interval de
zece ani.
Mai recent, distribuia gradelor de tip lege a puterii a fost observat i n
alte reele, cum ar fi WWW, Internetul, reelele metabolice, reeaua
apelurilor telefonice etc.
O alt form funcional gsit pentru distribuia gradelor este cea
exponenial, , care a fost descoperit, de exemplu, n cazul
reelelor electrice, reelelor de ci ferate, reeaua actorilor, reele
colaborative .a.
o
= k p
k
o
= e p
k
Se poate observa c dac distribuia gradelor are o form particular, de tip putere sau
exponenial, pentru o reea n ansamblul ei, subreele specifice ale acesteia pot
avea alte forme funcionale. De exemplu, WWW are o distribuie a gradelor de tip
putere n general, dar o distribuie uniform n cazul subdomeniilor.
n figura de mai jos sunt reprezentate distribuii ale gradelor cumulative pentru ase
reele diferite. Pe axa orizontal a fiecrei figuri se reprezint gradul vrfului k, iar pe
axa vertical este reprezentat probabilitatea cumulativ a gradelor, deci acel
numr de vrfuri care au gradul mai mare sau egal cu k.
Cel mai cunoscut model al unei reele libere de scal este modelul Barabasi
Albert n care se introduc dou elemente dinamice eseniale:
creterea i conectarea preferenial. Pe de o parte, reteaua este supus
permanent unui proces de cretere, ncepnd cu un mic numr de
vrfuri complet conectate (C = 1). Pe de alt parte, creterea are loc n
aa fel nct vrfurile nou introduse n reea sunt legate preferenial de
acele rfuri care au cele mai multe conexiuni. n figura de mai jos se
reprezint acest proces de cretere prin conexiuni prefereniale.







O implicaie major a acestui fapt este c apare un numr mic de vrfuri
puternic conectate (hub-uri), n timp ce marea majoritate a vrfurilor
are o conectivitate foarte mic. Aceste huburi joac un rol crucial n
multe reele deoarece reeaua este foarte sensibil la atacuri
intenionate dac intele sunt aceste huburi, dar este foarte robust la
atacuri aleatoare, n care vrfurile int sunt alese aleatoriu.
Faptul c reelele sociale sunt libere de scal, ca i multe alte reele
informaionale, tehnologice sau biologice demonstreaz existena unei
similitudini uimitoare ntre sistemele adaptive complexe din natur,
tehnic sau societate.
TEME
DEMOGRAFIA retelelor sociale: http://www.manager.ro/articole/social-media/analiza:-tot-
ce-doreati-sa-stiti-despre-demografia-retelelor-sociale-23441.html
Aplicaii online ale analizei reelelor sociale:
www.asecib.ase.ro/mps/Analiza_retelelor_sociale.pdf
Aplicaii n business i organizaii ale analizei reelelor sociale:
www.asecib.ase.ro/mps/Analiza_retelelor_sociale.pdf
Softuri pentru analiza retelelor sociale:
http://en.wikipedia.org/wiki/Social_network_analysis_software