Sunteți pe pagina 1din 5

DISCIPLINA: INFORMATICĂ MEDICALĂ ȘI BIOSTATISTICĂ

FACULTATEA DE MEDICINĂ

LUCRAREA PRACTICĂ 4
BIOSTATISTICĂ: DISTRIBUȚII

TEME:
• Tipuri de variabile
• Curba densității de probabilitate
• Tipuri de distribuții

Datele culese experimental urmează a fi analizate conform metodelor statistice. Datele se culeg în general
dintr-o populație statistică sau colectivitate statistică. Elementele populației sunt unități statistice sau
indivizi.
La un anumit moment ne interesează o trăsătură comună a indivizilor, numită variabilă sau caracteristică.
Variabilele pot fi:
→ cantitative - se exprimă numeric prin valoarea numerică măsurată sau dedusă experimental sau
→ calitative (categoriale, atributive) - se pot exprima prin atribute - exemplu: grupa de sânge, genul,
apartenența politică, culorile.
Variabilele cantitative pot fi împărțite în continuare în:
→ discrete - exemplu: numărul de nou născuți pe zi la o anumită maternitate);
→ continue - exemplu: înălțimea persoanelor.
Pentru a măsura o variabilă de tip categorial se folosesc scale nominale. Acestea vor defini grupurile sau
categoriile existente prin asignarea unor nume.
Variabilele cantitative se pot măsura pe scale interval sau raport.

Curba densității de probabilitate


Pe măsură ce mărim numărul de clase dintr-o histogramă, lungimea claselor scade foarte mult, astfel încât
obținem histograme cu coloane din ce în ce mai fine. Dacă reprezentăm un număr mare de date, pe măsură
ce coloanele devin din ce în ce mai fine, ele tind să genereze forma unei curbe.
O curbă a densității de repartiție este curba care are același aspect cu curba către care tinde poligonul
frecvențelor relative, atunci când numărul de valori dintr-o serie tinde la infinit, iar lungimea fiecărei clase
tinde la 0.
Noțiunea de probabilitate este strâns legată de noțiunea de frecvență relativă. Frecvențele relative reprezintă
valori experimentale, statistice sau estimații ale probabilității.

În teoria probabilităților, funcția densității de probabilitate sau densitatea unei variabile aleatorii continue
este cea mai bună formă de a exprima relația dintre probabilitate și domeniul de variație a variabilei,
deoarece într-un punct probabilitatea este 0.

Page 1 of 5
DISCIPLINA: INFORMATICĂ MEDICALĂ ȘI BIOSTATISTICĂ
FACULTATEA DE MEDICINĂ

În medicină și biologie, ca și în celelalte domenii de activitate, există o varietate largă de curbe ale densității
de probabilitate.

Probabilitatea de producere a unui eveniment poate să varieze între 0% și 100%, sau, altfel spus, între 0 și
1. Dacă se consideră că aria cuprinsă între curba de repartiție și axa orizontală este 1 sau 100%, atunci ea
poate fi considerată ca fiind o curbă de distribuție a probabilității .
Pentru o exprimare mai clară, în locul termenului de curbă a densității de probabilitate, se utilizează și
termenul de curbă de repartiție, sau mai simplu, repartiție (aceasta reprezintă probabilitatea cumulată
P(x<a).
Prin urmare, probabilitatea ca, extrăgând aleator un individ dintr-o populație a cărei repartiție are o curbă
cunoscută și făcând măsurarea pe acel individ, valoarea obținută x, să fie situată între două numere a și b
fixate (x≥a și x≤b), este exact aria cuprinsă între curbă, axa orizontală și cele două verticale în a și b.

Repartiția normală (Gauss-Laplace)


Distribuția normală constituie una din cele mai importante legi de repartiție, ocupând un loc central în
cadrul teoriei și practicii statistice.
Funcția Gauss-Laplace este caracterizată de următorii parametri: media (notată μ), și dispersia (notată σ2).
Expresia densității de probabilitate este dată de formula:
−(𝑥−𝜇)2
1
𝑓(𝑥 ) =  𝑒 2 ∙ 𝜎2
𝜎  √2 𝜋

Se notează simbolic N(μ, σ2) sau N(x, μ, σ2).


Proprietățile repartiției normale
1. Distribuția admite un singur maxim, fiind astfel unimodală. Maximul se atinge în punctul x=μ și are
1
valoarea 𝑓 (𝜇 ) = 𝜎  √2 𝜋

2. Distribuția este simetrică în raport cu dreapta x=μ. În orice repartiție normală media, mediana și modul
coincid.
3. Punctele de pe abscisă de valoare μ+σ, respectiv de valoare μ-σ, sunt puncte de inflexiune. În aceste
puncte, curba densității de probabilitate își modifică convexitatea.
4. Densitatea de probabilitate are formă de clopot, de unde și denumirea sa de „clopotul lui Gauss”.
5. Coeficienții de asimetrie și aplatizare pentru o repartiție normală au valoarea 0.
6. Curba densității de probabilitate este cu atât mai ascuțită cu cât valoarea dispersiei este mai mică.
Modificarea parametrului dispersie duce la variații invers proporționale ale valorii punctului de maxim
al funcției densitate de probabilitate.

Page 2 of 5
DISCIPLINA: INFORMATICĂ MEDICALĂ ȘI BIOSTATISTICĂ
FACULTATEA DE MEDICINĂ

Nr. FUNCȚIE DEFINIȚIE SINTAXA


1. =NORM.DIST Această funcție calculează =NORM.DIST(x, mean, standard_dev, cumulative)
distribuția normală pentru
x (obligatoriu): Valoarea pentru care se calculează distribuția
o deviație standard () și mean (obligatoriu): Media aritmetică a distribuției
medie specificată (µ). standard_dev (obligatoriu): Abaterea standard a distribuției
cumulative (obligatoriu): O valoare logică care specifică tipul
de distribuție care trebuie utilizat:
TRUE: calculează funcția de distribuție cumulativă
FALSE: calculează funcția de densitate a probabilității

2. =NORM.S.DIST Calculează funcția =NORM.S.DIST(z, cumulative)


standard normală de
z (obligatoriu): Valoarea pentru care se calculează distribuția
distribuție cumulativă sau
cumulative (obligatoriu): O valoare logică care specifică
funcția de densitate de
tipul de distribuție care trebuie utilizat:
probabilitate a unei valori
TRUE: calculează funcția de distribuție cumulativă
(µ=0 și =1). FALSE: calculează funcția de densitate a probabilității

3. =NORM.INV Calculează inversul =NORM.INV(probability, mean, standard_dev)


distribuției normale
probability (obligatoriu): Probabilitatea corespunzătoare
cumulative pentru media
distribuției normale. Este valoarea la care doriți să evaluați
aritmetică și abaterea
funcția inversă
standard date.
mean (obligatoriu): Media aritmetică a distribuției.
standard_dev (obligatoriu): Abaterea standard a distribuției
4. =NORM.S.INV Calculează inversul =NORM.S.INV(probability)
distribuției cumulative
Probability (obligatoriu): Probabilitatea corespunzătoare
normale standard
distribuției normale. Este valoarea la care doriți să evaluați
(µ=0 și =1). funcția inversă.

Exemplu: Un set de date (X) urmează o distribuție normală de medie μ=90 și deviație standard σ=12.
Să se calculeze probabilitatea obținerii unei valori mai mici de 80.

Page 3 of 5
DISCIPLINA: INFORMATICĂ MEDICALĂ ȘI BIOSTATISTICĂ
FACULTATEA DE MEDICINĂ

PROBLEME – APLICAȚII PRACTICE:

• Pentru rezolvarea aplicațiilor practice se va folosi fișierul LP 4 - Baza_de_Date.xlsx.

1. Care este probabilitatea de a avea o persoană cu IMC-ul peste 30 Kg/m2 ?


• veți calcula mai întâi media și deviația standard, apoi veți aproxima distribuția cu forma
normală, Gauss-Laplace.

2. Care este probabilitatea, în ideea aproximării cu o distribuție normală, de a obține conform datelor
din tabelul Excel, persoane cu TALIA mai mică de 170 cm. Comparați frecvența relativă cumulată
din eșantion cu probabilitatea obținută prin aproximarea Gauss-Laplace. Dezbateți rezultatele
obținute.

3. Reprezentați pe un grafic (de tip Scatter with markers) o distribuție normală;


• într-o nouă foaie de calcul veți genera o coloană x de la 0 la 12 cu pasul 0.1;
• în următoarea coloană veți calcula ecuația curbei:
−(𝑥−𝜇)2
1
𝑓(𝑥 ) =  𝑒 2 ∙ 𝜎2
𝜎  √2 𝜋
• veți reprezenta grafic conform cerinței.

4. Într-o nouă foaie de calcul reprezentați distribuția normală pentru o plajă de variație între -2 și 2 cu
pasul 0.1 și parametrii:
a) μ=0, σ= 0,25
b) μ=0, σ= 0,75
c) μ=0, σ= 1
d) μ=0, σ= 2,5
e) μ=0, σ= 5

Indicații: Folosiți funcția NORM.DIST() și un grafic de tip Line.


5. Într-o nouă foaie de calcul reprezentați distribuția normală pentru o plajă de variație între -10 și 30 cu
pasul 1 și parametrii:
a) μ=2, σ= 4
b) μ=6, σ= 4
c) μ=10, σ= 4
d) μ=14, σ= 4
e) μ=18, σ= 4

Indicații: Folosiți funcția NORM.DIST() și un grafic de tip Line.

Page 4 of 5
DISCIPLINA: INFORMATICĂ MEDICALĂ ȘI BIOSTATISTICĂ
FACULTATEA DE MEDICINĂ

6. Doi studenți (denumiți generic A respectiv B) obțin după un test IQ scorurile IQA=96 respectiv
IQB=745. Cei doi au folosit scale diferite de măsură. Acceptând că cele două variabile care definesc
scorul IQ respectă distribuții de tip normal definite de μA=72, σA =15 respectiv μB=680, σB =120 să
se decidă care dintre studenți a obținut un scor mai bun.
Dar dacă repartițiile nu ar fi fost de tip normal ci de alt tip, cum ați rezolva problema ?

Observație: deoarece se folosesc distribuții de tip diferit nu putem compara direct valorile IQ
obținute. Aveți varianta 1 – normalizați valorile obținute sau varianta 2 – folosiți noțiunea de
percentilă (frecvent utilizată în medicină).

Page 5 of 5

S-ar putea să vă placă și