Sunteți pe pagina 1din 5

Universitatea ”Petre Andrei” din Iași

Facultatea de PSIHOLOGIE, ŞTIINŢELE EDUCAŢIEI ȘI


ASISTENȚĂ SOCIALĂ
Specializarea Asistență Socială

REFERAT
la disciplina
STATISTICĂ ÎN ŞTIINŢELE SOCIALE
Titlul referatului: Tema C

Autor: NUME ȘI PRENUME STUDENT


LENESU GEORGIANA MIRUNA
Anul de studiu : 1
Semestrul II
e-mail: mirunalenesu@yahoo.com
Tema C:
• Calitatea modelului statistic
• Model liniar
• Populaţia
• Eşantionul
• Indicatorii dispersiei (Abaterea, Abaterea medie pătratică, Gradele de libertate, Varianţa,
Abaterea standard)
• Distorsiunea
• Distribuţia de eşantionare a mediilor aritmetice
• Eroarea standard a mediei
• Teorema limitei centrale
• Intervalul de confidenţă (sau de încredere).
Statistica este ştiința care se ocupă cu descrierea şi analiza numerică a fenomenelor de
masă,dezvăluind particularitățile lor de volum, structură, dinamică, conexiune, precum şi
regularitățile sau legile ce le guvernează [Trebici, V., 1985].
Regresia sau modelul liniar este o metodă de modelare a legăturilor dintre
variabile.Este cel mai important instrument de lucru al econometriei. Analiza de regresiese
ocupă cu descriere şi evaluarea legăturii dintre o variabilă dată(numită variabilă dependentă
sau explicată) şi una sau mai multe alte variabile(cunoscute ca variabile independente sau
explicative) cu scopul de a estima şi a previziona valoarea medie a variabilei dependente,
cunoscându-se valorile fixate alevariabilelor independente (valori fixate în urma unor
eşantionări repetate).
Populația statistică reprezintă mulțimea elementelor simple sau complexe, de aceeaşi
natură,care au una sau mai multe însuşiri esențiale comune, proprii elementelor cât şi
populației privită ca un tot unitar. [Florea I.,1998]. O populație este finită dacă include un
număr determinat de elemente, dar ea poate fi considerată drept reprezentativă a unei
populații teoretice infinite. Ca urmare apare necesitatea de a delimita o populație în:
conținut, spațiu şi timp. Se mai denumeşte şi populația univers.
Eşantion reprezintă o submulțime a unei populații statistice, constituită după criterii
bine stabilite. În raport cu procedeul de formare a eşantionului avem eşantioane aleatoare şi
eşantioane dirijate. Eşantionul aleator este format din unităŃile statistice care rezultă printr-
un procedeu aleator: procedeul tragerii la sorți, tabelul cu numere întâmplătoare, procedeul
extragerilor sistematice. Eşantionul dirijat este constituit pe baza unor informații auxiliare
existente la nivelul populației studiate sau lăsând liber pe anchetator să aleagă unitățile
respectând doar realizarea structurii eşantionului în funcție de criteriile stabilite. Se notează
cu n. Majoritatea studiilor au ca suport datele provenite de la nivel de eşantion, de aici
importanța constituirii acestuia şi implicit, apelarea la inferența statistică, pentru a estima
parametrii la nivelul populației univers.
Abaterea standard reflectă abaterea in mărime absolută a valorilor inregistrate fată de
media aritmetică. Se calculeaza ca radical din varianță. Alături de medie, este cea mai
frecvent folosit indicator pentru caracterizarea unui set de date.
Dispersia sau varianta unei variabile aleatoare X care are valoarea medie m, este dată
de numărul: D2(X) = p (x1-m)2 p (x2-m) 2 p (x3-m) 2 pn(xn-m) 2, iar numărul (X) = D2(X) se
numește abatere medie patratică. Se mai poate folosi și relația D2(X) = M(X2) – M(X)2
Abaterea medie patratică caracterizează numeric cel mai bine gradul de imprăștiere a
valorilor variabilei aleatoare X în jurul valorii sale medii. Cunoașterea valorii medii și a
dispersiei unei variabile aleatoare ne permite să tragem unele concluzii importante asupra
acesteia.
În statistică gradul de libertate reprezintă numărul comparațiilor independente între
elementele unei mărimi de observație sau numărul valorilor care pot fi alese arbitrar în
cadrul unei specificări. De exemplu, numărul gradelor de libertate într-un tabel de
contingență cu p rânduri și q coloane într-o distribuție arbitrară este egal cu (p-1)*(q-1).
Coeficientul de variaţie. Este raportul dintre deviaţia standard şi medie, atunci când
σ
media este diferită de 0 şi se exprimă în procente: c . v .= .
X
Distorsiunea măsoară, volumul de valori din distribuția concentrată de o parte și de
alta a mediei. Dacă acest volum de valori este mai mic decât media, spunem că distribuția
este pozitiv distorsionată. Dacă există mai multe valori mai mari decât media, spunem că
distribuția este negativ distorsionată. O distribuție perfect simetrică nu are distorsiune.
Există mai multe metode de măsurare a distorsiunii. Cea mai folosită este formula:

S=
∑ ( x−x)3
nσ 3
unde la numărător avem deviația cubică a valorilor față de medie, iar s este abaterea medie
patratică. În rezumat, avem următoarele situații:
-dacă S <0 avem distorsiune negativă;
-dacă S >0 avem distorsiune pozitivă.
Noţiunea de distribuţie de eşantionare (distribuţia de sondaj) este una teoretică
care permite trecerea de la distribuţia unui eşantion la distribuţia unei populaţii. Unei
caracteristici, prin inferenţă statistică, i se pot asocia trei distribuţii:
1. Distribuţia populaţiei.
2. Distribuţia eşantionului.
3. Distribuţia de sondaj.
Distribuţia mediei de eşantionare se supune legilor curbei normale, aproape indiferent
de forma distribuţiei valorilor populaţiei, dacă:
a) volumul eşantionului este „suficient de mare” (N≥30).
b) distribuţia populaţiei nu se abate grav de la normalitate
c) se respectă condiţiile eşantionării:
– eşantioane aleatoare
– volum egal
Eroare standard de estimare măsoară abaterea într-un eșantion de valoare a
populației. Cu alte cuvinte, eroarea standard de estimare măsoară posibilele variații ale
eșantionului mediu în raport cu valoarea reală a mediei populației.
Eroarea standard de estimare poate fi calculată pentru toate măsurătorile obținute în
eșantioane (de exemplu, eroarea standard de estimare a mediei sau eroarea standard de
estimare a deviației standard) și măsoară eroarea care se face la estimarea adevăratului
populația măsoară din valoarea sa de eșantion. Intervalul de încredere pentru măsura
corespunzătoare este construit din eroarea standard de estimare. Structura generală a unei
formule pentru eroarea standard de estimare este următoarea:
Eroare standard de estimare = ± Coeficient de încredere * Eroare standard
Coeficient de încredere = valoarea limită a unei statistici a eșantionului sau a unei
distribuții de eșantionare (clopot normal sau gaussian, t Student, printre altele) pentru un
interval de probabilitate dat.
Eroare standard = deviația standard a populației împărțită la rădăcina pătrată a mărimii
eșantionului.
Coeficientul de încredere indică numărul de erori standard pe care sunteți dispus să le
adăugați și să scădeți măsurii pentru a avea un anumit nivel de încredere în rezultate.
Teorema limitei centrale (TCL) este o teorie statistică care afirmă că, având în vedere
un eșantion aleatoriu suficient de mare din populație, distribuția mijloacelor eșantionului va
urma o distribuție normală. Mai mult, aceasta afirmă că pe măsură ce mărimea eșantionului
crește, media eșantionului se va apropia de media populației. Prin urmare, prin intermediul
teoremei limitei centrale putem defini distribuția eșantionului mediu al unei anumite
populații cu o varianță cunoscută. Deci distribuția va urma o distribuție normală dacă
dimensiunea eșantionului este suficient de mare.
Teorema limitei centrale se referă la distribuția prin eșantionare a mediilor. Conectează
distribuția eșantionării x-urilor cu distribuția originală a x-urilor. Ne spune că:
- Media mediilor eșantionului este egală cu media populației inițiale, μx = μ. Aceasta este
ceea ce face din x un estimator imparțial al lui μ.
- Distribuția x-urilor va avea formă de clopot, indiferent de forma distribuției originale a x-
urilor.
Un interval de încredere este o tehnică de estimare utilizată în inferența statistică care
permite limitarea unei perechi sau a mai multor perechi de valori, în cadrul cărora se va găsi
estimarea punctului dorit (cu o anumită probabilitate).Un interval de încredere ne va
permite să calculăm două valori în jurul unei probe medii (una superioară și una inferioară).
Aceste valori vor limita un interval în care, cu o anumită probabilitate, va fi localizat
parametrul populației.
Interval de încredere = medie + - marjă de eroare

S-ar putea să vă placă și