Documente Academic
Documente Profesional
Documente Cultură
Elemente de Statistica
Pe teritoriul tarii noastre lucrarea lui Dimitrie Cantemir Descriptio Moldaviae (1716),
poate fi considerata ca o prima lucrare de statistica. Ea a fost scrisa la cererea Academiei din
Berlin si continea toate cunostintele acumulate in domeniu la acea data.
Statistica este disciplina care se ocupa cu culegerea,inregistrarea,gruparea,analiza si interpretarea
datelor
referitoare la un anumit fenomen precum si cu formularea unor previziuni privind comportarea
viitoare a acestuia.
Activitatea de culegere si inregistrare a datelor referitoare la un fenomen face obiectul statisticii
descriptive sau statisticii formale.
Activitatea de grupare,de analiza si de interpretare a datelor precum si formularea unor previziuni
priviind comportarea viitoare a unui fenomen reprezinta obiectul statisticii matematice.
Definitii
- Multimea pe care se realizeaza un studiu statistic se numeste populatie statistica.
- Elementele componente ale unei poulatii statistice se numesc unitati statistice sau indivizi.
- Numarul total de unitati statistice se numeste efectivul total al populatiei statistice.
- O parte a populatiei statistice aleasa special pentru a fi studiata se numeste esantion.
- Proprietatea sau indicatorul in functie de care se cerceteaza o populatie statistica se numeste
caracteristica sau variabila statistica.
O caracteristica se numeste caracteristica calitativa daca nu poate fi masurata(valoarea ei nu se
exprima numeric).
Ex: starea civila,calificativul,profesia
O caracteristica se numeste cantitativa daca se poate exprima numeric.
Ex: media generala, salariul, inaltimea.
O caracteristica cantitativa se numeste discontinua sau discreta daca nu poate lua decat valori
numerice izolate.
O caracteristica cantitativa care poate lua orice valoare dintr-un interval de lungime finita sau
infinita se numeste caracteristica cantitativa continua.
Intervalele in care o caracteristica ia valori se numesc grupe sau clase de valori.
Ex:
a) Nota la teza,media generala sunt caracteristici cantitative discrete.
b) Inaltimea este o caracteristica in functie de care poate fi studiat un grup.
1.3 Culegerea,Inregistararea si Clasificarea Datelor Statistice
Sa consideram studiul efectuat asupra unui grup de sportivi dupa inaltime (exprimata in centimetri).
Rezultatele masuratorii sunt inregistrate in ordinea in care a decurs masuratoare si sunt asezate in
urmatorul tabel:
165 168 177 195 172 198 196 190 201 168
172 168 168 196 173 199 182 195 196 196
185 205 184 192 178 165 174 182 177 172
196 192 188 195 175 192 175 184 192 170
184 205 190 200 188 176 184 174 188 170
170 180 184 199 192 184 170 175 184 188
165 168 177 195 172 198 196 190 201 168
172 168 168 196 173 199 182 195 196 196
185 205 184 192 178 165 174 182 177 172
196 192 188 195 175 192 175 184 192 170
184 205 190 200 188 176 184 174 188 170
170 180 184 199 192 184 170 175 184 188
Sub aceasta forma datele inregistrate sunt greu de analizat.De aceea este necesara o alta grupare
sau clasificare a datelor.De exemplu,sa asezam aceaste date in ordinea crescatoare a inaltimi sportivilor
consemnand cati sportivi au o anumit inaltime.Se obtine urmatorul tabel:
Cu ajutorul acestei clasificari a datelor se pot obtine niste concluzii mai rapide privind
particularitatile acestui grup.
Rezultatele analizei statistice pot fi obtinute uneori mai usor daca se practica o alta grupare a
datelor statistice. De exemplu se poate face o grupare a valorilor caracteristicii studiate in clase de valori:
Clase de Nr.
valori Sportivi
[165,170) 6
[170,175) 6
[175,180) 8
[180,185) 10
[185,190) 5
[190,195) 7
[195,200) 11
[200,205) 4
Cu ajutorul acestui tabel de date se pot obtine cu usurinta diferite informatii despre grupul de
studiu,ca de exemplu:
- sunt 60 de sportivi
- cei mai multi sportivi au inaltimea in clasa de valori [195,200),urmand cei cu inaltimea in clasa de valori
[180,185) etc.
- 9 sportivi au inaltimea in clasa de valori [170,175)si reprezinta 15% din efectivul populatiei statistice;
- exista 45 de sportivi cu inaltimea sub 95 cm etc.
Valoarea absoluta a diferentei extremitatilor unei clase de valori se numeste amplitudinea clasei.
Amplitudinea se stabileste de cel care realizeaza studiul. O clasa de valori este in general un interval
semideschis [a,b], exceptie facand eventual ultima clasa care poate fi luata de forma [c,d].
Tabelele in care au fost clasificate datele studiului statistic privind inaltimea unui grup de 60 de
sportivi, arata o dispunere a datelor in perechi de tipul: valoarea carateristica , efectiv.
In general sa consideram o populatie statistica cu efectivul total N, X caracteristica sau variabila
statistica cu valorile x1, x2, ...,xp si ni numarul de unitati statistice corespunzatoare valorii xi a variabilei
statistice, 1 i p.
Multimea tututor perechilor (xi,ni), 1 i p formeaza o serie statistica cu o singura variabila.
Numarul ni de unitati statistice corespunzatoare valorii xi a caracteristicii sau a unei clase de valori se
numeste frecventa absoluta a valorii xi, respectiv frecventa absoluta a clasei de valori considerate.
Rezulta ca n1 + n2 + n3 + ... + np = N.
Modul de prezentare a unei serii statistice cu o variabila statistica este sub forma unui tabel
orizontal sau vertical care cuprinde valorile variabilei statistice sau clasele de valori si frecvntele absolute
corespunzatoare:
Valorile x1 x2.....xp
caracteristice
Frecventa absoluta n1 n2 ....np
[x1,x2)...[xp-1,xp)
Clase de valori
Frecventa absoluta n1.....................np
Se spune ca aceste tabele definesc distributia sau repartitia statistica a variabilei statistice.
Asadar, tabelele 2 si 3 reprezinta distributia statisticas a inatltimii unui grup de sportivi.
In studiul unei serii statistice sunt interesante concluziile obtinute prin cumularea frecventelor
absolute ale valorilor variabilei.
Astfel raportandu-ne la tabelul 3, se poate spune ca in grup sunt cel mult 23 de sportivi cu inaltime
mai mica decat 180 cm , sau exista 15 sportivi cu inaltimea mai mare sau egala cu 195 cm.
In general putem defini urmatoarele tipuri de frecvente absolute :
Frecventa absoluta cumulata crescatoare a valorii x a variabilei statistice este suma tutuoro
frecventelor absolute ale valorilor variabilei care apar pana la xi inclusiv.
Se noteaza
Frecventa absoluta cumulata descrescatoare a valorii xi a variabilei statisticei este suma tuturor
frecventelor absolute ale valorilor variabilei care apar la xi inclusiv.
Se noteaza
Raportul dintre frecventa absoluta a unei valori xi sau a unei clase de valori statistice si efectivul total al
populatiei se numeste frecventa relativa a clasei de valori.
Se noteaza
Se numeste frecventa relativa cumulata crescatoare a valorii xi a variabilei statistice , suma tuturor
frecventelor relative a valorilor care apar pana la xi inclusiv.
Se noteaza
Se numeste frecventa relativa cumulata descrescatoare a valorii xi a variabilei statistice , suma tuturor
frecventelor relative ale vlorilor care apar la xi inclusiv.
Se noteaza
Ex: Pentru seria statistica cu variabila calitativa din tabelul anterior se obtine dreptunghiul de structura din
figura urmatoare :
Acest tip de reprezentare grafica foloseste dreptunghiuri cu latimi egale si lungimile proportionale cu
frecventele absolute sau cu frecventele relative ale valorilor variabilei statisticei.
Daca dreptunghiurile sunt asezate vertical,reprezentarea grafica se numeste diagrama prin coloane, iar
daca sunt asezate orizontal reprezentarea grafica se numeste diagrama prin benzi.
Ex: Repartitia numarului de ore de emisie de radio (mii ore program) in perioada 1998-2003 este:
6.Histograma
Se considera o serie statistica cu variabila cantitativa continua si clasele de valori de amplitudini
egale:distributia unui grup de tineri dupa inaltimea exprimata in centimetri:
Se noteaza
Mediana unei serii statistice ordonate este valoarea Me care imparte sirul ordonat al valorilor variabile
in doua parti,fiecare parte continand acelasi numar de valori.
*Mediana unei serii statistice cu variabila cantitativa discreta se obtine astfel:
-se aseaza cele N valori ale variabilei in ordine crescatoare sau descrescatoare
-daca N este numar impar, atunci
Clasa de valori in seria frecventelor absloute cumulate careia ii corespunde cel putin jumateate din
efectivul total al populatiei se numeste clasa mediana.
Mediana unei serii statistice cu variabila cantitativa de tip continuu se calculaeaza cu formula
In multe activitati economico-sociale prezinta interes acele aspecte care survin cel mai frecvent in
derularea lor.
De exemplu compararea numarului de apeluri telefonice pe intervale mici de timp da posibilitatea
determinarii perioadei din zi cand o centrala telefonica este cel mai mult solicitata si, in conseciinta , da
posibilitatea determinarii capacitatii optime a centralei.
Astfel de probleme se rezolva folosind parametru statistic de pozitie numit modul sau dominanta.
Definitie!
Modulul sau dominanta unei serii reprezinta valoarea unei clase de valori a
variabilei care corespunde celui mai mare efectiv si se noteaza Mo.
*Pentru determinarea unei valori mai exacte a modulului unei serii statistice cu date grupate in clase de
valori , vom face o analiza pe o secventa a diagramei structurale a acesteia care sa contina si valorile din
clasa modala [1, L).
Fie cazul seriei statistice in care clasa de valori anterioare clasei modale are frecventa mai mica decat
frecventa clasei de valori care urmeaza clasei modale.
Notam: 1=diferenta dintre frecventa clasei modale si cea a clasei anterioare ei.
2=diferenta dintre frecventa clasei modale si cea a clasei urmatoare.
K=amplitudinea clasei modale k=L-1
Se obtine :
Se noteaza
In cazul datelor grupate in clase de valori , se considera abaterile centrelor claselor de valori de la medie.
Definitie!
*Fiind data seria statistica se numeste abatere medie patratica a valorilor
variabilei numarul unde este dispersia serie.
Se noteaza
Abaterea medie patratica da posibilitatea caracterizarii dispersiei valorilor variabilei
statistice.Astfel, o serie care este putin dispersata , adica prezinta valori ce sunt strans grupate in jurul
valorii medii, conduce la o medie patratica mica
Definitie!
Raportul dintre abaterea medie patratica si valoarea medie a unei serii statistice se numeste
coeficient de variatie