Sunteți pe pagina 1din 18

PROF.

CATANA MONICA

COLEGIUL EMIL NEGRUTIU TYRDA


STATISTICA MATEMATICA
Statistica matematica se ocupa de gruparea, analiza si interpretarea
datelor referitoare la un anumit fenomen precum si cu unele previziuni
privind producerea lui viitoare.
DEFINITIE. Prin populatia statistica se intelege orice multime definita
de obiecte de aceeasi natura. Elementele unei populatii se numesc
unitati statistice sau indivizi. Numarul de elemente care constituie
populatia se numeste volumul populatiei.
--------------------------------------------------------------------------------------
----
Se numeste caracteristica ( sau variabila statistica) a populatiei
trasatura comuna tuturor unitatilor ( indivizilor) populatiei.

Caracteristica poate fi cantitativa ( daca se poate masura ) sau


calitativa ( in caz contrar ). In general o populatie se studiaza dupa una
sau mai multe caracteristici.
Caracteristica poate fi cantitativa ( daca se poate masura ) sau calitativa
( in caz contrar ). In general o populatie se studiaza dupa una sau mai
multe caracteristici. In cazul populatiilor cu un numar mare de indivizi se
a

efectueaza o statistica numai pentru o fractiune din populatia totala, iar


rezultatul obtinut se extinde pentru toata populatia. Fractiunea din
populatia totala pentru care se face statistica se numeste esantion. Este clar
ca aceste concluzii au sansa de a fi valabile cu cat esantionul este mai
mare. Gratie calculului posibilitatilor va fi posibil, in general, de a indica
gradul de incredere care se poate acorda concluziilor obtinute.
EXEMPLE
Populatia Elevii unei Elevii unei Becurile dintr- Locuitorii Locuitorii
o intreprindere
clase clase unui oras unui oras

Caracteristica Nota la teza de Culoarea Durata de Varsta Greutate


matematica ochilor functionare

Caracteristicile : Nota la teza de matematica, Durata de viata, varsta.


Greutatea este de natura cantitativa, iar caracteristica Culoarea ochilor este
de natura calitativa.
Caracteristicile cantitative pot fi discrete ( sau discontinue) daca variabila
statistica ia valori finite ( sau numarabile) sau continue daca variabila poate
lua orice valoare dintr-un interval finit sau infinit (greutatea, talia, etc.).
a
Gruparea datelor se realizeaza cu scopul de a trage concluzii cu caracter
general.
Tabelul 1 de mai jos prezinta situatia notelor la teza de matematica intr-o
clasa de 25 de elevi.
Nota (caracteristica) Numar de elevi Nota ( caracteristica) Numar de elevi
2 1 7 5
3 2 8 3
4 1 9 3
5 3 10 3
6 4
Plecand de aici se poate realiza tabelul 2 care prezinta o situatie mai sintetica
fata de cel precedent.

Clase de valori Numar de elevi


<5 4
5-7 7
7 – 10 14
In acest tabel am inmultit multimea valorilor
caracteristicii in trei clase. Se face conventia ca extremitatea
dreapta ( cu exceptia, eventual, a ultimei clase) pentru fiecare
q
clasa sa nu apartina clasei. De exemplu clasa 5-7 cuprinde
valorile caracteristicii x, 5 ≤ x < 7 ( adica notele de 5 si 6).
Lungimile claselor de valori sunt la latitudinea celui care face
investigatia si sunt stabilite in functie de scopul urmarit. In
cazul prezentat mai sus numarul elevilor care au liat nota sub
cea de „trecere” ( elevi foarte slabi pregatiti ) este egal cu 4 si
reprezinta 16% din totalul elevilor. Numarul celor cu o slaba
pregatire este reprezentat de cei care au luat note de 5 si de 6 (
deci cei situati in a 2-a clasa ). Acesta este egal cu 7 si
reprezinta 28% din intregul elevilor. In fine in ultima clasa de
valori , cei cu notele 7,8,9,10 sunt inclusi elevii buni si foarte
buni. Acestia sunt in numar de 14 si reprezinta 56 % din
totalul elevilor. Numarul elevilor care au obtinut o nota mai
mare de 5 la teza este egal cu 21 si reprezinta 84% din totalul
lor. In functie de aceste rezultate profesorul isi poate formula
o strategie pentru viitor in vederea imbunatatirii
performantelor elevilor acestei clase etc.
relativa.
Frecvente cumulate.
Numarul tuturor indivizilor ( sau unitatilor) unei populatii se numeste
efectivul total al acelei populatii. In cazul discret, tabelul 3, valorile
caracteristicii (nota –xi ) sunt date in prima coloana, iar in coloana a doua
figureaza numarul de indivizi ( ni ) corespunzator fiecarei valori a
caracteristicii.
Tabelul 3 Nota Efectiv Nota Efectiv
xi ni xi ni
2 1 6 4
3 2 7 5
4 1 8 3
5 3 9 3
10 3

Efectiv total : 1 + 2 + 1 + 3 + 4 + 5 + 3 + 3 + 3 = 25
( Σni )
Definitie. Se numeste frecventa absoluta ( sau efectiv ) a unei valori x a
caracteristicii, numarul de unitati ale populatiei corespunzatoare acestei
valori.
q

In tabelul 3 valoarea 5 a caracteristicii are frecventa absoluta 3 ( in limbaj


uzual insemnand ca nota 5 a fost luata la teza de matematica de doar 3 elevi ).
Aceste date ( caracteristica, efectiv ) se reprezinta grafic, in raport de un
sistem de axe rectangulare, prin desene , care pun in evidenta anumite
rapoarte numerice. Graficul corespunzator se numeste diagrama. Alegerea
unitatii pe fiecare dintre axe ramane la latitudinea celui care prelucreaza
datele.
O prima reprezentare o constituie reprezentarea in batoane aplicata
caracteristicii discrete cu un numar mic de valori. Pe axa orizontala sunt
trecute punctele reprezentand valorile variabilei si din aceste puncte se ridica
segmente verticale de lungime egala cu frecventa absoluta a valorii
respective. Segmentele ridicate sunt masurate cu unitatea de pe axa
verticala.
In cazul tabelului 3 se obtine diafragma din figura 1.

Unind printr-o linie poligonala extremitatile superioare ale acestor segmente se


obtine ceea ce se cheama poligonul frecventelor ( marcat prin linii discontinue in
figura 1 ).
Realizam un alt tabel cu aceleasi note la teza de matematica in care lungimile
claselor sa fie aceleasi. Avem tabelul 4.

Clase de valori Efectiv Procent


2–4 3 12%
4-6 4 16%
6-8 9 36%
8 - 10 9 36%
Vom reprezenta aceste date printr-un grafic numit histograma, unde
pe axa orizontala se iau o succesiune de segmente egale ( reprezinta
lungimea claselor) si se ridica pe fiecare din aceste segmente considerate
ca baze , dreptunghiuri de inaltimi proportionale cu frecventele absolute
a

ale claselor respective( fig 2).

Daca in mijlocul fiecarui segment de pe axa orizontala ( aceste


mijloace de intervale le numim valori centrale ) se ridica segmente
proportionale cu frecventele claselor corespunzatoare fiecarui segment si
unim printr-o linie poligonala extremitatile ale acestor segmente se
obtine poligonul frecventelor.
Uneori datele ( din tabelul 4 ) se reprezinta prin dreptunghiuri de
baze egale si cu inaltimi proportionale cu procentele ( fig 3) sau prin
sectoare de cerc, cu unghiuri proportionale cu aceleasi numere ( fig 4).
d

Este adesea interesant de a prezenta intr-un tabel statistic pentru


fiecare valoare xi a caracteristicii raportul fi dintre numarul de indivizi
care au aceasta valoare si efectivul total al populatiei.
Definitie. Se numeste frecventa relativa ( sau simplu
frecventa ) a unei valori xi a caracteristicii raportul
a
dintre frecventa absoluta ni a valorii xi si efectivul total
al populatiei.

Se numeste frecventa cumulata crescatoare a unei


valori x a variabilei, suma tuturor frecventelor valorilor
care apar pana la x inclusiv.
Se numeste frecventa cumulata descrescatoare a unei
valori x a variabilei suma tuturor frecventelor valorilor
care apar de la x inclusiv.
Vom lucra cu frecventa cumulata crescatoare.
Prelucram datele oferite de tabelul 1 sub forma tabelului 5.
Nota Efectiv Frecventa Frecventa cumulata
a
3 1 0,040 0,040
3 2 0,080 0,120
4 1 0.040 0,160
5 3 0,120 0,280
6 4 0,160 0,440
7 5 0,200 0,640
8 3 0,120 0,760
9 3 0,120 0,880
10 3 0,120 1
Daca din tabelul 5 se retin coloanele unu ( cu valorile caracteristicii ) si
trei ( cu valorile frecventelor ) atunci aceste informatii definesc distributia
sau repartitia statistica a variabilei respective.
Analiza statistica a unui fenomen , in raport cu o singura caracteristica ,
conduce la o serie de perechi de valori (caracteristica, efectiv).
Elemente caracteristice unei
serii statistice.
Tabelele si graficele de mai sus ofera o buna idee a modului in care o
caracteristica este distribuita. Dar se cauta, adesea, de a ilustra aceasta distribuire
intr-o maniera mai cuprinzatoare prin cateva numere caracteristice.
1.Media .
Fie x variabila statistica ( caracteristica ) care ia valorile x1,x2,....,xk cu efectivele
corespunzatoare n1,n2,....,nk.

Acest numar se mai numeste si media ponderata a numerelor x1, x2 ,.....,xk ;


numerele n1, n2, ...,nk se numesc ponderile respective ale numerelor x1, x2 ,....., si
respectiv xk .
Media se mai poate scrie cu ajutorul frecventelor astfel
Luand datele din tabelul 1 gasim ca media notelor la
teza de matematica este
a

Daca pentru o caracteristica informatiile sunt


impartite pe clase, atunci xi este valoarea centrala a
clasei respective , adica este mijlocul intervalului.
In cazul tabelului 4 gasim ca
MEDIANA

Observatie. Mediana nu este afectata de valorile extreme ale caracteristicii.

Modulul
Definitie. Prin modul (sau dominanta) unei serii statistice se intelege
valoarea caracteristicii corespunzatoare celei mai mari frecvente daca valorile
caracteristicii sunt discrete si valoarea centrala a clasei corespunzatoare celei
mai mari frecvente daca variabila este continua.
In cazul exemplului pe care-l analizam si corespunde variabilei discrete
(vezi tabelul 5) dominanta este 7.
Observatie. Modulul este insensibil la valorile extreme.Ca element
numeric modulul este mai putin utilizat decat media sau mediana.
a

Dispersia
Daca se doreste sa se vada cat se departeaza valorile de mediana
se poate calcula media diferentelor absolute | xi - |.Din ratiuni
esential teoretice se prefera sa se calculeze media patratelor diferentelor
,adica daaca variabila ia valorile x1, x2 ,.....,xk cu efectivele corespunzatoare
n1, n2, ...,nk atunci

Numarul v se numeste dispersia valorilor (sau variatia) esantionului.


a

Acest numar se exprima in aceleasi unitati ca si caracteristica seriei.


Utilizand acest indicator putem compara doua clase de elevi din punct de
vedere al omogenitatii lor prin prisma mediilor finale. Cea care are
dispersia mai mica este mai omogena.
La fel un antrenor are posibilitatea de a forma doua echipe de footbal ,
cunoscand golurile marcate de fiecare echipa. Se va opri la acea formula de
echipa care este mai omogena, adica aceea care are dispersia mai mica.
PROPRIETATI ALE VARIATIEI
Prin calcul direct se arata usor ca variatia are exprimarile

S-ar putea să vă placă și