Sunteți pe pagina 1din 14

Statistică şi Prelucrarea Datelor

An univ. 2018-2019, DAIA

Curs 7 – Elemente de statistică descriptivă


Obiective
• Notiuni introductive
• Caracteristici statistice ale datelor experimentale
• Parametri si caracteristici statistice ale pozitiei
• Prezentarea datelor
Introducere
Statistica utilizează măsurători brute si caută să identifice modelul
probabilistic teoretic exact care poate să estimeze aceste măsuratori.

Partea empirică a statisticii care se ocupă de prelucrarea datelor obținute


prin măsuratori sau observații se numește statistică descriptivă.

Aparatul matematic al teoriei probabilităților, utilizatpentru a studia si


interpreta aceste date, pentru a recupera modelul probabilistic real care
descrie fenomenul măsurat sau observat, formează inferența
statistică.
Introducere
Multimea de obiecte studiata se numeste populatie. Un obiect
separat dintr-o populatie data se numeste individ sau membru al
populatiei.

Trasatura comuna a tuturor membrilor populatiei care ne intereseaza


în studiul nostru se numeste caracteristica. Caracteristicile pot fi
cantitative (înaltime, greutate, nota la examen, abscisa unui punct în
plan, etc...) sau calitative (culoarea ochilor, loc de nastere, etc...).

Orice analiza statistica utilizeaza numere, astfel caracteristicilor


calitative li se ataseaza valori numerice.
Caracteristici statistice ale datelor experimentale

O multime de n observatii independente asupra unei caracteristici


numerice X a unei populatii P, care ngenereaza valorile x1; x2;.... xn , se
numeste selectie de volum n.

Fie X={x1; x2;.... xn } o selecție de volum n, numerele m = min


k
xk si M = max xk se
k
numesc valorile extreme ale selectiei , iar diferenta M-m se numeste
amplitudinea selectiei

Valoarea datei care apare cu cea mai mare frecventa intr-o serie de
distributie de date statistice se numeste mod sau modul.

Clasa cu cea mai mare frecventa intr-o serie de distributie de date grupate
se numeste clasa modala
Caracteristici statistice ale datelor experimentale

x1 + x2 + ... + xn
X= Media empirica
n

(x − X ) +(x ) ( )
2 2 2
x + x + ... + x
2 2
2
2 −X + ... + xn − X Dispersia empirica
σ
1 2
2 1 2
= −X n

n n

σ = σ2 Abaterea medie patratica empirica

( x − X ) +(x ) ( )
2 2 2
1 2 −X + ... + xn − X Dispersia modificata sau esantionata
s 2
=
n −1

s = s2 Abaterea medie patratica esantionata


Caracteristici statistice ale datelor experimentale

Fie X={x1; x2;.... xn } o selecție de volum n

{
X − X = x1 − X ,..., xn − X } Centrata selectiei

X −X  x1 − X xn − X  Normata selectiei
= ,..., 
σ  σ σ 

σ
ω=
X Coeficientul de omogenitate
Parametri si caracteristici statistice ale pozitiei
Parametrii si caracteristicile statistice ale pozitiei se folosesc pentru a descrie
locatia unei date in raport cu celelalte date.

Cuantilele sunt valori numerice care impart setul de date in q grupe egale.
Constanta q se numeste ordinul Cuantilei.
Mediana este cuantila de ordinul doi.

Cuantilele de ordinul patru impart setul de date in patru grupe egale si se


numesc cuartile. Quartilele sunt in numar de trei, notate de obicei cu Q1;Q2;Q3.

Cuartila Q1 este un numar cu proprietatea ca o patrime din date au valori mai mici
decat Q1 si trei patrimi din date au valori mai mari decat Q1.
Cuartila Q2 este un numar cu proprietatea ca jumatate din date au valori mai mici
decat Q2 si jumatate din date au valori mai mari decat Q2. Cuartila Q2 este chiar
mediana.
Cuartila Q3 este un numar cu proprietatea ca trei patrimi din date au valori mai mici
decat Q3 si o patrime din date au valori mai mari decat Q3.
Parametri si caracteristici statistice ale pozitiei

Alte categorii de quantile folosite sunt:

-decilele care impart setul de date in 10 grupe egale.

-centilele care impart setul de date in 100 grupe egale.

- promilele care impart setul de date in 1000 grupe egale.


Exercitiu

Media =

Mediana =

Amplitudinea selectiei =

Q1=

Q3=
Prezentarea datelor
Seria de distributie este un ansamblu de doua siruri finite dintre care primul
este sirul elementelor distincte din setul de date statistice sau sirul claselor
obtinute prin gruparea elementelor din setul de date statistice, iar cel de-al
doilea este sirul de frecvente corespunzatoare.
Prezentarea datelor
Prezentarea datelor
Box plots
Prezentarea datelor
Exemplu: rezistenta a 80 de mostre de aliaj aluminiu-litiu

S-ar putea să vă placă și