Documente Academic
Documente Profesional
Documente Cultură
Cursul 12
Model statistic
Definitie: corelează, într-o relaţie matematică, prin metode
statistice datele experimentale ale variabilelor semnificative ale
unui proces.
Calculul statistic se utilizează pentru:
validarea datelor experimentale,
obtinerea si validarea modelului statistic.
Modelul statistic:
reflectă legătura dintre datele de intrare şi de ieşire ale
sistemului,
descrie comportament sistemelor complexe sau a sistemelor a
căror mecanisme nu sunt cunoscute,
nu descrie mecanismul fizic sau chimic al procesului,
coeficienţii modelului empiric nu au semnificaţie fizică.
Analiza de regresie
În analiza de regresie:
variabila dependent, y este variabila asupra căruia se fac estimări,
variabila sau variabilele independente sunt utilizate pentru estimarea
variabilei dependente.
1. Inventarierea variabilelor
2. Alegerea (propunerea) modelului de regresie
3. Obtinerea datelor experimentale
4. Calculul coeficientilor modelului de regresie
5. Testarea calitatii modelului
𝑠 21
𝐹= 2
≤ 𝐹𝛼
𝑠 2
y=f(x)
Covarianța eșantionului (x i x )( y i y)
cu n perechi de date este: cov ( x , y) s i 1
n 1
Covarianța populatiei cu
(x
i 1
i x )( y i y)
70
Drepteleîmpart graficul în patru
65 II
y I zone în care:
60
55
punctele din zona I au și ,
punctele din zona II au și ,
50
punctele din zonele I şi III au
45 III IV
,
40
punctele din zonele II şi IV
35 au .
30
0 1 2 3 4 5 6
Interpretarea covariantei
covs ( x , y) cov p ( x, y)
r
2 2
s x s y x2 y2
y y y
x x x
r = -1 r = -0,6 r=0
y
y y
x x x
r = +1 r = +0,3 r=0
Coeficientul de corelatie
• nu se corelează, r=0,
r<0 r r>0
Coeficientul de corelaţie
x=t
y=h
Analiza de regresie liniara
Observatie:
Corelația trateaza cele două variabile în mod egal.
În regresie, o variabilă este independentă - variabila x, iar cealaltă
dependenta - variabila y.
y= 0 + 1x 1
şi - parametrii x
modelului 0
Modelul de regresie
Fiecărui
x din populația x îi corespunde un y din populaţia y. Ecuația
dependenţei dintre y, x și denumită eroare, este modelul de
regresie:
yi
C A ^𝑦 = b0 + b1 x
B ´𝑦
y
B
A
C
yi
n n n
i 1
( yi y ) 2
i 1
( yˆ i y ) 2
i 1
( yˆ i y i ) 2
Metoda celor mai mici pătrate
Metoda celor mai mici pătrate
utilizează datele eşantionului pentru calculul b0 și b1
minimizează suma pătratelor abaterilor dintre valorile măsurate şi
cele estimate:
experimental b1
calculat b0
ŷ b 0 b1x
m
SSE ( y k yˆ k ) 2 Suma patratelor abaterilor (Sum
k 1 of squared errors)
k 1 m = nr. puncte
experimentale
Functia obiectiv
Ecuatiile caracteristice ale metodei
celor mai mici patrate
SSE m
2 ŷ k b 0 b1x k (1) 0
b 0 k 1
SSE m
2 ŷ k b 0 b1x k ( x k ) 0
b1 k 1
𝑏 1=
∑ ( 𝑥 𝑖 − ´𝑥 ) ( 𝑦 𝑖 − ´𝑦 )
∑ ( 𝑥 𝑖 − 𝑥´ )2
Regresie liniara multipla
yˆ b0 b1 x1 b2 x2 ...bn xn
Exemplu: yˆ b0 b1 x1 b2 x2
m
SSE ( y k yˆ k ) 2
k 1
m
SSE ( yk b0 b1 * x1, k b2 x2,k ) 2
k 1
min SSE
( b0 ,b1 ,b2 )
Sistemul de ecuatii pentu 2 variabile
independente
SSE
2 ( yk b0 b1 * x1,k b2 x2,k ) *(1) 0
b0 k
SSE
2 ( yk b0 b1 * x1, k b2 x2 , k ) *( x1 , k ) 0
b1 k
SSE
2 ( yk b0 b1 * x1,k b2 x2 , k ) *( x2 , k ) 0
b2 k
m m m
mb0 b1 x1 ,k b2 x2,k yk
k 1 k 1 k 1
m m m m
b0 x1, k b1 x b2 x1, k x2, k x1, k yk
2
1, k
k 1 k 1 k 1 k 1
m m m m
b0 x2, k b1 x1,k x2,k b2 x 2
2, k x2, k yk
k 1 k 1 k 1 k 1
Model de tip polinomial
y b0 b1 x b2 x 2 (3)
Exemplul tipic :
Cp a b t c t2
Cp= y t = x1 t2 = x2
În
acest grafic variabila independenta este pe abscisă și rezidualele
pe ordonată. Aspectul graficului este similar cu cel pentru x; este
preferat pentru analiza de regresie multiplă, deoarece analizeaza
concomitent mai multe variabile independente.
Graficul rezidualelor standardizate
Rezidualele standardizate sunt raportul rezidualelor si abaterea
standard:
hi este::
Graficul rezidualelor standardizate
Graficul rezidualelor
standardizate oferă
informații despre distribuitia
erorii .
Dacă distribuția rezidualelor
standardizate se aseamănă
cu distribuţia normală
standardizată a
probabilităţilor, atunci 95%
din rezidualele
standardizate sunt între -2 și
+2.
Rezidualele standardizate
sunt calculate de pachete
de programe statistice.
Reprezentarea grafică a probabilităţilor
normale
Scoruri normale:
se selectează aleatoriu 10 valori dintr-o distribuție normală
standardizata de probabilitati, cu și s=1,
eșantionarea se repetă de 10 ori si eșantioanele se ordoneaza
crescător,
Valoare medie a celor mai mici valori obținute prin eșantionare
repetată se numește statistica de ordinul unu.
Statisticieni demonstrează că valoarea medie a statisticii de ordinul
unu este 1,55, valoare denumită scor normal.
Dacă dimensiunea eşantionului este n = 10, se definesc 10 scoruri
normale. În general, un set de date cu n observații va avea n
statistici și n scoruri normale.
Reprezentarea grafică a probabilităţilor
normale
Ordinea statistică Scorul normal
1 -1,55
2 -1,00
3 -0,65
4 -0,37
5 -0,12
6 0,12
7 0,37
8 0,65
9 1,00
10 1,55
Reprezentarea grafică a probabilităţilor
normale
Ipoteza de normalitate este îndeplinită daca in reprezentarea
grafică, scorurile normale de pe axa orizontală și rezidualele
standardizate corespunzătoare de pe axa verticală, se grupează în
jurul liniei cu panta de 45o care trece prin origine.
Dacă datele modelului se abat suficient de mult de la linia cu panta
de 45 de grade, rezultă că rezidualele standardizate nu aparţin unei
distribuţii de probabilităţi normale standardizată.
Orice curbă evidentă a reprezenării grafice este a dovadă că
rezidualele nu provin dintr-o distribuție normală.
Scorurile normale și reprezentarea grafică a probabilităţilor normale
asociate se obțin din pachetele de programe statistice.
Reprezentarea grafică a probabilităţilor
normale