Documente Academic
Documente Profesional
Documente Cultură
De studiat:
Problema:
Despre exportul si importul RO se cunosc datele:
Exportul Importul
(mld Euro) (mld Euro)
10,36 11,38
11,38 14,35
14,67 17,42
15,61 19,56
18,93 24,25
22,25 30.06
a) Să se estimeze parametrii modelului simplu de regresie si să se determine
variabila reziduală (variabila eroare)
b) Să se valideze modelul de regresie pentru un nivel de semnificație de 5% F
critic=7,71 (Atentie, F crititc e acelasi cu F Tabelar)
c) Măsurați intensitatea legăturii directe dintre cele 2 variabile folosind un
indicator adecvat și testați semnificația acestuia pentru o probabilitate de 95%;
T critic=2,77
d) Să se testeze semnificația parametrilor și să se interpeeteze valorile; T
critic=2,77.
Corelația-se foloseste pentru a vedea cat de puternica este legatura intre doua variabile
si pentru a studia un model de regresie
Modelul de regresie are la baza 1 sau mai multe ecuatii- un model matematic care
exprima dependenta variabilelor complexe de un ansamblu de factori
e- variabila reziduala
Aplicatie
70
60
50
40
30
20
10
0
=> legatura directa (ambele variabile cresc sau scad in acelasi sens) si liniara
^b0 = ∑ x i ∑ y i−∑ x i ∑ x i y i
2
{ n b^ o + b^ 1 ∑ x i=∑ y i
b^ o ∑ x i+ b^ 1 ∑ x 2i =∑ x i y i n ∑ x2i −(∑ x i )
2
n ∑ x i yi −∑ x i ∑ y i
b^ 1= 2
n ∑ x 2i −( ∑ x i)
b^ 0 = 5.75
b^ 1 =7.875 > 0 => legatura este directa si liniara- ambele variabile cresc si scad
^y =b 0+ b1 x+ ei
3 30 5.75 + 7.875 *
3=
4 42 5.75 + 7.875 *4
1 10 5.75 + 7.875 *1
6 62 5.75 + 7.875 *6
1 12 5.75 + 7.875 *1
2 30 5.75 + 7.875 *1
2 21 5.75 + 7.875 *1
5 28 5.75 + 7.875 *5
( y i− ý ) =( y i− ^y ) +(^y − ý)
( y i− ^y ) – abatere reziduala
yi
ý=∑ = 29,374 – nivelul mediu al profitului
n
- varianța totală: Δ 2y =∑ ( y i− ý )2
2 2
- varianța reziduală: Δ e =∑ ( yi − ^y )
S 2 Δ
2
= y /x =
∑ ( ^y − ý ) 2
- y /x
k k
S=
2Δ 2e
=
∑ ( y i− ^y )2
- e
n−k−1 n−k−1
S 2
=
∑ ( y i− ý )2 S y/ x
y
n−1 - Fcalculat = S e ->
2
{FcalculatFcalculat
≤ Ftabelar=¿ modelul nu e valid si var . x nu influenteaza semnif . var . y
> Ftabelar=¿ modelul e valid ,iar x influenteaza var . y Ipoteze:
H0
- ipoteza nula -> modelul nu este valid din punct de vedere statistic
- ipoteza alternativa
H1
= not
H0
-> modelul este valid S 2y / x ≠ S 2e
Sursa variatiei Suma Nr. gradelor de Media Fcalculat
patratelor calc. libertate patratelor
cu ajut.
variantelor
Din interiorul Δ 2y/ x k=1 S 2y / x S 2y/ x
grupelor S 2e
explicata de
model
Dintre grupe Δ 2e n–k–1=6 S 2e S 2y/ x
S 2e
2
( y i− ý ) ( y i− ^y )2 ( ^y − ý )2
n ∑ x i y i−∑ x i ∑ y i
r y / x=
[ n ∑ x −(∑ x ) ][n ∑ y −(∑ y ) ]
2
i i
2 2
i i
2
S
r y / x =b^ 1= x
Sy
Sx =
√∑ ( xi −x́)2
n−1
– abaterea standard a variabilei “x”
S y=
√ ∑ ( y i −ý)2
n−1
– abaterea standard a variabilei “y”
{
∈ [ 0, 0.5 ] →legatura puternica
r y /x ∈ [ 0.5, 0.75 ] → legatura slaba
= 0,86;
∈ [ 0.75,1 ] →legatura de intensitate medie
Ipoteze:
H 0 : r=0 H 1 :r ≠ 0
r y/ x √ n−2
Tcalculat = test Student = =4.28
√1−r 2
y/ x
Tcalculat > Ttabelar => pentru o probabilitate de 95% (100 – α) exista suficiente
dovezi pentru a aprecia ca coeficientul de corelatie liniara este semnificativ, adica
exista suficiente dovezi pentru a respinge ipoteza nula.
R y / x=
√ 1−
∑ ( y i− ^y )2
∑ ( y i− ý )2
=
√ √∆ 2e
1− 2 =
∆y
∑ ( ^y − ý )2 =
∑ ( y i− ý )2 √ ∆2y /x
∆ 2y = 0,85 => regresia e liniara =>
leg. puternica
Aici nu cred ca e cu 1-
2
2 ∆
R y /x =1− 2e = 0,74 => 74% din variatia profitului este explicata de influenta
∆y
numarului de camasi, iar 26% este influenta exercitata de alti factori considerati cu
actiune constanta, neinclusi in modelul de regresie
n−k −1 2
∗R
k
Fcalculat = = 17,07
1−R2
Ftabelar = 5,99
Fcalculat > Ftabelar => pentru o probabilitate de 95% (100 – α) exista suficiente
dovezi ca raportul de corelatie este semnificativ statistic (H1)
formula
Se
S b 1=
– deviatia standard (abaterea medie)
√∑ (x − x́ )
i
2
Se=
∆2e
n−k −1 √ ; pe ∆ 2e l-am aflat mai sus
Apoi calculam (xi- x́ ) ca sa aflam suma care ne trebuie in formula de mai jos
x -nr ( xi−x́ )2
de
camasi
( 3−3 )2
3
( 4−3 )2
4
( 1−3 )2
1
( 6−3 )2
6
( 1−3 )2
1
( 2−3 )2
2
( 2−3 )2
2
( 5−3 )2
5
Se
S b 1=
– deviatia standard (abaterea medie)
√∑ (x − x́ )i
2
Se=
√
∆2e
n−k −1
= 8,99 => S b 1 = 4,89
S b 0=S e
√ ∑ x 2i
n ∑ (xi −x́)2 = 6,357
H0
1. se stabileste
H1
2. se stabileste
3. se stabileste testul statistic ce va fi utilizat ca si criteriu de acceptare,
H0
refuzare , precum si nivelul de semnificatie al testului
4. se determina indicele statistic din esantion
5. se determina valoarea calculata a testului statistic si se stabileste regiunea
critica
6. se desprind concluziile si anume
a. daca valoarea numerica a testului apartine regiunii critice atunci se
H0
respinge
b. daca valoarea numerica nu apartine regiunii critice atunci exista dovezi
H0
sa acceptam
H1
Ipoteza poate avea una din forme daca se testeaza egalitatea parametrului
“media colectivitatii generale” cu o valoare prestabilita (ipotetica).
x́ = media esantionului
n = numarul de observatii
-∞ +∞ -∞ +∞ -∞ +∞
Valoarea
Valoarea tabelara Valoarea tabelara
tabelara
In activitatea practica foarte multe decizii se iau pe baza unor date limitate
(esantioane de volum mic, n <= 30 observatii). In acest caz se va utiliza pentru
testarea celor 3 ipoteze statistice:
x́−μ 0
Testul T = testul Student = S
√n
S=
√ ∑ ( x i− x́ )2
n−1
Valoarea medie a unei locuinte aflate in apropierea unui colegiu este de 58950=(
μ´0 ¿ unitati monetare. Se presupune ca valoarea locuintelor creste cu cat ele
sunt situate mai aproape de acest colegiu. Pentru a testa ipoteza s-au selectat
aleatoriu 12 locuinte din zona colegiului. In urma evaluarii acestora rezulta o
valoare modala de 62460 (Mo= x́ ) unitati monetare cu o abatere mediu patratica
de 5200 (=Sx) unitati monetare. Testati aceasta ipoteza cu un nivel al semnificatiei
α=5%; n = 12, Ttabelar = 1,796
- etapa 1 H0 : μ = μ0 = 58950
- etapa 2 H1 : μ > μ0 > 58950
- etapa 3 Deoarece n = 12 < 30 observatii => test unilateral dreapta?α = 5% =
0.05
- etapa 4 Sx = 5200
μ0 = 62460
x́ = Me = 62460 (serie perfect simetrica)
Regiunea critica H0
x́−μ 0 62460−58950 3510 Reg. de acceptare H0
= =
- etapa 5 Tcalculat = S 5200 5200 = 2,34
√n √ 12 3,464
μ=0
- etapa 6 Tcalculat > Ttabelar (2,34 > 1,79) -∞ +∞
1,79
2,32
Aplicatie
- etapa 1 H0 : μ = μ0 = 2.01
- etapa 2 H1 : μ ≠ μ0 ≠ 2.01
- etapa 3 Deoarece n = 5 <= 30 => testul bilateral-, α = 5% = 0.05
μ=0
-∞ +∞
-2.776 1.87 +2.776
- etapa 4 x́ = 2.63
S
2 ∑ (x i− x́)2 √S2
= n−1 = 0.55 => S = = 0.74
x−μ 0
- etapa 5 Tcalculat = S = 1.874
√n
- etapa 6 Tcalculat < Ttabelar (1.874 < 2.776)
In acest caz se vor utiliza esantioane de volum mare (n >= 30) avand la baza
utilizarea functiei Gauss-Laplace. Testarea ipotezei se face pe baza mediei
esantionului. Pentru a efectua testarea vom utiliza testul Z cu un nivel de
semnificatie α prestabilit.
x−μ 0
Zcalculat = S
√n
- etapa 1 H0 : μ = μ0 = 130
- etapa 2 H1 : μ ≠ μ0 ≠ 130
- etapa 3 Deoarece n = 100 > 30 => test Z bilateral, α = 1%
Regiunea critica H0
- etapa 4 S = 15 min Regiunea critica H0
Reg. de acceptare H0
x́ = 120 min
Aplicatie
Un reporter se documenteaza pentru un articol privind costurile tot mai ridicate ale
educatiei in mediul superior. Pentru aceasta a luat in considerare costul unui
manual in semestrul in curs. In urma considerarii unui esantion de 41 manual a
b) testati ipoteaza conform careia valoarea media a unui manual este mai mica
decat – (de aceea avem test unilateral stanga, pt ca este mai mica) 15 u.m.
pentru un nivel de semnificatie α = 1%
- etapa 1 H0 : μ = μ0 = 15
- etapa 2 H1 : μ < 15 < μ0
- etapa 3 Deoarece n = 41 > 30 => test Z unilateral stanga, α = 1%
- etapa 4 x́ = 13.42
2
S=
∑ ( x i− x́ )2
n = 39.46 => S = 6.28
x−μ 0
- etapa 5 Zcalculat = S = -1.61
√n
Regiunea
critica H0
-∞ +∞
-2.33 -1.61