Sunteți pe pagina 1din 22

c 

           

       

         


  

       


Sir Francis Galton
‡ Punctul de plecare:
problema eredităţii; sondaj
statistic-Africa 1850-1852
‡ Lucrări publicate:
³Regression towards
mediocrity in hereditary
stature´ (1885),
³Family likness in stature´
(1886)
³Corelations and their
measurement, chief from
anthropometric data´ (1888)
arl Pearson
‡ Lucrări publicate:
Contributions to the
Mathematical Theory of
Evolution´, ³Mathematical
Contributions to the Theory
of Evolution III. Regression,
Heredity and Panmixia´ .
Dezvoltă împreună cu alţi
matematicieni conceptele de
corelaţie parţială şi corelaţie
lipsită de sens, testul Chi
pătrat.
Sir Ronald A. Fisher
‡ Critică descoperirile lui
Pearson, argumentând că
testul Chi-pătrat induce
erori.
‡ În 1921 introduce noţiunile
de corelaţie intra-clasă şi
analiză a varianţei.
‡ 1922 introduce noţiunea de
grade de libertate şi testul
F.
2. Corelaţia ± noţiune şi tipuri

Corelaţia ± expresia sintetică a intensităţii legăturilor dintre două sau mai


multe variabile:
Ë âariabila (caracteristica) rezultativă - variabilă endogenă, dependentă,
variabilă predictibilă sau efect,
Ë âariabila (sau variabilele) independentă -variabilă factorială, exogenă,
predictor sau variabilă cauză.

Regresia oferă posibilitatea modelării matematice a dependenţei dintre o


variabilă rezultativă şi una sau mai multe variabile factoriale. Regresia şi
corelaţia şi sunt două feţe ale aceleiaşi monezi.
Òipuri de corelaţie
‡ ýupă numărul variabilelor ce formează cuplul
corelativ:
Ë corelaţie simplă: cifra de afaceri şi volumul vânzărilor, productivitate şi
grad de înzestrare tehnică a muncii, studiul individual şi rezultate şcolare, etc.
Ë corelaţie multiplă: rata şomajului, volumul total al forţei de muncă,
numărul de locuri de muncă existente.
‡ ýupă direcţia legăturilor factoriale:
Ë corelaţie directă: poluare şi rata mortalităţii infantile;
Ë corelaţie inversă: cheltuieli cu sănătatea şi rata mortalităţii infantile,
satisfacţia de viaţă şi migraţia, etc.
‡ ýupă expresia analitică a legăturilor:
Ë corelaţie lineară
Ë corelaţie nelineară (curbilinie).
Fig.2 c) Corelaţie lineară perfect
negativă
. Metode elementare folosite în analiza
corelaţiei dintre variabile

Metoda seriilor paralele interdependente

Metoda grupărilor

Metoda tabelul de corelaţie

Metoda grafică
Metoda seriilor paralele interdependente
Condiţii de aplicabilitate Limitări

‡ Pentru un număr mare de


observaţii şi o amplitudine
mare a acestora se recurge la
‡ Număr redus de metoda grupărilor sau la
‡ observaţii (xi , yi ) metoda tabelului de corelaţie
(amplitudine mare a valorilor
‡ Ordonare a variabilei X variabilei factoriale si
‡ O singură variabilă rezultative).
factorial㠺i o singur㠇 Ambele variabile ale cuplului
variabilă rezultativă; corelativ trebuie sa fie
variabile cantitative, iar
‡ âariabile exprimate valorile variabilei X nu
cantitativ. trebuie să se repete.
‡ Metoda nu poate fi aplicată
pentru corelaţii multiple.
Metoda grupărilor

Condiţii de aplicabilitate Limitări

‡ Unităţile colectivităţii studiate ‡ Nu se poate utiliza în cazul în


sunt grupate în funcţie de care una dintre variabilele
variabila factorială, iar pentru cuplului corelativ este variabilă
variabila rezultativă se exprimată calitativ (de pildă am
calculează indicatori specifici dori să analizăm empiric
derivaţi pentru fiecare grupă; posibila legătură între sexul
‡ Gruparea trebuie să prezinte salariaţilor unei întreprinderi şi
corect forma de interdependenţă salariul acestora);
dintre variabilele analizate; ‡ Nu se poate utiliza atunci când
‡ Se recomandă intervale egale de avem mai multe variabile
grupare; factoriale. Dacă amplitudinea
valorilor observate a variabilei
factoriale X este mare se va
proceda la gruparea acestora cu
ajutorul formulei lui Sturges, şi
se va folosi tabelul de corelaţie.
‡ Nu precizează nimic despre
intensitatea corelaţiei.
 




    
     
Metoda tabelul de corelaţie


   
 Ò




Ò  
       

Ä

$


/
)
,%
)
 

 
%.$
$


 
 ) %
$
) 
$
  .



       
       
   !     
       ! 
!        !
! !       
Ò     !  !   

" # $ $  % 
  &
'| |
| |(  $   ) 
*  % mÄ )
    +  , $ -      .    )- 
/)  %  - + $   
' i | 
| | 0  % mÄ  ) $ )  $   
  
      )     
 
) 
     ).   )-  /)  %      %
$  1 )
 . $ -       - $  ) # -  ))   -

'@

| |0 
*#*  %   m )- /)  % 
   %  
$' ||
| | 0  %  m )     +  ,
$ -  . *#  )   )  + -) . )   )- 
Metoda grafică

m
 rp   p  rp r
M r f r r r r r m
r r r f r Xp p f p p rp p






p
r r
 rp   p rp p r p  r p r
  p Yp p
mp p fp p rp p r r
 rp   p Prp rp
  rpXYppp?  p
p r pr rmp  mp rp
ËpŠ  pr p
ËpDrpr p
ËpFrmpr p
ËpV   pr p
Š p  p p   p p  rp p p rrp p

p
Fig. 6 a) legătură directă b) legatură
inversă

c) lipsă de legătură, variabile independente


°. Metode analitice folosite în studiul
corelaţiei

Metoda regresiei

Regresiei simplă, unifactorială

Regresiei multiplă, multifactorială

Metoda corelaţiei
a e ra  rce s arecm
rezultati ă ] şi

m o d e l .  a r e
c-sa em
u r m
 rcem
ă t o
e  rec
Regresia lineară simplă

ndiţii de aplicabilitate: Legătură de tip linear ntre


ariabilă fact rială 

rea a   za es e  es mae a fce e rerese.

a r e l e
 , c e
m 

s i n

c a r a c t e r i s t i c i

Parame r   e rmă a area ara e rez a e ] câ x=0.


e eere eme rc   es e c   care rea a e rerese  ersec ează a a y.
 c e eere s a s c-ecmc  er re area    se a face  s râsă
e ră c e em  rac c aa za .

: 



t e t i z e a z ă

 m
m

i n f l u

w   

V
e n ţ a v

w?Ô
a r i a b

V
i l e l o

o m
a r carac er 

a v
n

e a :
e s p
ariabilă

e c i f i c a t e

 c
( )

î n

( )























 











V 
        p   p          p

p
  Ú  p
       p      
p ]        
    
 ]    
p
     p       p     p  p     p
   p       p   p       p

   
  p

p
   6  p       p p     p  p     p
   p       p   p 
   

   
  p

       p          p 㠘 p   p       p   p        p     p   

  p   p        p  p    p
     p  m m s p          p        p ˜      p  p

   áÖ    
  
  
         
          

p    m      


p      m m    
      

 
p   
 V p       p  p  p  p       p        p 
   p

   p    p   p p ˜ p       p          p  p

p
 m     
  
         Ä w! p

   ˜  p           p        p

 
á

×     
'  

         ß ˜             
 

        
                           
   
   

  
        
 

     ßs    
                  ßs 6  
             

     ßs Ú                        


   
    ßs             
                












                         


         
     


 ß s
      
                          ˜                      

Õ Õß

i      '  


     i  ‘ w    
 

     ßs  Õ Õß   !     
          
   

                 

     ˜      
         

!    "   
                    #                
 

          $ 

4p 
  
                 
i 
4p i  i  i         
  
             i
   i       
4p    i    
     s  
       i  
    
Vntensitatea corelaţiei lineare simple

Coeficientul de corelaţie lineară Pearson

n
xi  x yi  y n
i ( Õ )( Õ ) (x  x)(y  y)
i i
cov(x, y)
x y i
r
n nÕ xÕ y Õ xÕ y
n n n
n xi yi   xi  yi
i i i
ry / x
n n n n
2
n x i  ( x i ) l n  y i  ( y i ) 2 l
2

i i i i
Regresia simplă nelineară

Parabola de gradul VV ] xi 0 x
1 i 2 x 2i V

1
uncţia hiperbolică ] xi 0 1 V
xi

xi
uncţia exponenţială ] xi 0 1 V
 
 
    




 


'   


 

Vntensitatea corelaţiei nelineare

p
á
× 


á
×  !

p
!

×    !
  á
×  !
!
        


Õ ! 

á

!
Õ 

 !


  
       

 p  p     p
   p  p 
p p p p p p p p p p p p p p p p p p p p p p p p p p

  
p       p 
p
 





p p p

      p  
 p  p        p p   p
p   p      p     p

 p   p     p   p
p  p  p   p        p p   p
p   p      p

  p     p   p  
p 
p     p   
p  p     p    p   
p

     p  p    p   p     p  p     p p     p ! p

    
p p     p 
p     p   
p      p p    p      p

   p


Òestarea semnificaţiei pentru modelul
nelinear

Òestul F (lege de distribuţie Snedecor ± Fisher, de k-1 şi n-k grade de libertate )


2
nk y/x
F  2
k 1 1 y/x

unde n reprezintă numărul valorilor observate iar k numărul


parametrilor estimaţi ai modelului de regresie

calculat È tabelar Vpoteza alternativă

calculat p tabelar Vpoteza nulă

S-ar putea să vă placă și