Sunteți pe pagina 1din 22

12/06/2013

CURSO NIVELATORIO EN

Anlisis Estadstico Aplicado


Prof. Andrs Carrin

13/Junio/2013

Unibague. MGI: Curso Anlisis Estadstico Aplicado. Junio/2013

ANLISIS ESTADSTICO
APLICADO
UNIVERSIDAD DE IBAGU

2013

Andrs Carrin
acarrion@eio.upv.es

12/06/2013

TEMARIO
1.

2.
3.
4.
5.
6.
7.

Obtencin de datos. Muestreo y diseo de


experimentos
Resumen y descripcin de datos
Tablas de contingencia. Pruebas de normalidad
Relaciones entre variables I. ANOVA
Relaciones entre variables II. Regresin
Reduccin de dimensionalidad: Anlisis Factorial
Tcnicas de Clasificacin: Anlisis discriminante y
regresin logstica
3
A. Carrin

TEMA 4: ANLISIS DE LA VARIANZA


INTRODUCCIN
ANLISIS DE LA VARIANZA CON UN FACTOR
MODELO E HIPTESIS
TABLA ANOVA
INTERVALOS LSD
EJEMPLO

Anlisis de la varianza con dos factores controlados


SIN INTERACCIN
MODELO E HIPTESIS. TABLA ANOVA
EJEMPLO
CONCEPTO DE INTERACCIN
CON INTERACCIN
MODELO E HIPTESIS. TABLA ANOVA
EJEMPLO
4
A. Carrin

12/06/2013

ANLISIS DE LA VARIANZA
SE HAN VISTO TCNICAS DE INFERENCIA PARA COMPARAR LAS
MEDIAS DE DOS POBLACIONES, MEDIANTE CONTRATES DE
HIPTESIS BASADOS EN LA PRUEBA t
EL PROBLEMA SURGE CUANDO LA COMPARACIN DESEAMOS
HACERLA ENTRE MS DE DOS POBLACIONES
EN TAL CASO LAS SIMPLES COMPARACIONES A PAREJAS NO
SON SUFUCIENTE, Y ES PREFERIBLE EL EMPLEO DE LA TCNICA
CONOCIDA COMO ANLISIS DE LA VARIANZA
5
A. Carrin

Definiciones Bsicas
Variable Respuesta
Factor Experimental
Niveles de los Factores
Rplicas y repeticiones
Aleatorizacin

Diseo y Anlisis de Experimentos

12/06/2013

ANLISIS DE LA VARIANZA CON UN FACTOR


EN SU NIVEL MS SENCILLO CONSIDERA QUE EXISTE UNA VARIABLE
RESPUESTA, y, CUYA MEDIA DEPENDE EL NIVEL DE UN NICO FACTOR
CUALITATIVO:
ESTATURA EN HOMBRES Y MUJERES
RENDIMIENTO DE UN PROCESO CON TRES TIPOS DE MATERIA PRIMA
INGRESOS POR ZONA GEOGRFICA

Suponemos:
Respuesta distribuida normalmente o al menos cuantitativa
Independencia de las observaciones
Normalidad de los residuos
Factor cualitativo
Modelo lineal
Varianza constante

7
A. Carrin

ANLISIS DE LA VARIANZA CON UN FACTOR


EL MODELO DE ANLISIS DE LA VARIANZA CON UN FACTOR ES:
xij = m + i + ij

i=1k, j=1n

Siendo:
m = media general
i = efecto del nivel i
ij = perturbacin aleatoria

se cumple que
i = 0
ij = N(0, 2)
8
A. Carrin

12/06/2013

ANLISIS DE LA VARIANZA CON UN FACTOR


Las hiptesis a contrastar son:
H0: i =0 para todo i
H1: existe algn i 0
Si se rechaza H0 decimos que el factor es significativo o que
tiene un efecto significativo

9
A. Carrin

ANLISIS DE LA VARIANZA CON UN FACTOR


Supngase que se ha analizado el rendimiento de tres mquinas,
presuntamente iguales, para comprobar si efectivamente son igual de
productivas. Los datos obtenidos han sido:
MAQ. 1
47
53
49
50
46
49
x1 = 49

MAQ. 2
55
54
58
51
52
56
x 2 = 56

MAQ. 3
54
50
51
51
49
51
x 3 = 51

Evidentemente los resultados son distintos, pero la cuestin es:


Son suficientes las diferencias que observamos entre mquinas para afirmar que
trabajan de modo distinto?
o ms bien se trata de diferencias aleatorias, inevitables aun en el caso de que trabajen
igual?

10

A. Carrin

12/06/2013

ANLISIS DE LA VARIANZA CON UN FACTOR


Los datos se introducen
en columnas:
Factor
Variable respuesta

11
A. Carrin

ANLISIS DE LA VARIANZA CON UN FACTOR

12
A. Carrin

12/06/2013

13
A. Carrin

LA TABLA ANOVA
LA INFORMACIN DEL ANLISIS SE RESUME EN UNA
TABLA, SIMILAR A LA USADA EN LA COMPROBACIN DE
LA SIGNIFICACIN DE REGRESIN LINEAL
ORIGEN DE
LA VARIANZA

SUMA DE
GRADOS DE
CUADRADOS LIBERTAD

VARIANZAS

ENTRE
GRUPOS
(V.Explicada)

(SCE)

k-1

S 2e =

SCE
k 1

INTERNA
(V. no expl.,
error)

(SCR)

n-k

SR2 =

SCR
nk

TOTAL

(SCT)

n-1

RATIO
F

F=

S 2e
SR2

SIG. LEVEL

P(Fk -1,n -k > F)

S 2x
14
A. Carrin

12/06/2013

LA TABLA ANOVA

15
A. Carrin

LA DIFERENCIA MNIMA SIGNIFICATIVA (LSD)


LA TABLA F NOS DICE SI EL FACTOR CONTROLADO INFLUYE O NO EN LA
VARIABLE RESULTADO, PERO NO NOS DICE QU EFECTO PRODUCE NI
QU NIVELES DEL FACTOR PROVOCAN DIFERENCIAS SIGNIFICATIVAS
CON LOS OTROS
SI EL TEST F MUESTRA UN RESULTADO SIGNIFICATIVO, HAY QUE
ESTUDIAR QU NIVELES SON DISTINTOS.
PARA COMPROBAR DNDE ESTN ESAS DIFERENCIAS SE PUEDE USAR LA
DIFERENCIA MNIMA SIGINIFICATIVA (LSD)
SE CALCULAN UNOS INTERVALOS QUE PERMITEN DETERMINAR SI HAY
O NO DIFERENCIAS ENTRE NIVELES
16
A. Carrin

12/06/2013

LA DIFERENCIA MNIMA SIGNIFICATIVA (LSD)


SE CALCULAN LOS INTERVALOS LSD MEDIANTE:

xi

2 /2
t n kSx i
2

siendo:
S2R
x i la media del nivel i del factor
Sxi =
ni
Sx la desviacin tpica de x i
n-k = grados de libertad del error o residuo
i

Aquellos niveles cuyos intervalos LSD no se solapen son


significativamente distintos

17

A. Carrin

LA DIFERENCIA MNIMA SIGNIFICATIVA (LSD)

AB

18
A. Carrin

12/06/2013

LA DIFERENCIA MNIMA SIGNIFICATIVA (LSD)


Hay otros criterios para calcular la diferencia mnima
significativa
El tipo de intervalo visto es el propuesto por Fisher, pero
tiene el inconveniente de que si hay muchos contrastes
a realizar (muchos factores y/o muchos niveles) tiende a
dar como significativas alguna diferencias dudosas
Los intervalos de Scheffe corrigen esa tendencia
19
A. Carrin

TRANSFORMACIONES DE LOS DATOS


Las hiptesis del modelo exigen que los datos sigan una distribucin
normal (al menos aproximadamente)
Hay casos de no normalidad clara en los que una transformacin de
los datos permite su adecuado anlisis con la tcnica ANOVA
Ejemplos:

DATOS PROCEDENTES DE CONTEOS:


x = nmeros enteros procedentes de conteos
Transformar mediante: y = 1 + x

PROPORCIONES
p = proporcin
Transformar mediante: y = arcsen p
20
A. Carrin

10

12/06/2013

ANLISIS DE LA VARIANZA CON VARIOS FACTORES


CONTROLADOS
Podemos trabajar con varios factores controlados a la
vez, cuyos efectos queremos evaluar.
Seguimos suponiendo:
Respuesta distribuida normalmente o al menos cuantitativa
Independencia de las observaciones
Normalidad de los residuos
Factores cualitativos
Modelo lineal
Varianza constante

21
A. Carrin

ANLISIS DE LA VARIANZA CON VARIOS FACTORES


CONTROLADOS
EL MODELO DE ANLISIS DE LA VARIANZA CON VARIOS
FACTORES (SIN INTERACCIN) ES:
xim = m + i + j + k + + ijkm

i=1I, j=1J, k=1K, m=1M

Siendo:
m = media general
i , j , k , = efecto del nivel i de cada factor

ijkm = perturbacin aleatoria


se cumple que
i = 0 i = 0
ijkm = N(0, 2)

i = 0
22
A. Carrin

11

12/06/2013

ANLISIS DE LA VARIANZA CON VARIOS


FACTORES (SIN INTERACCIN)
Las hiptesis a contrastar para el factor 1 son:
H0: i =0 para todo i
H1: existe algn i 0
Si se rechaza H0 decimos que el factor es significativo o que tiene
un efecto significativo

Para el resto de factores corresponden las hiptesis


equivalentes
23
A. Carrin

TABLA ANOVA SIN INTERACCIONES (DOS FACTORES)

24
A. Carrin

12

12/06/2013

25
A. Carrin

TABLA ANOVA SIN INTERACCIONES (DOS FACTORES)

ORIGEN DE LA
VARIANZA

SUMA DE
CUADRADOS

GRADOS DE
LIBERTAD

CUADRADOS
MEDIOS

RATIO
F

FACTOR 1

SCF1

I-1

CMF1

F1 =

CMF1 P(FI-1,IJn-I- J+1 > F1 )


CMR

FACTOR 2

SCF2

J-1

CMF2

F2 =

CMF2 P(F
J-1,IJn-I- J+1 > F2 )
CMR

RESIDUO

SCR

IJn-I-J+1

CMR

TOTAL

SCT

IJn-1

SIG. LEVEL

26
A. Carrin

13

12/06/2013

27
A. Carrin

28
A. Carrin

14

12/06/2013

Interaccin
Cuando dos factores son independientes, el efecto de
que un factor cambie de nivel no altera el efecto que
produce el otro factor
Cuando existe interaccin entre dos factores, el efecto
de un factor depende del nivel que presente el otro

29
A. Carrin

Interaccin
Factores que influyen en el dulzor de un caf:
Cantidad de azcar aadido:
Temperatura:

1g / 8g
45/ 55

DULZOR

5
4

8g

3
2
1g

1
0

30

45

55

Temperatura
A. Carrin

15

12/06/2013

Interaccin
Factores que influyen en el dulzor de un caf:
Cantidad de azcar aadido:
Agitacin del caf:

1g / 8g
Si / No

DULZOR

5
4

8g

3
2
1g

1
0

31

NO

SI

REMOVER
A. Carrin

ANLISIS DE LA VARIANZA CON VARIOS FACTORES


CONTROLADOS (CON INTERACCIN)
El modelo de anlisis de la varianza con dos factores (con interaccin) es:
xim = m + i + j + ()ij + ijk

i=1I, j=1J, k=1K

Siendo:

m = media general
i , j = efecto del nivel i de cada factor
()ij = efecto de la interaccin entre el nivel i del factor 1 y el j del factor 2

ijkm = perturbacin aleatoria


se cumple que

i = 0 i = 0
ijkm = N(0, 2)

()ij =0

Para evaluar el efecto de las interacciones se requiere que haya habido


repeticiones en cada combinacin experimental
32
A. Carrin

16

12/06/2013

ANLISIS DE LA VARIANZA CON DOS FACTORES


(CON INTERACCIN)
Las hiptesis a contrastar para el factor 1 son:
H0: i =0 para todo i
H1: existe algn i 0
Si se rechaza H0 decimos que el factor es significativo o que tiene un
efecto significativo
Para el resto de factores corresponden las hiptesis equivalentes
Para la interaccin, las hiptesis son:
H0: ()ij =0 para todo i, j
H1: existe algn ()ij 0
Si se rechaza H0 decimos que la interaccin es significativa
33
A. Carrin

34
A. Carrin

17

12/06/2013

TABLA ANOVA CON INTERACCIONES (DOS FACTORES)


ORIGEN DE LA
VARIANZA

SUMA DE
CUADRADOS

GRADOS DE
LIBERTAD

CUADRADOS
MEDIOS

RATIO
F

FACTOR 1

SCF1

I-1

CMF1

F1 =

CMF1
CMR

FACTOR 2

SCF2

J-1

CMF2

F2 =

CMF2 P(J
J-1,IJ(n-1) > F2 )
CMR

INTERACCIN

SCI

(I-1)(J-1)

CMI

Fint =

CMI
P(F(I-1)(J-1),IJ(n-1) > Fint )
CMR

RESIDUO

SCR

IJ(n-1)

CMR

TOTAL

SCT

IJn-1

SIG. LEVEL

P(FI-1,IJ(n-1) > F1 )

35
A. Carrin

36
A. Carrin

18

12/06/2013

ANLISIS DE LA VARIANZA CON VARIOS FACTORES


CONTROLADOS (CON INTERACCIN)
Las ideas bsicas son las mismas que en el caso de dos factores,
pero la expresiones se complican.
Aparecen interacciones:
De orden 2, entre cada posible pareja de factores,
De orden 3, entre cada posible tripleta de factores,
De orden 4, .
Habitualmente las interacciones de orden superior son pequeas
frente a las de orden bajo
Con frecuencia se desprecian las de orden mayor o igual a 3
37
A. Carrin

EJEMPLO 1: VALORACIN DE UN ZUMO SEGN LA


TEMPERATURA DE CONSUMO

5
90

10
80

15
75

20
60

78

85

60

70

85

84

70

65

81

79

65

57

87

80

68

59

x i.
38
A. Carrin

19

12/06/2013

EJEMPLO 2
Se esta estudiando la influencia de un catalizador sobre el rendimiento
en gramos de producto de un proceso qumico, del que existen dos
variantes. Se estn probando para ello cuatro dosis de catalizador. Se
consideran dos mtodos de produccin.
Se han hecho tres repeticiones en cada combinacin
DOSIS
MTODO
A

0.75
68
60
62
60
45
66

1
91
75
86
72
71
60

1.25
90
98
94
64
75
70

1.50
105
95
99
48
55
50
39
A. Carrin

EJEMPLO
Anlisis de la Varianza para RDTO - Sumas de Cuadrados de Tipo III
-------------------------------------------------------------------------------Fuente

Suma de cuadrados

GL Cuadrado Medio Cociente-F

P-Valor

-------------------------------------------------------------------------------EFECTOS PRINCIPALES
A:dosis

1535,12

511,708

12,39

0,0002

B:metodo

3432,04

3432,04

83,12

0,0000

1469,13

489,708

11,86

0,0002

660,667

16

41,2917

INTERACCIONES
AB

RESIDUOS

-------------------------------------------------------------------------------TOTAL (CORREGIDO)

7096,96

23

-------------------------------------------------------------------------------Los cocientes F estn basados en el error cuadrtico medio residual.

40
A. Carrin

20

12/06/2013

EJEMPLO

Mejor opcin:
Mtodo 1,
Dosis 3 - 4
Peor opcin:
Mtodo 2,
Dosis 4 41
(1)
A. Carrin

EJEMPLO: VALORACIN DE UN ZUMO SEGN LA


TEMPERATURA DE CONSUMO

5
90

10
80

15
75

20
60

78

85

60

70

85

84

70

65

81

79

65

57

87

80

68

59

Ti.

421

408

336

311

x i.

84.2

81.6

67.6

62.2

Total

1478

42
A. Carrin

21

12/06/2013

EJEMPLO
Fuente

Suma de
Cuadrados

GL

Cuadrado
Medio

Signif.

TEMP
(Entre
grupos)

1709.8

569.993

25.61

0.0000

ERROR
(Intra
grupos)

356.0

16

22.25

Total

2065.8

19

LSD =

2 /2
t n k S x i = 3 . 1622
2

43
A. Carrin

EJEMPLO

44
A. Carrin

22

S-ar putea să vă placă și