Sunteți pe pagina 1din 55

1 2 3 4 5 6

CURSO DE
ESTADSTICA BSICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

ESQUEMA DEL CURSO


ESTADSTICA BSICA

DISEO DE EXPERIMENTOS

ESTADSTICA DESCRIPTIVA INFERENCIA ESTADSTICA

CONTRASTE
ESTIMACIN
DE HIPTESIS

TIPOS DE TABLAS Y POR MTODOS MTODOS NO


PUNTUAL
VARIABLES GRFICAS INTERVALOS PARAMTRICOS PARAMTRICOS

T-STUDENT U-MANN
WHITNEY
MEDIDAS DE
POSICIN CENTRAL ANOVA
K-W
Y DE DISPERSIN
FISHER
TABLAS DE
CONTINGENCIA
PEARSON

Guadalupe Ruiz Merino - Curso de Estadstica Bsica


1 2 3 4 5 6

V
SESIN 5
INFERENCIA ESTADSTICA II

5.1 Tablas de contingencia


5.2 Contraste de hiptesis
5.3 Medidas de asociacin

Guadalupe Ruiz Merino - Curso de Estadstica Bsica


1 2 3 4 5 6

V
EN LA SESIN ANTERIOR VIMOS

Denominamos variables cualitativas a aquellas


cuyo resultado es un valor o categora de entre un
conjunto finito de respuestas

POR El sexo, el estado civil o el grupo sanguneo son


EJEMPLO variables cualitativas

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

Para analizar la relacin de dependencia o


independencia entre dos variables cualitativas es
necesario estudiar su distribucin conjunta o tabla
de contingencia

Tabla de contingencia: Tabla de doble entrada


donde en cada casilla figura el nmero de
individuos que posee esas caractersticas

Guadalupe Ruiz Merino - Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

EJEMPLOS

El sexo y el hbito de fumar


Estudiar la El grupo sanguneo y la posibilidad
de rechazar un trasplante
relacin entre
La prctica de ejercicio y el riesgo de
infarto

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

OBJETIVOS

Las tablas de contingencia tienen dos objetivos fundamentales:


1.- Organizar la informacin, cuando est referida a
factores

2.- Analizar si existe alguna relacin de dependencia


o independencia entre los niveles de las variables
objeto de estudio

El hecho de que dos variables sean independientes significa


que los valores de una de ellas no estn influidos por la otra

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

CMO SE CONSTRUYE UNA TABLA DE CONTINGENCIA?

Una tabla de contingencia se presenta de la siguiente forma

HOMBRE MUJER MARGINAL


SI n11 n12 n1.

NO n21 n22 N2.

MARGINAL n.1 n.2 observacionesnde


nij=n ..

la fila i y la columna j

Frecuencia: Nmero de veces que se presenta un valor dado de una observacin


Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

EJEMPLO

Para contrastar la hiptesis El sexo influye en el hbito de


fumar, podemos construir la siguiente tabla de contingencia

HOMBRE MUJER MARGINAL

SI 65 58 123

NO 43 67 110

MARGINAL 108 125 233

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

TIPOS DE TEST UTILIZADOS

Para identificar relaciones entre variables cualitativas se


utiliza el test estadstico de la Chi-cuadrado

Para las tablas 2x2 se utiliza el test de Fisher

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

TIPOS DE TEST UTILIZADOS

En los ejemplos anteriores

Influye el sexo en
La hiptesis que
el hbito de fumar? plantearemos ser:

Tienen ms posibilidades los H0: independencia


de un cierto grupo sanguneo H1: dependencia
de rechazar un trasplante?

El resultado nos permitir afirmar con un nivel de confianza que


nosotros determinaremos si los niveles de una variable influyen en
los niveles de la otra
Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

RAZONAMIENTO

El razonamiento para contrastar si existe o no asociacin entre dos


variables cualitativas se basa en:

calcular cul seran los valores de frecuencia esperados para cada


una de las celdas en el caso de que efectivamente las variables
fuesen independientes y compararlos con los valores realmente
observados

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?

Si no existe mucha diferencia entre ambos valores

no hay razones para dudar de que las variables sean


independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?

Una vez que hayamos hecho


probabilidad de equivocarnos si
los clculos, obtendremos un
rechazamos la hiptesis nula
nivel de significacin

Si es p<0.05 rechazamos la hiptesis nula y


decimos que las variables son dependientes

Si es p>0.05 no podramos rechazar H0 porque la


probabilidad de equivocarnos sera muy alta

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

PROBLEMAS

La Chi-cuadrado est influenciada por el tamao muestral

Si la muestra es excesivamente
grande ser ms fcil que
A mayor nmero de casos
analizados el valor de la Chi- rechacemos la hiptesis nula de
cuadrado tiende a aumentar independencia cuando a lo mejor
podran ser independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

PROBLEMAS

En cada celda de la tabla deber existir un mnimo de 5


observaciones esperadas

Se agrupan filas o columnas (excepto


tablas 2x2)

Si no fuera as

Se elimina la fila que da la frecuencia <5

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

PROBLEMAS
Para el ejemplo anterior El sexo influye en el hbito de fumar

HOMBRE MUJER MARGINAL

SI 12 32 44

NO 18 10 28

OCASIONALMENTE 3 4 7

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

PROBLEMAS

Y si la tabla es de 2x2?

Se aplica la correccin de Yates

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

PROBLEMAS

La Chi-cuadrado permite contrastar la hiptesis de independencia


pero

en el caso de que se rechace dicha hiptesis no dice nada sobre


la fuerza de la asociacin entre las variables estudiadas

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

Las MEDIDAS DE ASOCIACIN distinguen entre que las variables


sean ordinales o nominales

Las MEDIDAS DE ASOCIACIN NOMINALES slo informan del


grado de asociacin existente pero no de la direccin

Las MEDIDAS DE ASOCIACIN ORDINALES aportan informacin


sobre la direccin de la relacin, pudiendo tomar tanto valores positivos
como negativos

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

Se pueden encontrar los intervalos de confianza para los riesgos


relativos, lo cual alcanza la misma finalidad que la prueba de
significancia, segn contenga el 1 o no

Los intervalos de confianza para riesgos relativos cada vez son ms


utilizados para las publicaciones en revistas mdicas

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

MEDIDAS DE ASOCIACIN ORDINALES

Existe una relacin Valores altos de una


VALORES se corresponden con
POSITIVOS directa entre las
variables valores altos de la
otra y al contrario

Existe una relacin Valores altos de una


VALORES se corresponden con
NEGATIVOS inversa entre las
variables valores bajos de la
otra y al contrario

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

RESIDUOS

CMO SE Diferencia entre la frecuencia observada


CALCULAN? y esperada en cada casilla

PARA QU Son muy tiles para interpretar las


SIRVEN? relaciones que se observan en la tabla

QU Indican que la diferencia entre las


INFORMACIN frecuencias es elevada cuando su valor
DAN? es superior a 1.96 inferior a -1.96

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

RESIDUOS

Un valor del residuo tipificado en una casilla

Hay ms casos (si es positivo) o menos (si es


Mayor a 1.96 en negativo) de los que debera haber en esa
valor absoluto casilla si las variables fueran independientes,
por lo que las variables son dependientes

Comprendido La diferencia es pequea por lo que las


entre 1.96 variables son independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

USO EXCESIVO

Debido a que la prueba Chi-cuadrado es fcil de entender y calcular, en


ocasiones se utiliza cuando es ms apropiado otro mtodo

POR Cuando se analizan dos grupos y las caractersticas de


EJEMPLO inters se miden en escala numrica

LO CORRECTO Aplicar la prueba t-Student

LO INCORRECTO Convertir la escala numrica


en una ordinal o incluso binaria
Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

USO EXCESIVO - EJEMPLO

Se desea conocer los pacientes de una intervencin que tienen


mayor probabilidad de padecer complicaciones que otros

Los investigadores queran saber si existe relacin entre


la edad y la probabilidad de tener complicaciones

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

USO EXCESIVO - EJEMPLO

MTODO DE TRABAJO:

1 Se recogen datos de pacientes que sufrieron complicaciones y

MAL!
de otros pacientes que no las sufrieron

2 Los investigadores formaron una tabla de contingencia 2x2 y


agruparon la edad en 45 o >45

Emplearon la prueba de chi-cuadrado para la independencia y


3 los resultados indicaron que no haba relacin entre la edad
y la presencia de complicaciones

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

USO EXCESIVO - EJEMPLO

DNDE EST EL ERROR?

En la seleccin arbitraria de los 45 aos


como punto de corte para la edad

Y en usar una prueba de forma incorrecta

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

USO EXCESIVO

Cuando las variables numricas se analizan con mtodos diseados


para variables categricas u ordinales, se pierde la mayor especificidad
de las mediciones numricas

Antes de hacerlo hay que investigar si las categoras son correctas

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

McNEMAR

Una variante de las tablas longitudinales es medir una misma variable


dicotmica (tratamiento-no tratamiento, rechazo-no rechazo) en dos
momentos temporales distintos

CONSEJO Resulta especialmente til para medir el cambio

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

V
5.1 TABLAS DE 5.2 CONTRASTE 5.3 MEDIDAS DE
CONTINGENCIA DE HIPTESIS ASOCIACIN

McNEMAR

CMO SE TRABAJA?

Se toma una medida de una variable dicotmica, se aplica el


tratamiento (o se deja pasar el tiempo) y se vuelve a tomar
una medida de la misma variable en los mismos sujetos

Se contrasta la hiptesis de igualdad de proporciones antes


y despus

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
SESIN 6
REGRESIN

6.1
6.1 Correlacin
6.2 Regresin Lineal Simple

Guadalupe Ruiz Merino - Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

DEFINICIN DE CORRELACIN

Se considera que dos variables cuantitativas


estn relacionadas entre s cuando los
valores de una de ellas varan de forma
sistemtica conforme a los valores de la otra.

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON

El coeficiente de correlacin de Pearson es


un ndice estadstico que permite definir de
forma ms concisa la relacin entre las variables
Es una medida de la relacin lineal entre dos
variables medidas con escala numrica

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON

Su resultado es un valor que flucta entre -1 y +1

+1 Relacin perfecta en sentido positivo

Cuanto ms cercanos a 0 sean los valores


0 significar una relacin ms dbil o incluso
ausencia de relacin

-1 Relacin perfecta en sentido negativo


Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

El valor del coeficiente de correlacin est


muy influenciado por los valores extremos,
igual que la desviacin estndar.

Por tanto la correlacin no describe bien la


relacin entre dos variables cuando cada
una de ellas tiene valores extremos

En estos casos debe hacerse una transformacin


de los datos o usarse la correlacin de Spearman

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

Finalmente, correlacin no es igual a causa

Correlacin = Causa

El juicio de que una caracterstica causa otra debe justificarse


con argumentos, no slo con el coeficiente de correlacin

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON

Segn su valor la relacin entre las variables ser:

1 Perfecta
Excelente
0,9
Buena
0,8

Regular

0,5
Mala
Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN

Un DIAGRAMA DE DISPERSIN ofrece una idea bastante


aproximada sobre el tipo de relacin existente entre dos variables

Un DIAGRAMA DE DISPERSIN tambin puede utilizarse como


una forma de cuantificar el grado de relacin lineal existente entre
dos variables

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN

El DIAGRAMA DE DISPERSIN permite formarse una primera


impresin sobre el tipo de relacin existente entre variables

Intentar cuantificar esa relacin tiene inconvenientes porque la


relacin entre dos variables no siempre es perfecta o nula

Normalmente ni lo uno ni lo otro

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

MODELOS DE REGRESIN

Una vez que sabemos que dos variables estn


relacionadas

Cmo averiguar qu tipo de relacin tienen?

Para esto utilizamos los modelos de regresin

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

CONCEPTO DE REGRESIN

La regresin como tcnica estadstica analiza


QU ES?
la relacin de dos o ms variables contnuas

La regresin se utiliza para inferir datos


PARA QU
a partir de otros y hallar una respuesta a lo
SIRVE?
que pueda suceder

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

DIFERENCIA ENTRE CORRELACIN Y REGRESIN:

La correlacin es independiente de la escala pero


no la regresin

La correlacin entre estatura y peso es la misma


EJEMPLO sin importar que la estatura se mida en metros o
centmetros

La ecuacin de regresin entre el peso y la


SIN EMBARGO
estatura depende de las unidades que utilicemos

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

SIMILITUDES ENTRE CORRELACIN Y REGRESIN:

La pendiente de la lnea de regresin tiene el


mismo signo que el coeficiente de correlacin

OJO!
La correlacin y la regresin slo describen relaciones lineales.
Si los coeficientes de correlacin y las ecuaciones de regresin
se calculan a ciegas, sin examinar las grficas, los
investigadores pasarn por alto relaciones muy estrechas pero
no lineales

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

VARIABLES DE LA REGRESIN
Las variables del modelo de regresin deben ser cuantitativas

Dada la robustez de la regresin es frecuente encontrar incluidas


como variable independiente variables nominales transformadas

La variable dependiente debe ser siempre cuantitativa

Robustez: un estadstico se dice que es


robusto cuando es vlido aunque no se
cumpla alguno de sus supuestos

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

TIPOS DE REGRESIN

Se pueden encontrar distintos tipos de regresin

1 Regresin Lineal

2 Regresin Mltiple

3 Regresin Logstica

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

Consideremos una variable aleatoria respuesta Y, relacionada


con otra variable que llamaremos explicativa X

Supongamos una muestra de n individuos para los que se


conocen los valores de ambas variables

Y Variable aleatoria
Hacemos una representacin
grfica:
X Variable explicativa
en el eje X la variable explicativa
en el Y la respuesta Muestra
n

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

OBJETIVO Encontrar una recta que se ajuste a la nube de puntos

A partir de esa recta podemos usar los valores de X para predecir


los de Y

Normalmente se utiliza el mtodo de los mnimos cuadrados que


minimiza la distancia de las observaciones a la recta

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

REPRESENTACIN GRFICA
Una recta tiene una ecuacin muy simple:

Y=a+bX
b
Habra que calcular los
coeficientes a,b.

b es la pendiente de la recta

a es el punto en que la recta corta el eje vertical


Guadalupe Ruiz Merino Curso de Estadstica Bsica
1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

Conociendo los valores de estos dos coeficientes podramos


reproducir la recta y describir con ella la relacin entre las variables

Adems de representar la recta con su frmula tambin es til


disponer de alguna informacin sobre el grado en que la recta se
ajusta a la nube de puntos

Guadalupe Ruiz Merino Curso de Estadstica Bsica


1 2 3 4 5 6

VI
6.1 CORRELACIN 6.2 REGRESIN LINEAL SIMPLE

BONDAD DEL AJUSTE

Una medida de ajuste muy


Cuadrado del coeficiente de
aceptada es el coeficiente
correlacin lineal
de determinacin R2

Se trata de una medida estandarizada que toma valores entre 0 y 1

La recta explica un 86% de la variabilidad de


R2=0.86
Y en funcin de X

Guadalupe Ruiz Merino Curso de Estadstica Bsica

S-ar putea să vă placă și