Documente Academic
Documente Profesional
Documente Cultură
pasadas
Cuando se hace un histograma, una manera de
calcular la cantidad de clases es con la siguiente
regla:
Regla de Sturges
Regla prctica acerca para calcular el nmero de clases que deben
considerar al hacer un histograma
xi x 3
xi
x
i-sima observacin
promedio
Desviacin estndar
xi M
>5
med ( xi M )
Ejemplo
La distribucin de alturas de mujeres es
aproximadamente normal con
= 1.64m
= 0.06m
Ejemplo
La altura estandarizada de una mujer es
el nmero de desviaciones estndar que
su altura difiere de la media de la altura
de todas las mujeres
Cual es la altura estandarizada de una mujer que
mide 1.72 m?
Clculos a partir de
distribuciones normales
El rea por debajo de la curva de
densidad es una proporcin de
observaciones de la distribucin.
Cualquier pregunta sobre que
proporcin de observaciones se
encuentra en algn intervalo de valores
se puede responder hallando el rea por
debajo de la curva en ese intervalo.
Ejercicio
Que proporcin de todas las mujeres
miden menos de 1.72m?
z=
1.72 1.64
= 1.33
0.06
0.9082
Ejercicio
Hallar la proporcin de observaciones de
la distribucin normal estandarizada que
son mayores a -2.15
Ejercicio
El nivel de colesterol en sangre es importante y se relaciona con
el riesgo de enfermedades coronarias. La distribucin del
nivel de colesterol para una misma edad y sexo es
aproximadamente normal. Para jvenes de 14 aos la media
es 170 miligramos de colesterol por decilitro de sangre
(mg/dl), y la desviacin tpica es 30 mg/dl. Niveles de
colesterol superiores a 240 mg/dl pueden exigir atencin
mdica. Cal es el porcentaje de jvenes que pueden
requerir esa atencin?
Ejercicio
Las notas de una prueba de matemtica tiene una distribucin
N(430,100)
Cual debe ser la nota de un alumno para pertenecer al 10% de
alumnos que tienen mejor nota?
Ejercicio
Valoracin de la normalidad
La decisin de describir una distribucin
mediante una curva normal determina
el anlisis posterior de los datos
TEST DE
KOLMOGOROV-SMIRNOV
Compara la funcin de distribucin acumulada
de los datos con la de una distribucin
normal, midiendo la mxima distancia entre
ambas curvas. Si la mxima distancia entre
las curvas (estadstico unilateral de
Kolmogorov-Smirnov, Dn+) es superior al
valor crtico del test (dn+, ) la distribucin
de la muestra no es normal. El test de
Kolmogorov-Smirnov otorga un peso menor a
las observaciones extremas.
Anlisis de relaciones
La mayora de los trabajos
estadsticos hacen referencia a
ms de una variable. A veces
queremos comparar las
distribuciones de una misma
variable referido a grupos distintos
Anlisis de relaciones
Cuando se examinen la relacin entre 2 o ms variables, es
conveniente realizar los siguientes planteos:
Qu individuos describen los datos?
Cules son las variables y como se miden?
Todas las variables son cuantitativas o existen al
menos alguna variable categrica?
Se pretende explorar la naturaleza de la relacin o se
puede presumir que alguna de las variables explica o
causa los cambios en otra variable?
Variable respuesta:
mide el
Variable explicativa:
intenta
explicar los resultados observados
Diagrama de dispersin
Un diagrama de dispersin muestra la
relacin entre 2 variables cuantitativas
medidas para los mismos individuos
Diagrama de dispersinInterpretacin
Observar el aspecto general e intentar
identificar su direccin, forma y la
fuerza de la relacin entre las 2
variables
Asociacin
positiva
asociacin
y negativa
Correlacin (r)
( xi x ) ( yi y )
1
r=
n 1
( sx )
(sy )
r positiva indica asociacin positiva
r negativo indica asociacin negativa
r toma valores entre -1 y 1. si r=0 la relacin lineal es muy
dbil, pero si es cercano a 1 o -1, los valores se acerca mucho
a una recta.
Como r usa valores estandarizados no varia cuando cambian
las unidades.
La correlacin r no describe relaciones curvilneas aunque
stas sean fuertes.
r se ve fuertemente afectada por observaciones atpicas, por
lo que debe ser usado con precaucin.
Definicin previa
COVARIANZA-
Ejercicio
1
10
15
20
38
30
35
40
45
10
50
11
55
12
55
13
65
14
70
15
90
16
80
17
85
18
90
19
60
Recta de regresin
mnimo-cuadrtica
Diferentes personas dibujaran,
razonablemente, diferentes rectas.
Ninguna recta pasar por todos los puntos,
por lo que se intentar que pase por todos
ellos tan cerca como sea posible.
La recta la utilizaremos para predecir y a
partir de x.
y
y y
predicha
(distancia)
observada
y = a + bx
sy
b=r
sx
a = y bx
y
y y
predicha
(distancia)
observada
predecir
Importante
Incluso una fuerte correlacin no significa
que exista una relacin causa-efecto
entre x e y