Sunteți pe pagina 1din 50

Captulo 16.

Definicin de normalidad
en estadstica y medidas de
descripcin de datos.
Modelo de probabilidad llamado curva
normal o distribucin normal
1 Introduccin a la Distribucin normal
2. Propiedades de la curva normal
2.1.1 Curva normal e interpretacin de la desviacin
estndar
2.1.2 Transformacin de valores X hacia central valores Z
2.1.3 Interpretacin de la desviacin estndar
3. Estadstica paramtrica y estadstica no paramtrica.
Marzo 25 de 2015

1. Introduccin
Para sintetizar una serie de datos numricos se utilizan cifras
representativas que permiten comprender las caractersticas
generales de dichas series.
A las cifras representativas que caracterizan al conjunto de
datos se les conoce como medidas de resumen para datos

cuantitativos.
Para comprender e interpretar de manera adecuada el
promedio )y la desviacin estndar (, se requiere conocer una
de las ms importantes distribuciones de probabilidad
denominado distribucin normal.

Formas que puede tomar un histograma

Uno de los usos del histograma es para identificar el tipo de distribucin que puede tomar una variable.
Se clasifican de la siguiente manera:

Distribucin
Unimodal

Tipos de
distribucin

Distribucin
bimodal

Distribucin
multimodal

Distribucin
normal
Distribucin
asimtrica

Sesgo positivo

Sesgo negativo

Distribucin Bimodal

Distribucin multimodal

2. Distribucin normal
Tambin se le conoce como campana de Gauss. La
caracterstica de este tipo de distribucin es que si la
partimos por la mitad, tendremos dos partes iguales.
Ejemplo:

Distribucin normal
Representa la
forma en que se
distribuyen en la
naturaleza los
valores numricos
de las variables
continuas, como
puede ser la
estatura, el peso, etc.

Distribucin normal
Cuando se calcula la desviacin estndar para una serie de
datos no siempre es evidente el resultado obtenido, y menos
an si no se compara con la desviacin estndar de otra serie
diferente de datos.
Nota:
Retomar un ejemplo y contestar:
En una poblacin de 300 personas, con = 80kg y =5kg
Qu significa su media )y la desviacin estndar (?

=
S=
Interpretar la desviacin estndar y comprender lo que significa en relacin
con los datos cuantitativos que se estn manejando slo es posible a la luz
del conocimiento del modelo de la curva normal.

Propiedades de la curva normal


1. La curva es un polgono de frecuencias en forma de
campana para el que estn calculando sus reas en funcin
de sus diferentes valores del eje horizontal o abscisa.

La distribucin
normal fue
presentada por
primera vez
por
Abraham de Mo
ivre
en un artculo
del ao 1733.

Propiedades de la curva normal


2. En la abscisa se encuentran valores del tipo cuantitativo,
denominado genricamente como valores z, cuyas magnitudes en
teora pueden ir de izquierda a derecha desde - hasta +
(desde menos infinito hasta ms infinito)

+
Abscisas: valores de z

Propiedades de la curva normal


3. El promedio de todos los valores z de la abscisa equivale a cero, pues la mitad
son negativos y la mitad son positivos. En el sitio de la abscisa que corresponde a
cero, es decir al promedio, se encuentra la parte ms alta de la curva. En este
sentido tambin se encuentra la mediana de todos los valores z de la abscisa, pues
50% de ellos est antes del cero y el 50% restante se encuentra despus.
0.3413
0.3413

0.1587

0.15873

-1

+1

Propiedades de la curva normal


4. La curva es simtrica alrededor de la media, hay una mitad izquierda que es reflejo de la mitad
derecha ( imagen de espejo)
5. En la abscisa existen segmentos unitarios de igual longitud y de tamao 1. Los segmentos a la
izquierda de la media tienen signo negativo y a la derecha positivo, tales segmentos denominados
desviaciones estndar, pueden dividirse en fracciones infinitamente pequeas y continuas.
6. La curva es asinttica, sus extremos en teora nunca tocan la abscisa. Por ello, la longitud de
sta podra ser infinitamente larga; sin embargo, se acostumbra graficar slo hasta la distancia de
tres segmentos. A la izquierda y a la derecha de la media.

0.5

0.5

Valores negativos

-3

-2 -1

Valores positivos

+1

+2

+3

Propiedades de la curva normal

7. Toda el rea bajo la curva vale 1. Por lo anterior el rea a la izquierda de la media
vale 0.5, y el rea a la derecha vale 0.5.
8. El rea que se encuentra sobre el segmento de la abscisa que desde la media hasta
el valor de z de +1 vale 0.3413; por tanto por simetra, el rea que se encuentra sobre
el segmento que va desde la media hasta el valor de z de -1 de la abscisa tambin
vale 0.3413.
9. El rea que se
encuentra sobre el
segmento de la abscisa
que va ms all del
0.3413
valor se z de +1 vale
0.1587 y por simetra
el segmento de la
0.1587
abscisa que va ms
all (hacia - ) del
valor se z de -1 de la
abscisa tambin vale
0.1587.

Z=-1

0.6826
0.3413

Z=+1

10. Para cualquier


segmento de la
abscisa, y an para
fracciones del
segmento, se
encuentran calculadas
las reas
0.1587 correspondientes
(reas balo la curva
de la distribucin
normal)

2.1.1 Aprovechamiento de las propiedades


de la curva normal para la interpretacin de
la desviacin estndar

Suponiendo que al graficar el peso de 300 individuos con un


polgono de frecuencias la grfica resultante fuera muy
parecida a la curva normal. Entonces podra decirse que:
El rea bajo la curva de valores de peso que contiene a los
individuos vale 300 de manera semejante a la propiedad
del modelo de la curva normal, de que su rea vale 1.
Ejercicio:
Cuntos individuos existen a la derecha y a la izquierda
de la media?
Cuntas personas existen sobre el segmento que va desde
el valor de x de 80 hasta el valor x de 85.
Cuntas personas tienen peso de 75kg y menos?

Respuestas:
A la izquierda de la media existen:
0.5 de los 300 valores = 150 individuos y a la derecha
existen los otros 150.
Desde el valor de z de cero hasta el valor z de +1, en la
curva de valores x (es decir kg de peso) habr 0.3413 de
300, o sea habr 102 personas sobre el segmento que
desde el valor de x de 80 hasta el valor x de 85.
0.5-0.3413= 0.1587, por tanto 0.1587 de 150= 48 personas
tienen peso de 75kg o menos.

2.1.2 Transformacin de valores X hacia


central valores Z

Ejemplo de aplicacin de las propiedades de la distribucin normal


Se aplic un mismo examen escrito a dos grupos de 90 alumnos cada uno.
En uno se imprimi el examen en hojas de color amarillo y el otro en hojas
de color marrn. Se midi con cronometro el tiempo, en minutos y
fracciones, que tardaron los alumnos en entregar el examen y se calcul la
media y la desviacin estndar, para ambos grupos.
Grupo

Media

Desviacin
estndar

1. Color paja

45

2. Color marrn

45

15

Los alumnos del equipo uno entregaron en tiempos ms homogneos, pues


0.6826 de ellos (61 alumnos), entregaron entre 40 y 50 luego de haber
iniciado. Los ms lentos 0.1587 de ellos (14 alumnos) entregaron el examen
despus de 50.
El grupo 2 entreg en tiempos ms heterogneos, pues 0.6826 de ellos (61
alumnos) lo entregaron entre 30 y 60 despus de haberlo iniciado. Los ms
lentos 0.1587 de ellos, lo entregaron despus de 60.

Comprobar que una serie cuantitativa continua al


ser graficada con un polgono de frecuencia,
muestre un parecido razonable con el perfil de la
curva normal.
Cmo contestar Cuntos alumnos de cada grupo
(con n=90) tardaron 47 o ms en entregar su
examen?
Debemos transformar cualquier valor x en su
correspondiente valor Z y en hacer uso de la tabla
de reas balo la curva de la distribucin normal

Una vez conocido el valor de la media y de la desviacin


estndar, para una serie de datos cuantitativos continuos, el
valor z que, en la abscisa de la curva normal, corresponde a un
determinado valor x de la abscisa de los datos que se estn
manejando, se encuentra con la frmula.
= = = = =0.4 entonces
1. Buscar valores de y en la columna de rea en el mismo
extremo, ms all del valor (c), encontramos el valor de 0.3446
2. Se multiplica la proporcin obtenida por el total del grupo:
(0.3446)(90)=31.014 se redondea valor entero = 31 alumnos
tardaron ms de 47 en entregar su examen.

= = = = =0.13 entonces buscar valores de y en la columna de


rea en el mismo extremo, ms all del valor (c)
(0.4483)(90)=40.347 = 40 alumnos tardaron mas de 47 en
entregar su examen.

2.1.3 Interpretacin de la desviacin estndar

Recordar
La interpretacin est condicionada a la
suposicin de que los valores tienen una
distribucin semejante a la curva normal.

Valor de Z

Proporcin

Z=1

(0.3413 lado derecho+ 0.3413 lado


izquierdo) = 0.6826

Z=2

(0.4772 lado derecho+ 0.4772 lado


izquierdo) = 0.9545

Z=3

(0.4987 lado derecho+ 0.4987 lado


izquierdo) = 0.9974

Z=1.96

0.4750x2= 95

Z= 2.58

0.4951x2= 99

Porcentaje de datos entre dos valores dados


1. Calcular el porcentaje arriba de un valor mayor que la media.
2. Calcular el porcentaje arriba de un valor menor que la media.
3. Calcular el porcentaje abajo de un valor mayor que la media.
4. Calcular el porcentaje abajo de un valor menor que la media.
5. Calcular el porcentaje entre un valor menor que la media y otro mayor que la media.
6. Calcular el porcentaje entre dos valores mayores que la media.
7. Calcular el porcentaje entre dos valores menores que la media.

Ejemplos

Ejemplo 1 de: Calcular el porcentaje arriba de un valor


mayor que la media.
= 65 , S= 11 , N= 500 . Qu porcentaje son
valores mayores que 78?
= = = 1.18, se busca el valor de Z en este punto, en la
columna que dice rea en el mismo extremo, ms all del
valor Z, columna C
Z= 0.1190 por lo tanto 11.90% son valores mayores que 78.
Se aplica esta proporcin en los 500 y obtenemos que 60
valores son mayores a 78 y 422 valores son menores.

Ejemplo 1:

Qu porcentaje son
valores mayores que 78?

N=500
X=65
S=11

rea en el mismo extremo


ms all de valor de Z.
Columna C
Z=1.18=0.1190= 11.9%

0.3810

Z
65

0.1190
78

Comprobacin:
El 0.5 del rea bajo la curva se encuentra a la derecha de la media, si a esta proporcin restamos
0.1190= 0.3810 correspondiente a Z=1.18 en la columna D.

Ejemplo 2 de: Calcular el porcentaje arriba de un valor menor que la


media.
= 65 , S= 11 , N= 500 . Qu porcentaje son valores mayores
que 45?
= = = -1.82, se busca el valor de Z en este punto rea desde el
Extremo opuesto hasta el valor Z, columna B, Z= 0.9656 por lo tanto
96.56% son valores mayores que 45.
Se aplica esta proporcin en los 500 y obtenemos que 483 valores son mayores
a
45 y 17 valores son menores.

Ejemplo 2:

Qu porcentaje son
valores mayores que 45?

rea del extremo opuesto hasta el


valor Z. Columna B
Z= -1.82, Valor en columna B= 96.56%
96. 56%

Z
45

65

Comprobacin:
El Valor de Z = -1.82=46.56% en la columna D, a este porcentaje que se encuentra a la izquierda
de la media le sumamos el 50% de la mitad a la derecha de la media teniendo:
46.56 + 50 = 96.56% mismo valor de Z = 1.82 y columna B.

Ejemplo 3 de: Calcular el porcentaje abajo de un valor mayor que la media.


= 65 , S= 11 , N= 500 . Qu porcentaje son valores menores que
72?
= = = 0.64, se busca el valor de Z en este punto rea desde el
Extremo opuesto hasta el valor Z, columna B, Z= 0.7389 por lo tanto 73.89%
son valores menores que 72.
Se aplica esta proporcin en los 500 y obtenemos que 369 valores son menores a 72 y
131 valores son mayores.

Ejemplo 3:

Qu porcentaje son
valores son menores que
72?

rea desde el extremo opuesto


hasta el valor Z. Columna B
73. 89%

Z
65

72

Comprobacin:
El Valor de Z = 0.64 = 23.89% ms el 50% de la mitad izquierda de la curva, obtenemos el 73.89%,
mismo valor con Z=0.64 y el Valor de la Columna B.

Ejemplo 4 de: Calcular el porcentaje abajo de un valor menor que la media.


= 65 , S= 11 , N= 500 . Qu porcentaje son valores menores
que 50?
= = = -1.36, se busca el valor de Z en este punto rea en el
mismo extremo, ms all del valor Z, columna C, Z= 0.0869 por lo tanto
8.69% son valores menores que 50.
Se aplica esta proporcin en los 500 y obtenemos que 43 valores son menores a
50 y 457 valores son mayores.

Ejemplo 4:

Qu porcentaje son
valores menores que 50?

rea en el mismo extremo


ms all de valor de Z.
Columna C
Z = -1.36 y 8.69% en la
columna C

8. 69%
50

Z
65

Comprobacin:
El Valor de Z = -1.36= 41.31% ste porcentaje se resta del 50% de rea bajo la curva del lado
izquierdo, obtenemos 50% - 41.31% = 8.69% mismo valor de: Z= -1.36 y columna C.

Ejemplo 5 de: Calcular el porcentaje entre un valor menor que la media y otro mayor que
la media.
= 65 , S= 11 , N= 500 . Qu porcentaje son valores comprendidos entre
52 y 81?
= = = -1.18 y = = = 1.45
Se busca los porcentajes de Z que para -1.18 = 38.10 entre el promedio y el valor de Z
columna D y para Z= 1.45= 42.65 por lo tanto sumando ambos porcentajes tenemos
80.75% son valores comprendidos entre 52 y 81.
Se aplica esta proporcin en los 500 y obtenemos que 404 valores se encuentran entre 52y 81.

Ejemplo 5:

Qu porcentaje son
valores entre 52 y 81?

80. 75%

Z1
52

Para x=52; Z= -1.18 y su porcentaje = 38.10%


Para x=81; Z= 1.45 y su porcentaje = 42.65%
La suma de ambos porcentajes = 80.75%

Z2
65

81

Ejemplo 6 de: Calcular el porcentaje entre dos valores mayores que la media.
= 65 , S= 11 , N= 500 . Qu porcentaje son valores comprendidos
entre 70 y 85?
= = = 0.45 y = = = 1.82
Se busca los porcentajes de Z que para 0.45 = 17.36 entre el promedio y el valor de Z
columna D y para Z= 1.82= 46.56. Como el 17.36% es de 65 a 70 y el 46.56% es de
65 a 85, se restan estos porcentajes obteniendo que el 29.20% son valores comprendidos
entre 70 y 85.
Se aplica esta proporcin en los 500 y obtenemos que 146 valores se encuentran entre
70y 85.

Ejemplo 6:

Qu porcentaje son
valores
comprendidos
entre 70 y 85?

29.20%
Z1
65

70

85

Z2
Para x=70; Z= 0.45 y su porcentaje es = 17.36% (entre 65 y 70)
Para x=85; Z= -1.82 y su porcentaje es = 46.56% (entre 65 y 85)
Se resta: Z2 Z1= 46.56 17.32 = 29.20%

Ejemplo 7 de: Calcular el porcentaje entre dos valores menores que la media.
= 65 , S= 11 , N= 500 . Qu porcentaje son valores comprendidos entre 44y
58?
= = = -1.91 y = = = 0.64
Se busca los porcentajes de Z que para -1.91 = 47.19 entre el promedio y el valor de Z columna
D y para Z= 0.64= 23.89. Como el 47.19% es de 65 a 44 y el 23.89% es de 65 a 58, se restan
estos porcentajes obteniendo que el 23.30% son valores comprendidos entre 44 y 58.
Se aplica esta proporcin en los 500 y obtenemos que 116 valores se encuentran entre 44 y 58.

Ejemplo 7:

Qu porcentaje son
valores
comprendidos
entre 44 y 58?

23.30%
Z1
44

58

65

Z2
Para x= 44; Z2= -1.91 y su porcentaje es = 47.19% (entre 65 y 44)
Para x=58; Z1 = 0.64 y su porcentaje es = 23.89% (entre 65 y 58)
Se resta: Z2 Z1= 47.19 23.89 = 23.30% (entre 44 y 58)

Ejercicio No. 1
Peso de 300 personas

= 80kg , S= 5kg
Curva de los pesos con distribucin parecida a la normal, entonces, podra decirse que:
Qu porcentaje son valores comprendidos entre 75y 85?
= = = -1.0 y = = = 1.0
Se busca los porcentajes de Z que para -1.0 = 34.13% entre el promedio y el valor
de Z columna D y para Z= 1.0 = 34.13. Se suman estos porcentajes obteniendo
que el 68.26 % son valores comprendidos entre 75 y 85.
Se aplica esta proporcin en los 300 y obtenemos que (204.78)=205 personas con
peso entre 75 y 80 kg.
En la zona ms all del valor Z habr 0.1587 de las 300 personas; es decir 48 personas con
peso de 85 y ms kg de igual manera que a la izquierda habr 48 personas con peso de 75
kg o menos.

Ejercicio No. 1:

Qu
porcentaje
de
valores son comprendidos
entre 75 y 85?

N=300
X=80 Kg
S=5 Kg

68 . 26%

Z1
75

Z2
80

85

x= 75; Z= -1.0 y su porcentaje es = 34.13% (entre 75 y 80)


x=85; Z = 1.0 y su porcentaje es = 34.13% (entre 80 y 85)
Se suman estos porcentajes y obtenemos = 68.26% (entre 75 y 80)
Aplicamos ste porcentaje al total de 300 personas y obtenemos que, 205 personas
tienen un peso entre 75 Kg. y 85 Kg.

Ejercicio No. 2

= 45 , S= 5 y n= 90. Qu porcentaje son


valores mayores a 47?
= = = 0.4, se busca el valor de Z en este punto rea en el
mismo extremo, ms all del valor Z, columna C, Z=
34.46%
Se aplica esta proporcin en los 90 y obtenemos que /
31.014)=31 estudiantes contestaron su examen en 47 o ms
y 59 estudiantes que tardaron 47 o menos.

Descripcin mediante la curva normal

Ejercicio No. 2:

Qu porcentaje son
valores mayores a 47?

n=90
X=45
S=5

rea en el mismo extremo


ms all del valor Z

34.46%

45
47
x= 47; Z= 0.4 y su porcentaje se busca en la columna C 34.46%
Por lo tanto 34.46% de 90=31 estudiantes contestaron su examen en 47 ms.

Ejercicio No. 3:
Con pesos de 450 estudiantes (varones) pertenecientes a nueve grupos de
tercer grado de secundaria, se calcul:
= 54 kg, S= 4 kg,
1. Cul es el nmero de estudiantes que pesan ms de

50kg?
= = = -1, Z= 0.3416
Se suma 50% de la media al extremo derecho+ 0.3416% (de 54 a 50) =
84.13%
El nmero de estudiantes que pesan ms de 50kg es de aproximadamente
379.

Ejercicio No. 3:

Cul es el nmero de
estudiantes que pesan
ms de 50 Kg.?

Peso en Kg.
n=450 Estudiantes varones
X=54 Kg.
S=4 Kg
96. 56%

50

54
rea desde el extremo opuesto hasta
el valor Z. Columna B

X= 50; Z= -1, su porcentaje en la columna B= 84.13%


Por lo tanto 379 varones pesan ms de 50 Kg.

Ejercicio No. 4:
El nmero de estudiantes que pesan entre 45 y 55
= = = -2.25, Z= 0.4878
= = = 0.25, Z= 0.0987

Se suma 48.78 + 9.87= 58.65%


El nmero de estudiantes que pesan entre 45 y 55 kg es de
aproximadamente 264.

Ejercicio No. 4:

Cul es el nmero de
estudiantes que pesan
entre 45 y 55 Kg.?

58.65%

45

54

55

rea desde el extremo opuesto hasta el valor Z. Columna B


x= 45; Z= -2.25 y su porcentaje es = 48.78% (entre 45 y 54)
x=55; Z = 0.25 y su porcentaje es = 9.87 % (entre 54 y 55)
Se suman los porcentajes y obtenemos = 58.65%
Por lo tanto 264 estudiantes de 450 pesan entre 45 Kg. y 55Kg.

3. Estadstica paramtrica y estadstica no


paramtrica.

Todo procedimiento estadstico que se base en el estudio de la media y la


desviacin estndar para la obtencin de conclusiones forma parte de la
estadstica llamada paramtrica.

La distribucin de datos cuantitativos continuos que tienen una


distribucin semejante a la curva normal pueden ser descritos
perfectamente utilizando slo dos medidas de resumen: la media y la
desviacin estndar, es factible establecer una gran variedad de
conclusiones acerca de la distribucin de la variable que se este
manejando.
La media y la desviacin estndar son los parmetros de la
distribucin normal, son los valores que bastan para caracterizar a una
distribucin de datos cuantitativos continuos.
Todo procedimiento estadstico que no tiene fundamento en el uso de la media y
la desviacin estndar para la obtencin de conclusiones forma parte de la
estadstica no paramtrica. (percentiles, frecuencias o las series completas de
datos sin ningn procedimiento de resumen)