Sunteți pe pagina 1din 60

Estadstica

Definicin

La Estadstica es la Ciencia de la

aSistematizacin, recogida, ordenacin y


tiv presentacin de los datos referentes a un
rip
e sc fenmeno que presenta variabilidad o
D incertidumbre para su estudio metdico, con
objeto de
ad
ilid
ab deducir las leyes que rigen esos fenmenos,
rob
P

c ia
en
fer
In y poder de esa forma hacer previsiones sobre
los mismos, tomar decisiones u obtener
Tema 1: Introducin
conclusiones. 2 Bioestadstica. U. Mlaga.
reas de Aplicacin de la
Estadstica
El uso de la Estadstica es muy amplio. Resulta difcil
nombrar un rea en la cual no se emplee.
Los mtodos estadsticos han encontrado aplicacin en:
Gobierno
Negocios
Ciencias Sociales
Ingeniera
Ciencias Fsica y Naturales
Control de Calidad
Procesos de Manufactura
Muchos otros campos de la actividad intelectual.
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de
los datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de parmetros.

La Estadstica inferencial o inductiva:


Utiliza los resultados de la estadstica
descriptiva y se apoya en el clculo de
probabilidades para la obtencin de
conclusiones sobre una poblacin a partir de los
resultados obtenidos de una muestra.
4
Tipos de Variables
Grficos para v. cualitativas

Diagramas de barras
Alturas proporcionales a las frecuencias (abs.
o rel.)
Se pueden aplicar tambin a variables
discretas

Diagramas de sectores (tartas, polares)


No usarlo con variables ordinales.
El rea de cada sector es proporcional a su
frecuencia (abs. o rel.)

Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser
proporcional a la frecuencia. De los dos, cul
es incorrecto?.

Bioestadstica. U. Mlaga. Tema 1: Introducin 8


Grficos diferenciales para variables numricas
419
400 375

Son diferentes en funcin de que las 300

255

variables sean discretas o continuas.


215
200

Valen con frec. absolutas o relativas. 100


127

Diagramas barras para v. discretas 54


24 23 17

Se deja un hueco entre barras para indicar 0 1 2 3 4 5 6 7 Ocho o ms

Nmero de hijos
los valores que no son posibles

250

Histogramas para v. continuas


El rea que hay bajo el histograma entre 200

dos puntos cualesquiera indica la cantidad 150

(porcentaje o frecuencia) de individuos en 100

el intervalo.
50

Diagrama de cajas 20 40 60 80

Edad del encuestado

Bioestadstica. U. Mlaga. Tema 1: Introducin 9


Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se
realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la
variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual
al mismo. No los construiremos en clase. Se pasan de los diferenciales a los
integrales por integracin y a la inversa por derivacin (en un sentido ms general
del que visteis en bachillerato.)

Bioestadstica. U. Mlaga. Tema 1: Introducin 10


Tabla de Frecuencia
TABLA DE FRECUENCIAS

PARA VARIABLES CUALITATIVAS

Ejemplo: DE UN ESTUDIO DE INVESTIGACION


REALIZADA EN FORMA ALEATORIA A 80 PERSONAS
DE 12 A 20 AOS SE REGISTRARON LOS PROGRAMAS
MAS VISTOS EN LA TV.LOS RESULTADOS FUERON:

PROGRAMAS N DE TELEVIDENTES
variable
NOTICIEROS 17

SERIES 15

18
NOVELAS frecuencias
DIBUJOS 16

CULTURALES 14

TOTAL 80
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
PROGRAMAS Frecuencia Absoluta (fi) Frecuencia Relativa (hi)
(nmero de televidentes)
NOTICIEROS 17 0.2125
SERIES 15 0.1875

NOVELAS 18 0.2250
DIBUJOS 16 0.2000
CULTURALES 14 0.1750
TOTAL n=80 1.0000
(1)La frecuencia absoluta fi, es el nmero de datos observados en
cada categoria o modalidad. La suma de todas las frecuencias
absolutas es igual al total de datos observados (n=80).
(2)La frecuencia relativa hi se define por hi = fi /n
La suma de todas las frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100
(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS
REALIZAR ALGUNAS PREGUNTAS:

1.-CUANTAS PERSONAS PREFIEREN VER LOS


NOTICIEROS? RPTA. 17

2.-CUNTAS PERSONAS NO PREFIEREN VER EL


LOS NOTICIEROS? RPTA. 63

3.-QU PORCENTAJE DE PERSONAS PREFIEREN VER


LAS SERIES? RPTA. 18.75%

4.-CUL ES EL PORCENTAJE DE PERSONAS QUE NO


PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DE
FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS.

DIAGRAMAS DE BARRAS

20
FRECUENCIA ABSOLUTA
15

10

0
NOTICIEROS SERIES NOVELAS DIBUJ OS CULTURALES

PROGRAMAS
DIAGRAMA CIRCULAR O TIPO PASTEL

CULTURAL
NOTICIEROS
18% 21%

DIBUJOS
SERIES
20%
19%
NOVELAS
22%

LOS SECTORES CIRCULARES


QUE COMPRENDEN LA GRAFICA
CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:

hi x 360
TABLA DE FRECUENCIAS SIMPLES

PARA VARIABLES CUANTITATIVAS


DISCRETAS

SE EMPLEAN PARA DATOS CUANTITATIVOS


DISCRETOS(VALORES ENTEROS).

CUANDO SOLAMENTE SE PRESENTAN POCOS


DATOS DISTINTOS.
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20
FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE
TIENEN , Y SE HA OBTENIDO EL SIGUIENTE
RESULTADO:

3 7 7 6 7 4 5 1 4 5
5 9 4 2 4 6 7 4 7 6

CONSTRUYA UNA TABLA DE DISTRIBUCION


DE FRECUENCIAS.
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
NDE TARJAS O CONTEO fi hi
HIJOS (NUMERO DE FAMILIAS)

1 / 1 0.05
2 / 1 0.05
3 / 1 0.05
4 //// 5 0.25
5 /// 3 0.15
6 /// 3 0.15
7 //// 5 0.25
8 0 0.00
9 / 1 0.05
TOTAL n = 20 1.00
GRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
TABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS

LA DISTRIBUCION DE FRECUENCIAS POR


CLASE
O INTERVALOS SE USA CUANDO LA
VARIABLE
ESTADISTICA ES CUANTITATIVA CONTINUA
O
CUANDO EL NUMERO DE VALORES
DISTINTOS
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS
POR INTERVALOS

VARIABLE

[Li , Ls > Xi fi hi Fi Hi

Total k
n f i
i 1

Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior


Xi : Marca de clase Ls : Limite Supeior
fi : frecuencia absoluta
hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada
CARACTERISTICAS

1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA


CANTIDAD DE OBSERVACIONES QUE HAY
EN EL i-ESIMO INTERVALO.

2.- LA FRECUENCIA RELATIVA (hi) INDICA LA


FRACCION DE LAS OBSERVACIONES QUE
ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n

3.- F 1= f 1 H 1 = h1
F 2= f 1+ f 2 H2= h1+ h2
Fk= f1+ f2+...+ fk Hk= h1+ h2+...+ hk
4.- EN TODA TABLA DE DISTRIBUCION DE
FRECUENCIAS POR INTERVALOS:
k k

fi n h
i 1
i 1 Fk n
i 1

5.- LA MARCA DE CLASE ES LA SEMISUMA DE


LOS LIMITES DE CLASE
L L
X i s

2
i

6.- EL ANCHO DE CLASE C REPRESENTA LA


LONGITUD DEL INTERVALO: C = Ls Li
GENERALMENTE ES CONSTANTE.

7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE


ENTONCES LA DISTANCIA ENTRE LAS MARCAS
DE CLASE ES CONSTANTE E IGUAL A C.
PROCEDIMIENTO PARA LA CONSTRUCION DE
TABLAS DE FRECUENCIAS POR INTERVALOS

1) CALCULAR EL RANGO: R = Xmx Xmin


2) HALLAR EL NUMERO DE INTERVALOS K,MEDIANTE
LA FORMULA DE STURGES: K = 1+3.3 Log(n)
DONDE n ES EL NUMERO DE DATOS, Y K SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE)
EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7

3) DETERMINAR EL ANCHO DE CLASE:


C = R /K
DONDE C SE REDONDEA POR EXCESO, DE ACUERDO
AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
El valor de C depender de la cantidad de lugares decimales de los datos
originales, que sern agrupados en la tabla de frecuencias:

Ejemplo de dato Ejemplo de Se


original valor de C redondea
calculado a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA
Se ha aplicado una encuesta a 40 centros educativos con el fin de
observar el nmero de nios que estudian en ellos, obteniendose:

42 58 79 86 98 120 134 120 59 62

85 89 76 110 104 78 84 96 90 75

120 130 122 95 82 94 108 79 105 115

102 80 56 78 84 66 69 78 84 98

construya una tabla de frecuencias adecuada.


PROCEDIMIENTO:

Rango: R= 134 - 42 = 92

Nmero de intervalos: K = 1 + 3.3 log 40


= 6,29
(frmula de Sturges) redondeo
simple a 6

Ancho de clase: C =92 / 6 = 15,33


redondeamos por exceso de
decimales
Nmero de nios (variable) Centros educativos

Intervalos Tarjas Xi fi hi Fi Hi
o conteo
[42-58> 50 2 0.050 2 0.050

[58-74> 66 5 0.125 7 0.175

[74-90> 82 15 0.375 22 0.550

[90-106> 98 9 0.225 31 0.775

[106-122> 114 6 0.150 37 0.925

[122-138> 130 3 0.075 40 1.000

TOTAL n=40 1.000


EJEMPLO 2: SI LA VARIABLE CUANTITATIVA
ES CONTINUA.

En un comercio, se dispone de los datos de la venta semanal


(en miles de soles) para las ltimas 30 semanas.
Construya una tabla de distribucin de frecuencias.

14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5

15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8

13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2
PROCEDIMIENTO:

1. R= Xmax X min = 15,8 12,2 = 3,6

2. Hallar K mediante Sturges:

K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)

3. Determinar el ancho de clase C:

C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un


decimal como los datos)
Venta miles de soles (variable) Nmero de semanas

Intervalos Tarjas Xi fi hi
o conteo Fi Hi
[12,2-12,8> // 12,5 2 0,0667 2 0,0667

[12,8-13,4> ///// 13,1 5 0,1667 7 0,2334

[13,4-14,0> ///// 13,7 5 0,1667 12 0,4000

[14,0-14,6> ////// 14,3 6 0,2000 18 0,6000

[14,6-15,2> /// 14,9 3 0,1000 21 0,7000

[15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000

TOTAL n=30 1.0000


INTERPRETACIONES UTILIZANDO LA TABLA
DE FRECUENCIAS

1.- Cuntas semanas tienen ventas entre 14,0 y 14,6 miles de soles?
Rpta. f4 = 6 semanas.

2.- Cul es la proporcin o el porcentaje del nmero de semanas


cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles?
Rpta. h2 = 0,1667 h2 = 16,67%

3.- Cuntas semanas tienen ventas menores a 14,6 miles de soles?


Rpta. F4 = 18 semanas

4.- Cul es la proporcin o el porcentaje del nmero de semanas


cuyas ventas son menores a 15,2 miles de soles?
Rpta. H5 = 0,70 H5 = 70%
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS

Histograma de Frecuencias Absolutas

7
Frequencia Absoluta

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Histograma de Frecuencias Relativas (% )

30

25
Frequencia Relativa %

20

15

10

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Poligono de Frecuencias Absolutas

7
numero de semanas

0
12.5 13.1 13.7 14.3 14.9 15.5
Ventas
Medidas de Tendencia Central
Medidas de Dispersin
Coeficiente de Variacin
Varianza y Desviacin
estndar para datos
agrupados
Cuartiles, deciles y
percentiles a partir de
tablas con intervalos