Sunteți pe pagina 1din 132

Tema N 01: ESTADISTICA DESCRIPTIVA I

2009 - II Ing. Jos Manuel Garca


Pantigozo
1

calidadtotal@hotmail.com
Tema N 01: ESTADISTICA DESCRIPTIVA I
2009 - Ing. Jos Manuel Garca
II Pantigozo 2
Objetivos de Aprendizaje
Saber que significa la estadstica y sus aplicaciones.
Explicar el significado de la estadstica descriptiva y
estadstica inferencial.
Distinguir entre niveles de medicin nominal, ordinal,
de intervalo y de razn.
Organizar datos en una distribucin de frecuencias.
Representar la distribucin de frecuencias en un
histograma, un polgono de frecuencias.
Desarrollar una representacin de tallo y hoja
Representar datos utilizando lneas, de barras y de
sectores (circulares).
3
Qu es la estadstica?
Que deberan saber al terminar esta clase:
Que queremos significar por estadstica
Que entendemos por estadstica descriptiva e inferencial.
Que es una poblacin y que una muestra.
Que es una variable, el dato y los datos
Cuando la informacin se refiere a un parmetro y
cuando a una estadstica
Distinguir cuando una variable es cualitativa y cuando
cuantitativa.
Distinguir entre una variable discreta y continua.
Distinguir las distintas escalas de medicin nominal,
ordinal, de intervalo y de razn 5
Qu es la estadstica?

Estadstica es la ciencia de:


Recolectar
Describir
Datos
Organizar
Interpretar
para transformarlos en informacin,
para la toma mas eficiente de
decisiones.

6
Ciencia que proporciona
las herramientas
(mtodos y
procedimientos)
necesarios para 7
Para qu sirve la estadstica?
La Ciencia se ocupa en general de fenmenos
observables.
La Ciencia se desarrolla observando hechos,
formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes.
Los modelos que crea la ciencia son de tipo
determinista o aleatorio (estocstico).
La Estadstica se utiliza como tecnologa al
servicio de las ciencias donde la variabilidad y la
incertidumbre forman parte de su naturaleza.

8
Quienes usan la estadstica?
Organismos oficiales.
Diarios y revistas.
Polticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Investigadores cientficos.
Mdicos
etc.

9
ESTADISTICA

ESTADISTICA ESTADISTICA
DESCRIPTIVA INFERENCIAL
Describe un conjunto de Obtiene informacin
datos con indicadores (variables e indicadores)
estadsticos o de una muestra
estadgrafos representativa
de poblacin

10
Tipos de Estadstica
ESTADSTICA DESCRIPTIVA: Mtodo de recolectar,
organizar, resumir, analizar e interpretar los datos.
Ejemplo 1: Los datos del Censo de poblacin de
2001.
Ejemplo 2: La cantidad de robos ocurridos el
ltimo mes en en el municipio.
Ejemplo 3: La cantidad de pacientes atendidos en
el Hospital municipal el ltimo ao.
Mencionamos algunos procedimientos:
Tablas de distribuciones de frecuencia; Grficos de
distribucin de frecuencias; Diagramas de cajas;
Diagramas de tallos y hojas; Estadsticos de
posicin; Estadsticos de dispersin; y Estadsticos
de asociacin
11
12
Tipos de Estadstica
ESTADSTICA INFERENCIAL:
INFERENCIAL Mtodos usados para
determinar algo acerca de la poblacin, basado en
una muestra.
Poblacin(1) es la coleccin, o conjunto, de individuos,
objetos o eventos cuyas propiedades sern
analizadas.
Muestra es un subconjunto de la poblacin de inters.
(1) Algunos autores utilizan Universo como sinnimo
La estadstica inferencial comprende dos reas
importantes: Estimacin puntual y por intervalos; y la
Prueba de hiptesis estadstica
13
Inferencia Estadstica

POBLACION
Tcnica
Del
Muestreo
MUESTRA
Obtencin de Variables
e Indicadores:
Estadgrafos
(Estimadores) 14
Conceptos
Estadsticos

15
Conceptos Estadsticos
Unidad de Anlisis: es el objeto del cual se desea
obtener informacin. Muchas veces nos referimos a las
unidades de anlisis con el nombre de elementos. En
estadstica, un elemento o unidad de anlisis puede
ser algo con existencia real, como un automvil o una
casa, o algo ms abstracto como la temperatura o un
intervalo de tiempo. Dada esta definicin, puede
redefinirse poblacin como el conjunto de unidades de
anlisis.
Ejemplo: Cada uno de los alumnos matriculados en el
curso de Qumica General. 16
Conceptos Estadsticos
Parmetro: Valor numrico que resume todos los
datos de una poblacin completa. Se utilizan letras
griegas para simbolizar un parmetro como ser y
Ejemplos: La calificacin promedio del egresado
secundario cuando postula al Proceso de Admisin .

Estadstica: Valor numrico que resume los datos de


una muestra. Se utilizan letras del alfabeto espaol
para simbolizarlas como ser x y s .
Ejemplo: La edad promedio registrada en una
encuesta de 150 consumidores de pizzas.
17
Poblacin y Muestra
Poblacin

Muestra

18
Conceptos Estadsticos
Poblacin: Es el conjunto de todos los individuos o
elementos (unidad de anlisis) que son el objetivo de
nuestro inters. La Poblacin, segn su nmero de
elementos puede ser:

Poblacin Finita Poblacin Infinita


Ejemplo: Ejemplo:
- Alumnos de la UNMSM. - Peces del mar peruano
- Trabajadores de una empresa. - Bacterias
- Camiones de carga pesada. - Flores Silvestres.
- Clientes de un empresa comercial.
comercial - Productos fallados.
NOTA: EN LA PRCTICA CUANDO UNA POBLACIN TIENE UN NUMERO MUY
GRANDE O INDETERMINADO DE ELEMENTOS SE LE CONSIDERA POBLACIN
INFINITA. 19
Conceptos Estadsticos
Muestra: Es una parte o un subconjunto de una
poblacin. Tiene la caracterstica fundamental de ser
representativa de la poblacin.
La seleccin y estudio de una muestra facilita la
inferencia de conclusiones vlidas para la poblacin
de donde se obtuvo la muestra.
Ejemplos:
Grupo de bolsas de azcar que se extraen
sistemticamente de una lnea de envasado.
Grupo de tasas que se extrae para llevar a cabo el
control de calidad.
20
Tipos de Estadstica
(ejemplos de estadstica inferencial)

Ejemplo 1: Una encuesta desarrollada por IBOPE, en


marzo 2009, dice que el rating de radio en la Gran
Lima esta encabezado por RPP con un 10.5%
seguido por RCN con 9.18%
Ejemplo 2: De acuerdo con una encuesta desarrollada
por Apoyo sobre telefona residencial en el 2008, el
gasto mensual promedio por cliente es de S/. 90.30. a
nivel nacional.
Ejemplo 3: El INEI inform que la Encuesta
Permanente de Hogares (EPH) del mes de marzo de
2009 reporto la tasa mas alta de desempleo que
ascendi al 10.3% a nivel nacional 21
22
VARIABLES Y SUS TIPOS

La def
Caract inicin
erstica de una
unidad s depe Poblac
es e ndern in y
observ lement (Variab sus
adas ales les) de
del pro y depe que sus
blema ndiend deben
plantea o de la ser
do natural
eza

23
Variable
Variable: Caracterstica de inters sobre cada
elemento individual de una poblacin o muestra.
Dato: Valor de la variable asociada a un elemento
de la poblacin o muestra. Este valor puede ser un
nmero, una palabra o un smbolo.
Ejemplo:
Ejemplo La familia Gonzlez tiene 4 miembros,
sus ingresos mensuales son de US$ 685.00, 2
son de sexo femenino y 2 masculino.

24
Variable (cont.)
Datos: Conjunto de valores recolectados para la
variable de cada uno de los elementos que
pertenecen a la poblacin o muestra.
Ejemplo1: El conjunto de 54 cantidad de
miembros recolectados de 54 familias residentes
en Escobar.
Ejemplo2: El conjunto de las calificaciones de los
43 estudiantes de estadstica de la carrera de
Sistemas

25
Tipos de Variables
Cualitativa o de Atributos Clasifica o describe
un elemento de la poblacin. Los valores que
puede asumir no constituyen un espacio
mtrico, por lo tanto las operaciones
aritmticas, como sumar y obtener
promedios, no son significativas.
Ejemplos: Sexo, Nacionalidad, Marcas de
auto, Grado de Satisfaccin con la
Universidad, etc.

26
Tipos de Variables(cont.)
Dicotmicas:
Dicotmicas Slo hay dos categora, que son
excluyentes una de la otra.
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre.
Nominal:
Nominal tiene mas de dos categoras y no hay orden
entre ellas.
Ejemplo: color de los ojos, grupo sanguneo.
Ordinal: tiene varias categoras y hay orden entre
ellas.
Ejemplo: grado tumoral, calificacin del riesgo en
anestesia. 27
Tipos de Variables (cont.)
Cuantitativa o Numrica cuantifica un elemento de
la poblacin. Los valores que puede asumir
constituyen un espacio mtrico, por lo tanto las
operaciones aritmticas, como sumar y obtener
promedios, son significativas.
Ejemplos: Cantidad de Habitaciones, Nmero de
hijos, Kilmetros recorridos, Tiempo de vuelo,
Ingreso, etc.

28
1-9

Tipos de Variables (cont.)


Las variables cuantitativas se pueden clasificar a
su vez en discretas o continuas.
Cuantitativas Discretas: solo pueden asumir
ciertos valores y normalmente hay huecos entre
ellos. Son conteos normalmente.
Ejemplo1: cantidad de materias aprobadas.(1,
2,3 ......)
Ejemplo2: cantidad de hijos (1, 2, 3,4...)

29
1-9

Tipos de Variables (cont.)


Las variables cuantitativas se pueden clasificar a
su vez en discretas o continuas.
Cuantitativas Continuas: puede asumir cualquier
valor dentro del rango de medicin. Normalmente
se miden magnitudes como ser longitud, superficie,
volumen, peso, tiempo, dinero
Ejemplo 1: Peso al nacer.
Ejemplo 2: Salario de un empleado
Ejemplo 3: Tiempo de viaje en mnibus entre Lima
e Ica.
30
Tcnicas de recoleccin de datos
CENSO =>Estadstica Descriptiva

Se emplea cuando el nmero de unidades de anlisis


no es grande (n< 40 aproximadamente)
Si el nmero de unidades de anlisis es grande y se
necesita una amplia cobertura de informacin en
reas menores, como distritos, Comunidades nativas,
y otros.
Caractersticas
Costoso
Errores de Medicin (de obtener la informacin).
31
Tcnicas de recoleccin de datos
MUESTREO => Estadstica Inferencial

Se emplea cuando el nmero de unidades de anlisis


es grande pero no se necesita informacin a detalle de
reas geogrficas menores.
Caractersticas
Mayor rapidez y viabilidad
Mayor exactitud en la obtencin de informacin
Reduce los costos
No tiene cobertura en reas menores.
32
33
NIVELES DE MEDICIN DE LAS VARIABLES
DE ACUERDO A SU NATURALEZA PUEDEN
ENCONTRARSE ENTRE ESTAS ESCALAS

Escala de medidas
NOMINAL

ORDINAL

INTERVALAR

DE RAZON 34
Niveles de medicin de las variables
Tipos Caracterstica Ejemplos
Valores que se agrupan en Genero (sexo)
categoras disjuntas y Color de pelo
NOMINAL exhaustivas Religin

Hay un orden entre las Clase social


categoras Preferencias
ORDINAL
Educacin
Hay orden Temperatura
DE INTERVALO Hay distancia Coeficiente Intelectual
Hay un cero convencional
Hay orden Edad
DE RAZON Hay distancia Produccin
Hay un cero natural Ingresos
35
Escalas de Medicin
Las variables cualitativas se miden en escala
nominal o ordinal.
Nominal: los elementos solo pueden ser clasificados
en categoras pero no se da un orden o jerarqua
Ejemplo 1: Barrio de residencia de los alumnos .

Ejemplo 2: Color de ojos

Ejemplo 3: Simpatizante de un club de futbol


36
Nivel Nominal
Los v
alores d
clasifica e las Va
r exhau riables
excluye stivame (datos)
ntes y n nte en slo se
o se pu categor pueden
Exhau e. den or a s mutua
stivo: C d e nar. mente
clasifica ada pe
rse en a rsona u
l menos objeto
Mutua una cat o artcu
mente egora. lo debe
artculo Excluye
) al s nte; U
excluirs e r inclu n i n d iv
e de las id o e n iduo (o
otro niv dems, una ca bjeto o
el o sea n tegora
o debe
ser incl debe
uido en

37
1-12

Escalas de Medicin
Las variables cualitativas se miden en escala
nominal o ordinal.
Ordinal: los elementos son clasificados en
categoras que tienen un orden o jerarqua, la
diferencia entre valores no se pueden realizar
o no son significativas.
Ejemplo 1: Grado de satisfaccin en el uso de un
servicio pblico .
Ejemplo 2: Ocupacin

38
Nivel Ordinal
Los valores de las Variables (datos) se pueden
ordenar pero no es posible determinar la
diferencia aritmtica (o distancias) entre ellos.
.
Ejemplo: Resultados del sabor de tres bebidas A,
B, C
X = Sabor.
La bebida C clasifico 1 ( o 1)
La bebida B clasifico 2 ( o 2)
La bebida A clasifico 3 ( o 3)
Valores de x : 1, 2, 3 o (1) (2) (3) 39
Escalas de Medicin
Las variables cuantitativas se miden en
escala de intervalo o razn.
Intervalo: los elementos son clasificados
en categoras que tienen un orden o
jerarqua, la diferencia entre valores se
pueden realizar y son significativas. La
diferencia entre dos valores
consecutivos es de tamao constante y
no existe el 0 absoluto.
Ejemplo: Temperatura en grados Celsius 40
Nivel Intervalar
Similar al nivel ordinal con la
propiedad adicional de que se
pueden determinar . cantidades
significativas
(distancias iguales) de las
diferencias entre los valores. No
existe un punto cero natural sino
Convencional.
Temperatura en escala Grados
Celsius.
Talla de camisas ( zapatos, ternos 41
Escalas de Medicin
Las variables cuantitativas se miden en escala
de intervalo o razn.
Razn: los elementos son clasificados en
categoras que tienen un orden o jerarqua, la
diferencia entre valores se pueden realizar y
son significativas. Existe el 0 absoluto, es decir
la ausencia de la variable medida.
Ejemplo 1: Tiempo de vuelo.
Ejemplo 2: Ingresos familiares

42
Nivel Razn
Es aquella con un punto cero
inicialmente inherente. Las
diferencias y razones (cocientes)
son significativas. .
Ejemplo:
a) Produccin
b) Ingresos Mensuales Dinero.
c) Altura de los jugadores del
equipo de ftbol de Osorno
43
Clasificacin de Variables
Variable Cuantitativa Variable Cualitativa
(Numrica) (No numrica )

Continua Discreta Ordinal Nominal


Se caracteriza por
Puede tomar Toma slo Tienen un No tienen
cualquier valor ciertos orden un orden
en un intervalo valores. predeter- predeter-
dado. (Procesos (procesos de minado: minado:
de medicin) contar)
-Nivel de Sexo,
Ejemplos
Educacin, estrato ocupacin,
N de trabajadores socioeconmico, Condicin de
Ingreso, talla, por oficina, categora de de empleo
n de alumnos ocupacin. (nombrado o
peso etc.
por curso etc. contratado)
44
45
FUENTES PRIMARIA DE DATOS DE
DATOS ESTADSTICOS
No todos los temas disponen de datos publicados. En
esos casos , la informacin deber recolectarse y
analizarse. Esto se llama .Fuente Primaria.
Primaria
Una forma de recolectar datos es mediante las
encuestas.
Hay dos posibilidades:
a) Encuestas Muestrales ( En Muestras)
b) Encuestas Censales (En poblaciones)
46
FUENTES SECUNDARIA DE DATOS
ESTADSTICOS
Los problemas que se estudian o se
investigan se adquieren de datos
empricos ( de la realidad) publicados u
obtenidos.
Se pueden encontrar datos
(estadsticas) relacionadas en artculos
publicados, tesis, revistas y peridicos.
Estos se llaman Fuentes secundarias
Fuentes Secundarias MUESTREOS

47
48
Ejemplo
Ttulo y Subttulo

mill US$ 420


Ao Ventas
1 1997 120 350

2 1998 145 280


3 1999 165
4 2000 178 210

5 2001 201 140


6 2002 320
70
7 2003 350
8 2004 355 0
1996 1998 2000 2002 2004 2006

N valores del 0.60 x 8 Fuente: ..


eje vertical = = 4.8 = 5

Primer valor del 355 = 71 = 70


eje vertical = 5 49
Construc-
cin de
Grficos

50
Otros Grficos: Especializados Mercado Burstil
Grafico de Velas (01/03 -28/03)

Cierre
mximo
Cotizaciones Cotizaciones a mnimo 51

en alza la baja apertura


PERU : DISTRIBUCION DE LA POBLACION SEGUN NIVEL DE EDUCACION POR SEXO
(Porcentaje - Cifras Estimadas 1999)

Nivel de Educacin HOMBRE MUJER TOTAL


Sin Nivel 13.69 18.67 16.16
Inicial y Primaria
Inicial 37.18 38.82 37.99
Secundaria 34.44 30.21 32.34
Sup. No Univer. 6.07 6.50 6.28
Sup. Univer. 8.44 5.68 7.07
Especial 0.19 0.12 0.15
TOTAL 100.00 100.00 100.00
Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998

Nivel de Educacin HOMBRE MUJER TOTAL


Sin Nivel 42.72 57.28 100.00
Inicial y Primaria
Inicial 49.34 50.66 100.00
Secundaria 53.69 46.31 100.00
Sup. No Univer. 48.71 51.29 100.00
Sup. Univer. 60.17 39.83 100.00
Especial 60.81 39.19 100.00
TOTAL 50.42 49.58 100.00
Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998
52
1. Grficos Lineales :
Bolsa de Valores de Lima: Cotizaciones Diarias de los ADRs Telefnica de Espaa:
1/10/01 - 23/01/02
44.00
US$

42.00

40.00

38.00

36.00

34.00

32.00

30.00

Fuente : Bolsa de Valores de Lima


53

Fuente : Bolsa de Valores de Lima.


1.a Grficos Lineales Compuestos :
Bolsa de Valores de Lima: Montos Negociados segn Operacin
Julio 1988 - Junio 1998 ( miles US$)
3000

2500 Renta Fija


Aciones
2000

1500

1000

500

54

Fuente : Bolsa de Valores de Lima.


2. Grficos de Barras Simple
PERU: POBLACIN SEGN NIVEL DE EDUCACIN : 1998
(Cifras Porcentuales)

%
40.00

35.00

30.00

25.00

20.00

15.00

10.00

5.00

-
Sin Nivel Inicial Secundaria Sup. No Sup. Especial
Univer. Univer.

55
Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998
2a. Grficos de Barras Compuesto
PERU: POBLACIN SEGN NIVEL DE EDUCACIN POR SEXO : 1998
(Porcentajes)
%
45.00

40.00

35.00

30.00

25.00
HOMBRE
20.00
MUJER
15.00

10.00

5.00

0.00
Sin Nivel Inicial Secundaria Sup. No Sup. Univer. Especial
Univer.

Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998 56


2a. Grficos de Barras Compuesto
PERU: POBLACIN SEGN NIVEL DE EDUCACIN POR SEXO : 1998
(Porcentajes)
%
120.00

100.00

80.00
MUJER
60.00
HOMBRE
40.00

20.00

Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998 57


GRAFICO DE BARRAS HORIZONTALES

58
3. Grfico Circular

PERU: POBLACIN SEGN DOMINIOS DE ESTUDIO : 1997


(Porcentajes - Cifras Estimadas)

29%
35%

36%

Lima Metrpolitana
Resto Urbano
Rural

59
Fuente : Instituto Nacional de Estadstica e Informtica - ENAHO 1998
3. Grfico Circular
VOLUMEN NEGOCIADO EN LA BOLSA DE VALORES DE
LIMA: DIC. 1999 (miles US$)

INSTRUMENTOS
DE DEUDA
39%

OPERACIONES
DE REPORTE
14%

RENTA VARIABLE
47%

Fuente: Bolsa de Valores de Lima


60
4. Pictograma

Grfico N 3
Per: Volumen de Ventas de Cerveza Pilsen y Cristral: 1990-95
(miles de US$)

10 Miles de
9 dlares US$
8
7
6
5
4
3
2
1
0
1990 1995
61
4. Pictograma
Grfico N 4
Per: Deforestacin de la Selva Amaznica : 1914-2028
(millones de arboles)

62
Espaa: Pirmide Poblacional - 1981

Fuente: Boletn Demogrfico 1981


63
Per: Pirmide Poblacional 2005
(Cifras Porcentuales)

64
65
Grfico:
Mapa
Estadstico

66
Per: Densidad: Poblacional
(Habitantes/ Km2

MAPA
ESTADISTICO

67
Fuente: Censo Poblacional 1993
Grfico: Pictograma
Mujeres en el Mundo: 1990-95

68
Fuente: Roberto Avila Acosta - Estadstica Elememtal
DISTRIBUCI
ON DE
FRECUENCIA
S
1-9

MUESTRA
Se denomina muestra al subconjunto de ese
universo y del cual se recopilarn los datos.
Ejemplo, se quiere saber el nmero de hijos por
matrimonio en Lima. Para este propsito, se elige
una muestra representativa de 50 matrimonios de
ella. Se obtienen los siguientes datos:
2,2,4,1,3,5,3,2,1,6,3,4,1,2,0,2,3,
1 , 7 , 4 , 2, , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 ,
4,0,3,3,2,6,1,5,4,2,0,3,2,4,3,1.
El nmero total de datos se representa con la letra
n. En nuestro ejemplo n = 50.
71
FRECUENCIA ABSOLUTA ( fi )
TABLA

La frecuencia absoluta es el xi fi
nmero de veces que 0 4
aparece un valor (x i) en 1 9
los datos obtenidos. 2 12
En nuestro ejemplo, la 3 10
frecuencia absoluta indica
4 8
el nmero de familias que
5 4
tienen esa cantidad de
hijos: 6 2
7 1
72
FRECUENCIA ABSOLUTA ( fi )
GRAFICOS

73
FRECUENCIA ABSOLUTA ( fi )
GRAFICOS

74
1-9 FRECUENCIA ABSOLUTA ( f )
i

GRAFICOS

75
1-9

FRECUENCIA ABSOLUTA
ACUMULADA ( Fi )
La frecuencia absoluta acumulada indica
cuantos elementos de la lista de datos son
menores o iguales a un valor dado. Es la
suma de las frecuencias absolutas desde la
primera fila hasta la fila elegida.
Por ejemplo, sabemos que hay 25
matrimonios de la muestra que tienen a lo
ms 2 hijos:

76
FRECUENCIA ABSOLUTA
ACUMULADA ( Fi )
TABLA
xi fi Fi
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
7 1 50
77
FRECUENCIA ABSOLUTA
ACUMULADA ( Fi )
GRAFICA

78
FRECUENCIA ABSOLUTA
ACUMULADA ( Fi )
GRAFICA

79
1-9

FRECUENCIA RELATIVA ( hi )
La frecuencia relativa es el cuociente entre la
frecuencia absoluta (f i) y el nmero total
de datos (n). En nuestro ejemplo n = 50:
TABLA
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
80

6 2 49 0,04 0,98
1-9

FRECUENCIA RELATIVA ( hi )
GRAFICA

81
FRECUENCIA RELATIVA ( hi )
GRAFICA

82
FRECUENCIA RELATIVA
ACUMULADA (Hi)
La frecuenciaTABLA:relativa acumulada es el cuociente
entre la frecuencia absoluta acumulada (F i) y el
nmero total de datos (n). En nuestro ejemplo, n
= 50:
TABLA
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98 83
FRECUENCIA RELATIVA
ACUMULADA (Hi)
GRAFICA

84
FRECUENCIA RELATIVA
ACUMULADA (Hi)
GRAFICA

85
FRECUENCIA PORCENTUAL (fi %)
La frecuencia porcentual es la frecuencia relativa (hi)
expresada en forma porcentual. En otras palabras,
es la frecuencia relativa (hi) multiplicada por 100.
En nuestro ejemplo
TABLA
xi fi Fi hi Hi fi%
0 4 4 0,08 0,08 8%
1 9 13 0,18 0,26 18 %
2 12 25 0,24 0,50 24 %
3 10 35 0,20 0,70 20 %
4 8 43 0,16 0,86 16 %
5 4 47 0,08 0,94 8%
6 2 49 0,04 0,98 4% 86
FRECUENCIA PORCENTUAL (fi %)
GRAFICA

87
FRECUENCIA PORCENTUAL (fi %)
GRAFICA

88
FRECUENCIA PORCENTUAL
ACUMULADO (Fi %)
La frecuencia porcentual acumulada es la frecuencia
relativa acumulada (Hi) multiplicada por 100. En nuestro
ejemplo:
TABLA
xi fi Fi hi Hi fi% Fi%
0 4 4 0,08 0,08 8% 8%
1 9 13 0,18 0,26 18 % 26 %
2 12 25 0,24 0,50 24 % 50 %
3 10 35 0,20 0,70 20 % 70 %
4 8 43 0,16 0,86 16 % 86 %
5 4 47 0,08 0,94 8% 94 %
6 2 49 0,04 0,98 4% 98 % 89
FRECUENCIA PORCENTUAL
ACUMULADO (Fi %)
GRAFICA

90
FRECUENCIA PORCENTUAL
ACUMULADO (Fi %)
GRAFICA

91
ORGANIZACION Y PRESENTACION
DE DATOS UNIDIMENSIONALES
a)Frecuencia Absoluta (fi)
Es el nmero de veces que se presenta un valor o
categora de una variable. Se representa por f i.
f1 + f2 + f3 + .fk = n
b) Frecuencia Absoluta Acumulada (Fi)
Es el nmero de datos igual o inferior (menor o
igual que) al valor considerado de la variable o la
suma de las frecuiencias absolutas menor o igual
que el valor considerado de la variable. Es decir:
F1 = f 1
F2 = f 1 + f 2
-----------------------------
Fk = f1 + f2 + .+ fk 93
ORGANIZACION Y PRESENTACION
DE DATOS UNIDIMENSIONALES
c) Frecuencia Relativa (hi)
Es igual a la frecuencia absoluta sobre el numero
de observaciones.
h1 =f1/n
b) Frecuencia Relativa Acumulada (Hi)
Es el resultado de cada frecuencia absoluta
acumulada dividida entre el numero total de
observaciones.
H1 = F1/n
H2 = F2/n
-----------------------------
Hk = Fk/n 94
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
1.Identificar el tipo de variable cuantitativo
discreto o continuo.
2.Determinar el mayor (Xmax) y el menor (Xmin).
3.Calcular R donde R = Xmax Xmin.
4.Si la variable es cuantitativa discreta
El rango es pequeo, entonces trabajar con los
valores originales ordenados de las variables.
Si el rango es grande entonces trabajar con los
datos ordenados agrupados en intervalo de
clase (ver Sturges).

95
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
5.Si la variable es cuantitativa continua:
Determinar el numero de intervalos (entre 5 y
20).
Utilizar la regla de Sturge: m = 1 + 3,322log n
Si n = 50
m = 1 + 3,322log(50) = 6,6439
Se redondea a m = 7 intervalos de clase.
Intervalo cerrado por la izquierda y abierto por la
derecha.
El menor del intervalo izquierdo =X` min =(Xmin)
menor unidad/2.
Marca de clase= (xmax 1er intervalo - X`min )/2 96
Problemas
Si la variable es cuantitativa continua:
Determinar el numero de intervalos (entre 5 y
20).
Utilizar la regla de Sturge: m = 1 + 3,322log
n
Si n = 50
m = 1 + 3,322log(50) = 6,6439
Se redondea a m = 7 intervalos de clase.
Intervalo cerrado por la izquierda y abierto por
la derecha.
El menor del intervalo izquierdo =X`min
=(Xmin) menor unidad/2.
Marca de clase= (xmax 1er intervalo - X`min )/2

97
Distribucin de
Frecuencias
N N hijos N N hijos N N hijos N N hijos N N hijos

1 1 7 1 13 2 19 1 25 2
2 1 8 0 14 1 20 4 26 2
3 0 9 5 15 5 21 1 27 1
4 2 10 2 16 4 22 2 28 1
5 2 11 1 17 5 23 1 29 2
6 2 12 2 18 2 24 4 30 1

99
Distribucin de
Frecuencias
x fi h1 Fi Hi hi% Hi%
0 2 0.067 2 0.067 6.67 6.667
1 11 0.367 13 0.433 36.67 43.333
2 11 0.367 24 0.800 36.67 80.000
3 3 0.100 27 0.900 10.00 90.000
4 3 0.100 30 1.000 10.00 100.000

Total 30 100

100
Problema N 01:
Se desea conocer la distribucin de un
proceso mediante la elaboracin de una Tabla
de Frecuencias y un Histograma:
a) Recopilar datos, mnimo que sean 50 datos
y 100 datos como deseable.
b) Encontrar el valor mximo (Xmax) y el
valor mnimo (Xmin)
c) Calcular el intervalo de clase (c), el cual
debe ser mltiplo de la unidad mnima de
medicin.
102
27,9 28,8 28,0 27,9 28,1
27,9 28,1 28,1 28,1 27,8
28,1 27,6 28,4 28,5 28,0
27,8 27,9 28,1 27,9 27,9
27,8 27,7 28,0 28,0 27,7
28,1 28,1 28,1 28,9 28,4
28,0 28,4 27,8 28,6 28,1
28,0 28,5 28,0 28,3 27,6
28,3 28,0 28,3 28,6 28,1
27,8 28,2 27,8 28,7 27,8
28,0 28,1 27,6 28,5 27,8
28,3 28,0 28,0 27,8 27,9
28,4 28,3 27,8 27,9 28,3
27,8 28,2 28,3 27,8 27,9
27,9 27,9 28,2 28,1 28,3
28,1 27,5 27,5 28,0 27,7
28,3 28,3 27,9 27,9 27,9
27,6 27,6 28,0 27,9 28,1
27,2 28,0 27,9 28,0 27,7
27,5 28,3 27,9 27,5 28,3
103
Problema N 01 (continua):
c = (Xmax Xmin)/K
c = (28,9 27,2)/10 = 0.17 => 0.2
K = nmero de clases (nmero de barras en el
grfico), y que por experiencia se sugiere que
tome los siguientes valores:
NUMERO DE
VALORES DE K
DATOS
de 50 a 100 Aprox. de 6 a 10
de 100 a 200 Aprox. de 7 a 12
mas de 250 Aprox. de 10 a 20
104
Problema N 01 (continua):
d) Se calcula el lmite de la 1era clase.
Xmin Unidad mnima /2 = 27.2 - 0.1/2= 27.15
e) Se calcula la marca de clase de cada intervalo.
Punto medio = (Limite superior Limite inferior)/2
f) Se llena la Tabla de Frecuencia
g)Se va marcando la clase donde corresponde cada
dato.
h)Se suman las marcas de clase y se determina la
frecuencia de cada clase (fi, Fi, hi y Hi).
i)Se hace una grafica de barras, en donde el eje de
X representa los valores de medicin (las clases), y
el eje Y la frecuencia . 105
Problema N 01 (continua):
TABLA DE DISTRIBUCION DE FRECUENCIAS
CLASE MC MARCAS fi Fi hi Hi
[27.15 - 27.35) 27.25 / 1 1 0.01 0.01
[27.35 - 27.55) 27.45 //// 4 5 0.04 0.05
[27.55 - 27.75) 27.65 ///////// 9 14 0.09 0.14
[27.75 - 27.95) 27.85 ///////////////////////////// 29 43 0.29 0.43
[27.95 - 28.15) 28.05 ////////////////////////////// 30 73 0.30 0.73
[28.15 - 28.35) 28.25 /////////////// 15 88 0.15 0.88
[28.35 - 28.55) 28.45 /////// 7 95 0.07 0.95
[28.55 - 28.75) 28.65 /// 3 98 0.03 0.98
[28.75 - 28.95] 28.85 // 2 100 0.02 1.00
100 1.00
Problema N 02:
El Area de Control de Calidad de la
empresa FUNDIDOS S. A. esta llevando a
cabo un seguimiento a un lote de piezas
mecanizadas en su taller de
metalmecnica, para esto ha tomado una
muestra aleatoria y se necesita obtener el
siguiente anlisis estadstico descriptivo:
Tabla de Frecuencias.
Histogramas.
Polgonos de Frecuencia (tarea para el
alumno).
Ojivas (tarea para el alumno).
107
1279,5 1278,0 1283,0 1273,0 1280,5
1285,0 1273,0 1282,5 1271,5 1269,0
1280,0 1280,0 1272,5 1275,5 1284,0
1273,0 1277,5 1275,5 1277,0 1287,0
1284,0 1286,0 1275,0 1278,0 1275,5
1280,5 1280,0 1282,0 1283,5 1280,0
1275,5 1281,0 1271,0 1274,5 1280,5
1278,0 1275,0 1280,5 1279,0 1278,0
1279,5 1278,5 1266,0 1287,5 1275,5
1275,0 1279,5 1282,5 1276,0 1280,0
1267,0 1273,5 1284,5 1279,5 1274,5
1272,0 1275,0 1276,0 1268,0 1285,0
1282,0 1276,5 1279,0 1269,0 1282,0
1276,0 1271,5 1281,0 1285,5 1276,5
1269,5 1284,5 1276,0 1268,0 1268,5
1266,0 1276,0 1287,5 1272,5 1275,5
1273,5 1268,5 1273,5 1266,5 1269,0
1285,5 1272,5 1272,5 1278,0 1271,5
1275,5 1284,5 1279,5 1267,0 1280,5
1283,5 1286,0 1279,0 1271,0 1287,0
1285,0 1271,0 1276,0 1275,5 1276,5
1273,0 1265,5 1281,5 1277,0 1272,0
108
1-9

DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
1. Se identific que la variable es cuantitativa
continua.
2. Se tiene que (Xmax) = 1287.5 y (Xmin)= 1265.5
3. R =(Xmax) - (Xmin)= 1287.5 1265.5 = 22
4. Como el rango es grande entonces trabajamos con
los datos ordenados agrupados en intervalo de
clase (ver Sturges). Si la variable es cuantitativa
continua:
Determinar el numero de intervalos
Utilizar la regla de Sturge: m = 1 + 3,322log n
Si n = 110
m = 1 + 3,322log(110) = 7.78
109
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
Se redondea a m = 8 intervalos de clase.
Intervalo cerrado por la izq. y abierto por la
der.
El menor del 1er intervalo izquierdo =X`min =(Xmin)
menor unidad/2.
X`min = 1265.5 0.1/2 = 1265.45
Amplitud de Clase= a = R/m = 22/8 = 2.75 = 2.8
Marca de clase= MC=(xmax 1er intervalo - X`min )/2
MC1 = 1265.45 + 2.8 = 1268.25
Y se empieza la tabla
110
INTERVALOS MC fi Fi hi Hi

[1265.45 - 1268.25 ) 1266.85 8 8 0.07 0.07

[1268.25 - 1271.05 ) 1269.65 9 17 0.08 0.15

[1271.05 - 1273.85 ) 1272.45 16 33 0.15 0.30

[1273.65 - 1276.65 ) 1275.25 23 56 0.21 0.51

[1276.65 - 1279.45 ) 1278.05 12 68 0.11 0.62

[1279.45 - 1282.25 ) 1280.85 21 89 0.19 0.81

[1282.25 - 1285.05 ) 1283.65 13 102 0.12 0.93

[1285.05 - 1287.85 ] 1286.45 8 110 0.07 1.00

110 1.00
Histograma fi

112
Histograma Fi

113
Histograma hi

114
Histograma Hi

115
Problema N 03:
Las estaturas en centmetros de 50
estudiantes mujeres un grupo se registraron.
Los datos son:

157 155 171 150 163 150 172 161 154 174
163 148 152 163 149 158 176 164 157 153
169 161 160 164 155 162 151 167 167 167
170 158 163 175 169 169 158 150 156 157
174 162 150 151 165 170 156 170 153 154

Agrupe adecuadamente los datos y elabore la

respectiva tabla de frecuencias y el histograma de


116
1-9
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
1. Se identific que la variable es cuantitativa
continua.
2. Se tiene que (Xmax) = 176 y (Xmin)= 148
3. R =(Xmax) - (Xmin)= 28
4. Como el rango es grande entonces trabajamos con
los datos ordenados agrupados en intervalo de
clase (ver Sturges). Si la variable es cuantitativa
continua:
Determinar el numero de intervalos
Utilizar la regla de Sturge: m = 1 + 3,322log n
Si n = 50
m = 1 + 3,322log(50) = 6,470678

117
1-9
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
Se redondea a m = 7 intervalos de clase (se
reajustar segn se hagan los clculos).
Intervalo cerrado por la izq. y abierto por la
derecha.
El menor del 1er intervalo izquierdo =X`min =(Xmin)
menor unidad/2.
X`min = 148 1/2 = 147.5
Amplitud de Clase = a = R/m = 28/6.4706 = 4.327
Marca de clase = MC=(xmax 1er intervalo - X`min )/2
MC1 = 147.5 + 2.163 = 149.66
Y se empieza la tabla
118
INTERVALOS
MC fi Fi hi Hi
[147.50 151.83 ) 149.66 8 8 0.16 0.16
[151.83 156.15) 153.99 9 17 0.18 0.34
[156.15 160.48 ) 158.31 7 24 0.14 0.48
[160.48 164.81 ) 162.64 10 34 0.20 0.68
[164.81 169.14 ) 166.97 7 41 0.14 0.82
[169.14 173.46 ) 171.30 5 46 0.10 0.92
[173.46 177.79 ] 175.62 4 50 0.08 1.00
50 1.00 119
1-9

PROBLEMA
Problema N 03: En un estudio de dos
semanas sobre la productividad de los
trabajadores de una fundicin, se
obtuvieron los siguientes datos sobre el
nmero total de piezas aceptables que
produjeron los trabajadores:
Elaborar la Tabla de Distribucin de
Frecuencias.
Dibujar el Histograma y Polgono de
Frecuencia.

120
65 36 49 84 79 56 28 43 67 36
43 78 37 40 68 72 55 62 22 82
88 50 60 56 57 46 39 57 73 65
59 48 76 74 70 80 75 56 45
75 62 72 63 32 80 64 53 74 34
76 60 48 55 51 54 45 44 35 51
21 35 61 45 33 61 60 85 68
45 53 77 42 69 52 68 52 47
62 65 75 61 73 50 53 59 41 54
41 74 82 78 26 35 47 70 38 70
121
1-9
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
1. Se identific que la variable es cuantitativa
discreta.
2. Se tiene que (Xmax) = 21 y (Xmin)= 88
3. R =(Xmax) - (Xmin)= 21 88 = 67
4. Como el rango es grande entonces trabajamos con
los datos ordenados agrupados en intervalo de
clase (ver Sturges). Si la variable es cuantitativa
continua:
Determinar el numero de intervalos
Utilizar la regla de Sturge: m = 1 + 3,322log n
Si n = 97
m = 1 + 3,322log(97) = 7.60 = 8

122
1-9
DISTRIBUCION DE FRECUENCIAS
PARA VARIABLES CUANTITATIVA
Se redondea a m = 8 intervalos de clase.
Intervalo cerrado por la izq. y abierto por la der.
El menor del 1er intervalo izquierdo =X`min
=(Xmin) menor unidad/2.
X`min = 21 1/2 = 20.5
Amplitud de Clase= a = R/m = 67/8 = 8.375 = 9
Marca de clase= MC=(xmax 1er intervalo - X`min )/2
MC1 = 20.5 + 4.5 = 25
Y se empieza la tabla
123
DIAGRAMA DE PUNTOS
(herramienta til para pocos
datos)

Ejemplo: Datos de resistencia a la


tensin de muestras de mortero
Portland (Kg/cm2) con polmero
agregado:
16.85 16.40 17.21 16.35 16.52
17.04 16.96 17.15 16.59 16.57
mortero Portland sin modificar:
17.50 17.63 18.25 18.00 17.86
DIAGRAMA DE PUNTOS
(herramienta til para pocos datos)

* * ** * * ** * * + + + + + ++ + + +

16.0 16.5 17.0 17.5 18.0 18.5

* = Mortero modificado
+ = Mortero sin modificar
Grfica de tallo y hojas
(Stem-and-Leaf )
Es una grfica usada para datos cuantitativos.
Ejemplo: Los siguientes datos representan pesos
de una muestra de 15 varones adultos.
165 178 185 169 152 180 175 189 195
200 183 191 197 208 179
Hacer su grfica de Stem-and Leaf.

Solucin: En este caso las ramas la forman los


primeros dos dgitos de los datos, y las hojas
sern dadas por los ltimos dgitos de los datos.

128
Grfica de tallo y hojas
(Stem-and-Leaf )
Luego el stem-and leaf ser de la siguiente manera:

Interpretacin: El uso del stem-and-leaf es


exactamente igual al del Histograma, la nica diferencia
est en que del stem-and-leaf se pueden recuperar los
datos muestrales, pero de un histograma no se puede
hacer. En este ejemplo el stem-and-leaf es asimtrico a
la izquierda, no tiene mucha variabilidad ni outliers.
129
DIAGRAMA DE TALLO Y HOJAS
Ejemplo: Resistencia a la Tensin de 80 muestras
de aleacin Aluminio-Litio

105 221 183 186 121 181 180 143 97 154


153 174 120 168 167 141 245 228 174 199
181 158 176 110 163 131 154 115 160 208
158 133 207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146 218 157
101 171 165 172 158 169 199 151 142 163
145 171 148 158 160 175 149 87 160 237
150 135 196 201 200 176 150 170 118 149
DIAGRAMA DE TALLO Y HOJAS
Tallo Hoja Frecuencia
7 6 1
8 7 1
9 7 1
10 5 1 2
11 5 8 0 3
12 1 0 3 3
13 4 1 3 5 3 5 6
14 2 9 5 8 3 1 6 9 8
15 4 7 1 3 4 0 8 8 6 8 0 8
12
16 3 0 7 3 0 5 0 8 7 9 10
17 8 5 4 4 1 6 2 1 0 6 10
18 0 3 6 1 4 1 0 7
19 9 6 0 9 3 4 6
20 7 1 0 8 4
21 8 1
22 1 8 9 3
23 7 1
24 5 1
Tema N 01: ESTADISTICA DESCRIPTIVA I
2009 - Ing. Jos Manuel Garca
II Pantigozo 132

S-ar putea să vă placă și