Sunteți pe pagina 1din 39

Anlisis de Datos para la Gerencia

Introduccin a la Estadstica:
Descripcin de Datos
Sesin 1

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Qu es la estadstica?
La Estadstica es un campo de la ciencia que
comprende procedimientos destinados a servir en el
proceso de decisin cuando hay incertidumbre.
Esta definicin puntualiza dos aspectos que el gerente
enfrenta continuamente: toma de decisiones
e
incertidumbre. En lo que se refiere al tratamiento de la
incertidumbre, la teora de probabilidades nos da la
oportunidad de una cuantificacin del riesgo lo que
permite ganar en eficiencia en la toma de decisiones.
Este proceso se torna cada da ms cientfico y las
tcnicas de soporte son por lo tanto una necesidad.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Datos
Los datos son los hechos y los nmeros que se
renen, analizan y resumen para su presentacin
e interpretacin.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Elementos, Variables,
Observaciones
Los elementos son las entidades de las cuales
recogemos los datos.
Una variable es una caracterstica de inters de cada
elemento.
Al conjunto de medidas recogidas de un elemento en
particular se le llama observacin.
El nmero total de datos es igual al nmero de
elementos multiplicado por el de variables.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Escalas de Medicin
Las escalas de medicin son:
Nominal

De intervalo

Ordinal

De razn

La escala determina la cantidad de informacin que


debe contener el dato.
La escala indica adems qu tipos de resmenes de
datos y de anlisis estadsticos son los ms apropiados.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Escalas de Medicin
Nominal
Los Datos son etiquetas o nombres usados para
Identificar un atributo de un elemento.
Se usan etiquetas no numricas o cdigos
numricos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Escalas de Medicin
Ordinal
Los datos tienen las propiedades de una
medicin nominal y adicionalmente el orden o la
posicin relativa de cada categora tiene
significado.

Se pueden usar una etiqueta no numrica o un


cdigo numrico.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Escalas de Medicin
De Intervalo
Los datos tienen las propiedades de los ordinales
y las distancias que hay entre las observaciones se
miden en trminos de una unidad de medida fija.
Datos de Intervalo son siempre numricos.

Esta escala tiene el cero relativo que indica que


para esta variable el punto cero depende de quien
evala. En el cero, no siempre no hay nada.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Escalas de Medicin
De razn
Los datos tienen todas las propiedades de los de
intervalo y en este caso el cociente de dos
valores tiene un significado.
Variables como son distancia, altura, peso, y
tiempo usan la escala de razn.
Esta escala tiene el cero absoluto que indica que
para esta variable no existe nada en el punto
cero.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

10

Cada escala provee diferente informacin


Nominal
Tercero

Segundo

Ganador

Ordinal
Tercero

Segundo

Ganador

Intervalo
20 segundos

Razn

1 segundo

1 minuto 59 2/5 segundos para 11/4 millas

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Estadstica Descriptiva
La mayora de la informacin estadstica en los
peridicos, revistas, informes de la compaa, y
otras publicaciones consiste en datos que se
resumen y presentan en una forma que es fcil
de entender.
A dichos resmenes de datos, que pueden ser
tabulares, grficos, o numricos, se les conoce
como estadstica descriptiva.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

11

Anlisis de Datos para la Gerencia

Inferencia Estadstica
Inferencia
Estadstica

Poblacin

es el proceso por el que se obtiene


informacin acerca de la poblacin
partiendo de informacin contenida
en una muestra.
es el conjunto total de elementos de
un estudio.

Muestra

es un subconjunto de la poblacin.

Censo

es recolectar datos de la poblacin.

Encuesta

es recolectar datos de una muestra.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

12

Anlisis de Datos para la Gerencia

13

Proceso de Inferencia Estadstica


Poblacin
con m
1 parmetro
desconocido

Usamos el promedio
4 muestral para estimar
el parmetro poblacional.

Extraemos una
2 muestra de
n elementos

Calculamos X
3 estadstico
muestral

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

14

Computadoras y anlisis estadstico


Los estadsticos a menudo utilizan programas
informticos para realizar los clculos estadsticos
necesarios con grandes cantidades de datos.
Para facilitar el uso del ordenador, muchos de los
conjuntos de datos en este libro estn disponibles
en el sitio web que acompaa al texto
Los archivos de datos se encuentran en formatos
de Minitab o Excel.
Anexos al final de cada captulo con los
procedimientos paso a paso para el uso de
Minitab, Excel y StatTools.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Estadstica Descriptiva
Datos resumidos y presentados
convenientemente. Dichos resmenes
pueden ser:
tabulares
grficos o
numricos

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

15

Anlisis de Datos para la Gerencia

Distribucin de frecuencias
Una distribucin de frecuencias es una tabla
que resume los datos mostrando la frecuencia o
nmero de elementos que hay dentro de cada una
de sus clases, que deben ser mutuamente
excluyentes y colectivamente exhaustivas.
El objetivo es proveer informacin acerca del
conjunto de datos que no podra obtenerse
rpidamente por simple observacin de los datos
originales.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

16

Anlisis de Datos para la Gerencia

17

Distribucin de frecuencias relativas


La frecuencia relativa de una clase es la fraccin
o proporcin del total de datos que pertenecen a
una determinada clase.
Una distribucin de frecuencias relativas es una
tabla que nos resume un conjunto de datos
mostrando la frecuencia relativa para cada clase.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

Grfico de Barras
Un grfico de barras es una herramienta grfica
para trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos
las etiquetas con los nombres de las categoras.
En el otro eje (normalmente el vertical), se puede
usar la frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos
arriba de cada etiqueta, con una altura de acuerdo
con su correspondiente frecuencia.
Las barras estn separadas para enfatizar que
cada clase es una categora diferente.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

18

Anlisis de Datos para la Gerencia

Grfico de Pie
El grfico de pie es una herramienta grfica usada
generalmente para presentar distribuciones de
frecuencia relativa de datos cualitativos.
Primero se traza un crculo; luego usando
las frecuencias relativas se subdivide
en sectores que corresponden a la
frecuencia relativa de cada clase.
Dado que hay 360 en un circulo, una clase con una
frecuencia relativa de .25 consumir .25(360) = 90
de ese crculo.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

19

Anlisis de Datos para la Gerencia

Distribucin de Frecuencias
Para Datos Numricos
Guas para seleccionar el nmero de clases
Use entre 5 y 20 clases.

Conjuntos de datos con un nmero grande de


elementos, generalmente requieren un nmero
grande de clases.
Conjuntos de datos pequeos usualmente
requieren pocas clases
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

20

Anlisis de Datos para la Gerencia

Distribucin de Frecuencias
Para Datos Numricos
Gua para seleccionar el Ancho de Clase

Use clases de igual ancho


Ancho aproximado de clase =
Dato ms grande - Dato ms pequeo
Nmero de Clases

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

21

Anlisis de Datos para la Gerencia

Distribucin Acumulativa
Distribucin Acumulada de Frecuencias
muestra el nmero de observaciones con valores
iguales o menores que el lmite superior de cada
clase.
Distribucin Acumulada de Frecuencias
Relativas muestra la proporcin de tems con
valores menores o iguales al el lmite superior de
cada clase.
Distribucin Acumulada de Frecuencias
Porcentuales muestra el porcentaje de tems con
valores menores o iguales al el lmite superior de
cada clase.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

22

Anlisis de Datos para la Gerencia

Usando la funcin FRECUENCIA de


Excel para Construir una Distribucin
de Frecuencias
La funcin FRECUENCIA no es una funcin
simple de Excel.
FRECUENCIA nos proporciona valores mltiples.
En Excel, la formula que dan como respuesta
mltiples valores se llaman frmula matricial.
Una frmula matricial tiene una forma especial de
ingresar.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

23

Anlisis de Datos para la Gerencia

Usando la funcin FRECUENCIA de


Excel para Construir una Distribucin
de Frecuencias
Pasos para ejecutar esta funcin:
Paso 1 Seleccionar la matriz donde deben
aparecer las frecuencias

Paso 2 Escribir la siguiente frmula:


{= FRECUENCIA (Datos,Grupos)}
Paso 3 Presionar CTRL + SHIFT + ENTER
(La frmula aparecer en toda la matriz
seleccionada)
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

24

Anlisis de Datos para la Gerencia

Histograma
El histograma es una manera muy comn de
presentar grficamente datos cuantitativos.
La variable de inters se coloca en el eje horizontal.
Se dibuja un rectngulo arriba de cada intervalo de
clase con una altura correspondiente a su
frecuencia, frecuencia relativa, o frecuencia
porcentual.
A diferencia del grfico de barras, un histograma
no tiene separaciones entre rectngulos de clases
adyacentes
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

25

Anlisis de Datos para la Gerencia

Usando Excel para Construir un


Histograma
Usando herramientas de Excel
Herramientas

Anlisis
de Datos

Histograma

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

26

Anlisis de Datos para la Gerencia

Anlisis Exploratorio de
Datos
El Anlisis Exploratorio de Datos es un conjunto de
tcnicas que usan aritmtica simple y grficos
fciles de dibujar para resumir datos rpidamente.
Una de estas tcnicas es el diagrama de hoja y
tallo.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

27

Anlisis de Datos para la Gerencia

Diagrama de Hoja y Tallo


Un Diagrama de Hoja y Tallo nos muestra ambos el
orden y la forma de la distribucin de los datos.

Es muy parecido a un histograma, con la ventaja de


que este diagrama conserva los valores originales.
El primer dgito de cada dato se coloca a la
izquierda de una lnea vertical.
A la derecha de la lnea, registramos el ltimo dgito
de cada dato en orden.
Cada lnea en el diagrama se conoce como tallo.
Cada dgito en el tallo es una hoja.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

28

Anlisis de Datos para la Gerencia

Diagrama de Hoja y Tallo


Si se cree que un diagrama de hoja y tallo est
muy concentrado, podemos abrir el diagrama
usando dos tallos para cada dgito inicial.
Dado que tenemos el primer dgito repetido, el
primer valor corresponde a valores de la hoja de
0 - 4, y el segundo a valores de la hoja de 5 - 9.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

29

Anlisis de Datos para la Gerencia

Diagrama de Hoja y Tallo


Unidades de la Hoja
Cada hoja se define por un slo dgito.
En el ejemplo anterior, la unidad de la hoja fue 1.
Las unidades pueden ser 100, 10, 1, 0.1, y as.

Cuando no se muestran las unidades de la hoja,


se asume que es 1.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

30

Anlisis de Datos para la Gerencia

Tablas de Contingencia y
Diagramas de Dispersin
Hasta el momento hemos visto mtodos que
resumen datos pero una variable a la vez.
Los gerentes necesitan mtodos que les permitan
graficar y tabular datos de manera que se entiendan
las relaciones entre dos variables.
Tablas de Contingencia y Diagramas de Dispersin
son dos mtodos que permiten resumir los datos
para dos (o ms) variables simultneamente.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

31

Anlisis de Datos para la Gerencia

Tablas de Contingencia
Tabla de contingencia es una forma de resumir en
una tabla datos de dos variables simultneamente.
Se puede usar si:
ambas variables son cualitativas, o
Si alguna es cuantitativa, para hacer la tabla
debe ser transformada en otra cualitativa.
Las filas y las columnas definen las clases para
cada una de las dos variables.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

32

Anlisis de Datos para la Gerencia

Diagramas de Dispersin y
Lneas de Tendencia
Un diagrama de dispersin es una representacin
grfica de la relacin entre dos variables
cuantitativas.
Una de las variables se muestra en el eje vertical
y la otra en el horizontal.
El patrn general que muestran los puntos
sugieren la relacin entre las variables.

Una lnea de tendencia es una aproximacin de la


relacin.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

33

Anlisis de Datos para la Gerencia

34

Procedimientos Grficos y Tabulares


Dato
Cualitativo
Mtodos
Tabulares

Cuantitativo

Mtodos
Grficos

Dist.Frec.
Grfico de
Dist.Frec.Relat. Barras
Dist.Frec.Porc. Grfico de
Tab.deConting.
Pie

Mtodos
Tabulares

Mtodos
Grficos

Dist. Frec.
Histograma
Dist.Frec.Relat. Ojiva
Dist.Frec.Acum. Diagrama de
Dist.Frec.Relat.A Dispersin
cumuladas
Diagrama de
Hoja y Tallo
Tab.deConting.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

35

Errores en Presentacin de Datos


1. Uso de Grficos
engaosos.
2. Bases Relativas de
Comparacin
diferentes.
3. Comprimiendo el eje
vertical.
4. No punto CERO en
el eje Vertical.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para la Gerencia

36

Grfico engaoso
Incorrecta
1960: $1.00

Correcta
$

1970: $1.60
1980: $3.10

2
0

1990: $3.80

1960

1970

1980

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

1990

Anlisis de Datos para la Gerencia

37

Base Relativa Diferente


Incorrecta

Correcta

Freq.

300

30%

200

20%

100

10%

0%
FR

SO

JR

SR

FR

SO

JR

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

SR

Anlisis de Datos para la Gerencia

38

Compresin de eje Vertical


Incorrecta

Correcta
$

$
200

50

100

25

0
Q1

Q2

Q3

Q4

Q1

Q2

Q3

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Q4

Anlisis de Datos para la Gerencia

39

No Cero en Eje Vertical


Incorrecta

Correcta

45

60

42

40

39

20

36

0
J

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

S-ar putea să vă placă și