Sunteți pe pagina 1din 23

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .

Ejercicios
Pgina 1

: ESTADSTICA EMPRESARIAL: UN ENFOQUE APLICADO

2 Diplomatura de Empresariales



EJERCICIOS RESUELTOS
Estadstica descriptiva para una variable

Contenido: Pgina
- Enunciados de los ejercicios .................................................................................................... 2
- Resultados SPSS correspondientes a los ejercicios ................................................................. 4
- Resolucin de los ejercicios ................................................................................................... 11

Los resultados de SPSS necesarios para resolver los 22 primeros ejercicios se han obtenido con el
fichero de datos de 175 escolares, mientras que los ejercicios del 23 al 36 corresponden con resultados de
un fichero de empleados de USA y los ltimos 4 ejercicios se refieren a los resultados sobre las ventas en
un fichero de 20 empresas. Todos los resultados se encuentran al final de los enunciados de los ejercicios.
Fichero de 175 escolares:
1.- Calcula los valores de la tabla de frecuencias de la variable ESTUDIOS. Interpreta su significado (bien
mediante la tabla o bien mediante el grfico de barras).
2.- Calcula el valor de la medida de posicin central ms adecuada para la variable ESTUDIOS. Interpreta
su significado.
3.- Calcula los valores de la tabla de frecuencias de la variable NIVEL. Interpreta su significado (bien
mediante la tabla o bien mediante el grfico de barras).
4.- Calcula las medidas de posicin central adecuadas para la variable NIVEL. Interpreta su significado.
Cul es la ms adecuada?
5.- Seala la razn por la que las columnas Porcentaje y Porcentaje vlido son iguales para la
variable ESTUDIOS y distintas para NIVEL.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 2
6.- Qu otros estadsticos tendra sentido calcular para las variables ESTUDIOS y NIVEL?
7.- Interpreta el diagrama de barras de la variable EDAD.
8.- Calcula los valores de los estadsticos faltantes (Mximo, Suma y Varianza) para la variable EDAD.
9.- Seala los valores, unidades y significado de las medidas de posicin central, dispersin y forma
calculadas para la variable EDAD.
10.- Interpreta el histograma de la variable CINE (Asistencia anual al cine).
11.- Calcula los valores de los estadsticos faltantes (Mediana, Desv.Tp., Suma y Rango) para la variable
CINE.
12.- Analiza mediante varias formas la existencia de valores extremos en la variable CINE.
13.- Seala las medidas de posicin (central y no centrales) calculadas para la variable CINE e interpreta su
significado. Cul es la ms adecuada para resumir los valores de dicha variable?
14.- Construye de forma aproximada el diagrama de cajas para la variable CINE y comntalo.
15.- Seala los valores, unidades y significado de las medidas de dispersin y forma calculadas para la
variable CINE.
16.- Calcula el intervalo en el que se encuentran al menos el 75% y aproximadamente el 95% de los datos
de la variable CINE.
17.- Seala el valor y significado de la medida de posicin central ms adecuada para la RIQUEZA VERBAL
(Analiza la existencia de extremos si lo crees necesario).
18.- Seala el valor y significado de las medidas de forma de la variable RIQUEZA VERBAL.
19.- Seala los valores y unidades de las medidas de dispersin absolutas calculadas para la variable
RIQUEZA VERBAL. Cmo calcularas otras medidas de dispersin absolutas con el ordenador?
20.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stem-
and-Leaf Plot) de la RIQUEZA VERBAL.
21.- Comenta el diagrama de cajas dibujado para la RIQUEZA VERBAL.
22.- Compara la dispersin de las tres variables cuantitativas (EDAD, CINE y RIQUEZA VERBAL), utilizando
la medida ms adecuada, y seala la frmula y valores utilizados para calcularla.
Fichero de empleados de USA:
23.- Indica de qu tipo son las variables Contratos anuales firmados, Categora laboral y Salario actual.
24.- Calcula los estadsticos borrados y la amplitud intercuartil de los Contratos anuales firmados.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 3
25.- Interpreta todas las medidas de posicin de los Contratos anuales firmados. Cul es la medida de
posicin central ms adecuada para resumir esta variable?
26.- Estn dispersos los valores de los Contratos anuales firmados? Por qu? Dnde se localiza un
poco ms de dispersin?
27.- Calcula los valores borrados en la tabla de frecuencias de Categora laboral.
28.- Calcula e interpreta la medida de posicin central ms adecuada para la Categora laboral.
29.- Tiene sentido calcular otros estadsticos para Categora laboral? Por qu?
30.- Analiza la distribucin de los valores del Salario actual a partir de los cuartiles. Crees que existen
valores extremos?
31.- Analiza con valores tipificados si el Salario actual tiene valores extremos.
32.- Cul es la medida de posicin central ms adecuada para resumir el Salario actual? Interprtala.
33.- Indica los valores, unidades e interpretacin de las medidas de dispersin del Salario actual.
34.- En qu intervalo se encuentra aproximadamente el 68% de los valores del Salario actual segn la
regla emprica? En qu intervalo tendremos aproximadamente el 95% de los datos?
35.- Compara la dispersin de las dos variables cuantitativas del estudio de empleados de USA.
36.- Interpreta las medidas de forma del Salario actual y su asimetra respecto de la mediana.
Fichero de 20 empresas:
37.- Interpreta el significado de las medidas de posicin no central calculadas para las Ventas y analiza la
distribucin de los valores de las Ventas a partir de los cuartiles.
38.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stem-
and-Leaf Plot) de las Ventas.
39.- Analiza si las Ventas tiene valores extremos. Cul es la medida de posicin central ms adecuada
para resumir las Ventas?
40.- Indica los valores, unidades e interpretacin de las medidas de dispersin de las Ventas.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 4
Resultados de SPSS para resolver los ejercicios de 175 escolares
53 ----- ---- ----
71 ---- ---- ----
51 ---- ---- ----
175 100,0 100,0
175 100,0
EGB
BUP
FP
Total
Vlidos
Total
Frecuencia Porcentaje Porcentaje vlido Porcentaje acumulado
Tabla de frecuencia ESTUDIOS

Grfico de barras
ESTUDIOS
FP BUP EGB
F
r
e
c
u
e
n
c
i
a
80
60
40
20
0

19 --- --- ---
50 --- --- ---
57 --- --- ---
31 --- --- ---
11 --- --- ---
168 --- 100,0
7 ---
7 ---
175 100,0
MUY BAJO
BAJO
MEDIO
ALTO
MUY ALTO
Total
Vlidos
9
Total
Perdidos
Total
Frecuencia Porcentaje Porcentaje vlido Porcentaje acumulado
Tabla de frecuencia NIVEL SOCIOECONOMICO FAMILIAR

Grfico de barras
NIVEL SOCIOECONOMICO FAMILIAR
MUY ALTO ALTO MEDIO BAJO MUY BAJO
F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 5

Anlisis descriptivo de la variable EDAD (175 escolares)
Grfico de barras
EDAD
20 18 17 16 15 14 13 12
F
r
e
c
u
e
n
c
i
a
50
40
30
20
10
0

175 8 12 ----- ----- 15,75
175
EDAD
N vlido
Estadstico Estadstico Estadstico Estadstico Estadstico Estadstico
N Rango Mnimo Mximo Suma Media
Estadsticos descriptivos

1,81 ----- -,172 -,152 EDAD
Estadstico Estadstico Estadstico Estadstico
Desv. tp. Varianza Asimetra Curtosis
Estadsticos descriptivos


ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 6
Anlisis descriptivo de la variable ASISTENCIA ANUAL AL CINE (175 escolares)

Estadsticos
Asistencia anual al cine
175
0
28,39
------
12
------
283,963
,547
-,530
------
5
70
------
12,00
26,00
40,00
Vlidos
Perdidos
N
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Curtosis
Rango
Mnimo
Mximo
Suma
25
50
75
Percentiles

ASISTENCIA ANUAL AL CINE
70,0
60,0
50,0
40,0
30,0
20,0
10,0
Histograma
F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0
Desv. tp. = 16,85
Media = 28,4
N = 175,00

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 7
Anlisis descriptivo de la variable RIQUEZA VERBAL (175 escolares)
30,78 ,54
29,71
31,84
30,71
30,00
51,209
7,16
18
45
27
11,00
,318 ,184
-,851 ,365
Media
Lmite inferior
Lmite superior
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
RIQUEZA
VERBAL
Estadstico Error tp.
Descriptivos


RIQUEZA VERBAL Stem-and-Leaf Plot

Frequency Stem & Leaf
9,00 1 . 888889999
,00 2 .
10,00 2 . 3333333333
45,00 2 . 444444444444444444444444444444445555555555555
,00 2 .
16,00 2 . 8888888899999999
14,00 3 . 00000000011111
25,00 3 . 2222222222223333333333333
13,00 3 . 4444444445555
9,00 3 . 777777777
4,00 3 . 8888
13,00 4 . 0000111111111
9,00 4 . 333333333
8,00 4 . 44445555

Stem width: 10
Each leaf: 1 case(s)

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 8
175 N =
RIQUEZA VERBAL
50
40
30
20
10


Resultados de SPSS para resolver los ejercicios de empleados de USA
Estadsticos
Contratos anuales firmados
90
0
6,06
6,00
6
1,15
1,33
,113
-,798
4
4
8
5,00
6,00
7,00
Vlidos
Perdidos
N
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Curtosis
Rango
Mnimo
Mximo
25
50
75
Percentiles

Contratos anuales firmados
8 7 6 5 4
P
o
r
c
e
n
t
a
j
e
35
30
25
20
15
10
5
0

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 9
Categora laboral
63 70,0 73,3 73,3
7 7,8 8,1 81,4
16 17,8 18,6 100,0
86 95,6 100,0
4 4,4
90 100,0
Administrativo
Seguridad
Directivo
Total
Vlidos
0 Perdidos
Total
Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado

Descriptivos (90 casos vlidos, 0 casos perdidos)
37202,06
35368,64
30750,00
322952647,132
17970,88
16800
110625
93825
21356,25
1,646
2,955
Media
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Salario actual
(en dlares)
Estadstico

Percentiles
20062,50 24300,00 30750,00 45656,25 72968,75
Salario actual
(en dlares)
Promedio
ponderado
5 25 50 75 95
Percentiles

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 10
90 N =
Salario actual (en d
120000
100000
80000
60000
40000
20000
0
87
88
89
90


ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 11
Resultados de SPSS para resolver los ejercicios de 20 empresas

Estudio de Frecuencias de la variable VENTAS (20empresas)
Estadsticos
Ventas anuales en millones
20
0
506,5640
65,2017
429,1050
258,33
a
291,5908
85025,1964
2,810
,512
9,699
,992
1316,87
258,33
1575,20
10131,28
314,0375
429,1050
607,6850
Vlidos
Perdidos
N
Media
Error tp. de la media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Error tp. de asimetra
Curtosis
Error tp. de curtosis
Rango
Mnimo
Mximo
Suma
25
50
75
Percentiles
Existen varias modas. Se mostrar el menor
de los valores.
a.


VENTAS ANUALES EN MILLONES Stem-and-Leaf Plot

Frequency Stem & Leaf
4,00 2 . 5899
3,00 3 . 047
7,00 4 . 1223448
1,00 5 . 3
2,00 6 . 37
2,00 7 . 07
1,00 Extremes (>=1575)

Stem width: 100,000
Each leaf: 1 case(s)


ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 12
RESOLUCION DE LOS EJERCICIOS DE ESTADISTICA DESCRIPTIVA

Fichero de 175 escolares:
1.- Calcula los valores de la tabla de frecuencias de la variable ESTUDIOS. Interpreta su significado (bien
mediante la tabla o bien mediante el grfico de barras).
Los valores faltantes de la tabla de frecuencias se calculan de la forma siguiente:
Porcentaje y Porcentaje vlido: se divide la frecuencia entre 175 y se multiplica por cien (en porcentaje)
Porcentaje acumulado: se van sumando los porcentajes vlidos de la fila ms los de las anteriores filas.
53 30,3 30,3 30,3
71 40,6 40,6 70,9
51 29,1 29,1 100,0
175 100,0 100,0
175 100,0
EGB
BUP
FP
Total
Vlidos
Total
Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Tabla de frecuencia ESTUDIOS

La interpretacin de la tabla de frecuencias, que quiz se ve ms claro en el diagrama de barras,
sera que el grupo ms numeroso es el de alumnos de BUP (ms de un 40% de los estudiantes),
mientras que los que estudian EGB es un grupo similar a los de FP, alrededor de un 30% de los
encuestados.

2.- Calcula el valor de la medida de posicin central ms adecuada para la variable ESTUDIOS. Interpreta
su significado.
La medida de posicin central ms adecuada para la variable estudios es la Moda, ya que es una
variable cualitativa nominal (sus valores son categoras sin orden). Su valor es Moda=BUP y significa
que el grupo ms numeroso de alumnos lo forman los que estudian BUP.

3.- Calcula los valores de la tabla de frecuencias de la variable NIVEL. Interpreta su significado (bien
mediante la tabla o bien mediante el grfico de barras).
Los valores faltantes de la tabla de frecuencias se calculan de la forma siguiente:
Porcentaje: se divide la frecuencia entre 175 y se multiplica por cien (en porcentaje)
Porcentaje vlido: se divide la frecuencia entre 168 y se multiplica por cien (en porcentaje)
Porcentaje acumulado: se van sumando los porcentajes vlidos de la fila ms los de las anteriores filas.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 13
19 10,9 11,3 11,3
50 28,6 29,8 41,1
57 32,6 33,9 75,0
31 17,7 18,5 93,5
11 6,3 6,5 100,0
168 96,0 100,0
7 4,0
7 4,0
175 100,0
MUY BAJO
BAJO
MEDIO
ALTO
MUY ALTO
Total
Vlidos
9
Total
Perdidos
Total
Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Tabla de frecuencia NIVEL SOCIOECONOMICO FAMILIAR

La interpretacin de la tabla de frecuencias, que quiz se ve ms claro en el diagrama de barras,
sera que el grupo ms numeroso es el de nivel medio, como era de esperar, decreciendo el nmero
conforme aumenta o disminuye el nivel socioeconmico familiar, siendo el grupo de nivel alto el menos
numeroso.

4.- Calcula las medidas de posicin central adecuadas para la variable NIVEL. Interpreta su significado.
Cul es la ms adecuada?
Las medidas de posicin central que se pueden calcular para la variable nivel socioeconmico
familiar son la Moda y la Mediana, ya que es una variable cualitativa ordinal (sus valores son categoras
ordenadas), siendo la ms adecuada la mediana. Sus valores son Moda=Mediana=Nivel medio y
significa que el grupo ms numeroso de personas lo forman los del nivel socioeconmico familiar Medio
(moda) y la mitad de las personas tienen nivel medio o inferior (mediana).

5.- Seala la razn por la que las columnas Porcentaje y Porcentaje vlido son iguales para la variable
ESTUDIOS y distintas para NIVEL.
Para la variable estudios las dos columnas de porcentajes son iguales ya que no hay valores
perdidos. En cambio para la variable nivel socioeconmico familiar son distintas porque hay 7 valores
perdidos. Esto es debido a que el Porcentaje se calcula dividiendo la frecuencia entre el nmero de
casos totales y el Porcentaje vlido se calcula dividiendo la frecuencia entre el nmero de casos vlidos
( ambos en porcentaje)

6.- Qu otros estadsticos tendra sentido calcular para las variables ESTUDIOS y NIVEL?
Para ninguna de las dos variables se pueden calcular ms estadsticos que los sealados en las
preguntas 2 y 4 ya que se trata de variables cualitativas y para ellas nicamente tienen sentido las
medidas de posicin central sealadas: la moda para la variable ESTUDIOS y la mediana y la moda
para NIVEL.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 14
7.- Interpreta el diagrama de barras de la variable EDAD.
En el diagrama de barras de la edad se observa que sobre todo hay gente de 15 a 18 aos, siendo
el grupo de gente de 16 aos el ms numeroso, mientras que de 12 a 14 aos y de 20 aos hay muy
pocos.

8.- Calcula los valores de los estadsticos faltantes (Mximo, Suma y Varianza) para la variable EDAD.
Los valores faltantes hay que calcularlos a partir del resto de valores obtenidos por SPSS como sigue:
Mximo=Rango+Mnimo=8+12=20 aos
Suma= 2756 aos, ya que es igual a Media*(N vlido)=15,75*175=2756,25 pero se redondea ya que la
edad no tiene decimales.
Varianza es el cuadrado de la desviacin tpica, luego
2
28 , 3
2
81 , 1 aos Varianza = =

9.- Seala los valores, unidades y significado de las medidas de posicin central, dispersin y forma
calculadas para la variable EDAD.
Medidas de posicin central:
Media=15,75 aos, significa que la edad media de los estudiados es 15,75 aos (casi 16 aos).
Medidas de dispersin:
2
28 , 3
2 *
) ( aos
x
S SPSS Varianza = = aos
x
S SPSS Tpica Desviacin 81 , 1
*
) ( = =
Significa que hay muy poca dispersin, ya que la desviacin tpica es mucho menor que la media (y
por tanto el coeficiente de variacin ser mucho menor que 1).
Medidas de forma: (ambas sin unidades)
Asimetra=-0,172: al ser negativa significa que la grfica es asimtrica por la izquierda de la media y
por tanto los valores menores que 15,75 aos (media) estn ms dispersos que los mayores.
Curtosis=-0,152: al ser negativa significa que la grfica es menos apuntada que la campana de
gauss (Grfica de la distribucin normal) y por tanto los valores alrededor de 15,75 aos (media)
estn menos concentrados que en la distribucin Normal.

10.- Interpreta el histograma de la variable CINE (Asistencia anual al cine).
En histograma de la asistencia anual al cine se observa que el grupo ms numeroso es el que
menos ha ido al cine (menos de 15 veces al ao) y que al aumentar el nmero de veces que ha ido al
cine, el nmero de persona desciende, siendo el menos numeroso el de los que han ido 65 veces o
ms en un ao.

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 15
11.- Calcula los valores de los estadsticos faltantes (Mediana, Desv.Tp., Suma y Rango) para la variable
CINE.
Los valores faltantes hay que calcularlos a partir del resto de valores obtenidos por SPSS como sigue:
Mediana=Percentil 50= 26 veces
Suma= 4968 veces, ya que es igual a Media*(N vlido)=28,39*175=4968,25 pero redondeado, ya que la
variable cine no tiene decimales.
La desviacin tpica es la raz de la varianza, luego veces 8512 16 963 283 tp Desv , , . . = =
Rango=Mximo-Mnimo=70-5=65 veces

12.- Analiza mediante varias formas la existencia de valores extremos en la variable CINE.
Hay tres formas posibles, si bien cada una de ellas nos ofrece distinta informacin:
a) Comparacin de rango y amplitud intercualtil:
Como tenemos Rango=65 y Amplitud Intercuartil=40-12=28 veces, Rango=65<4 A.I.=112, luego
no hay extremos (sta es la forma ms sencilla de ver que no hay extremos)
b) Valores tipificados del mnimo y el mximo:
Mnimo=5 veces tipificado:
3 388 , 1
85 , 16
39 , 28 5
> =

=
min
z
luego el mnimo no es un valor
extremo (y por tanto no hay extremos en los valores bajos de la variable CINE)
Mximo=70 veces tipificado:
3 469 , 2
85 , 16
39 , 28 70
< =

=
max
z
luego el mximo no es un valor
extremo (y por tanto no hay extremos en los valores altos de la variable CINE).
c) Comparacin de diferencias entre los cuartiles:
Min=5 P25=12 Me=26 P75=40 Max=70
|-------------------|-------------------|-------------------|-------------------|
dif.1=7 dif.2=14 dif.3=14 dif.4=30
Tomando como referencia las dos diferencias centrales (dif.2 y dif.3) vemos que:
- la diferencia del primer 25% de los datos (dif.1) es menor que las centrales, luego no hay
valores extremos en los valores bajos de la variable CINE. (P25-Min<A.I.<3 A.I.)
- la diferencia del ltimo 25% de los datos (dif.4) es algo mayor que las centrales, pero no
exageradamente grande, luego en los valores altos de la variable CINE no hay valores extremos,
aunque s hay una mayor dispersin. (Max-P75<A.I.<3 A.I.)

13.- Seala las medidas de posicin (central y no centrales) calculadas para la variable CINE e interpreta su
significado. Cul es la ms adecuada para resumir los valores de dicha variable?
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 16
Mnimo=5 veces y Mximo=70 veces significa que el que menos ha ido al cine ha ido 5 veces en
un ao y el que ms 70 veces (ms de una vez a la semana).
Media=28,39 veces significa que el nmero medio de veces que han ido al cine estas personas es
28,39 veces en un ao.
Mediana=26 veces la mitad de la gente ha ido como mucho 26 veces al cine en un ao.
Moda=12 veces el grupo ms numeroso es el que ha ido 12 veces al cine en un ao (no tiene
demasiada utilidad en cuantitativas).
Percentil 25=12 veces la cuarta parte de la gente ha ido 12 veces al ao al cine o menos.
Percentil 75=40 veces la cuarta parte de la gente ha ido 40 veces al ao al cine o ms.
La ms adecuada es la media aritmtica, ya que CINE es una variable cuantitativa sin valores
extremos.

14.- Construye de forma aproximada el diagrama de cajas para la variable CINE y comntalo.
La construccin del diagrama de cajas se realiza a partir de los valores de los cuartiles y se comenta
a partir de las diferencias entre dichos cuartiles. Por tanto, dibujamos el diagrama de cajas (en
horizontal) del modo siguiente:
Min=5 P25=12------------Me=26-----------P75=40 Max=70
|--------------| | |-----------------------------------------------|
---------------------------------------
dif.1=7 dif.2=14 dif.3=14 dif.4=30
Una vez calculadas las diferencias entre los cuartiles podemos decir que:
- la diferencia del primer 25% de los datos (dif.1) es la menor, luego el 25% de los datos ms
pequeos estn ms concentrados, mientras que la mayor es dif.4, luego el 25% de los valores ms
altos estn ms dispersos. El 50% de los datos centrales (alrededor de la mediana) tienen una
dispersin intermedia entre los dos anteriores.
- hay asimetra por la derecha de la mediana: los valores de asistencia anual al cine mayores que 26
veces estn ms dispersos que los menores.

15.- Seala los valores, unidades y significado de las medidas de dispersin y forma calculadas para la
variable CINE.
Medidas de dispersin:
2
veces 963 283
2
x
S SPSS Varianza ,
*
) ( = =

veces 8512 16
x
S SPSS Tpica Desviacin ,
*
) ( = =

Significa que la dispersin de los datos es de 16,85 veces al cine, y hay poca dispersin, ya que la
desviacin tpica es menor que la media (y por tanto el coeficiente de variacin ser menor que 1).
Medidas de forma: (ambas sin unidades)
Asimetra=0,547: al ser positiva significa que la grfica es asimtrica por la derecha de la media y
por tanto los valores mayores que 28,39 veces (media) estn ms dispersos que los menores.
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 17
Curtosis=-0,53: al ser negativa significa que la grfica es menos apuntada que la grfica de la
distribucin normal y por tanto los valores alrededor de 28,39 veces (media) estn menos
concentrados que en la distribucin Normal.

16.- Calcula el intervalo en el que se encuentran al menos el 75% y aproximadamente el 95% de los datos
de la variable CINE.
Segn la regla de Tchebichev y la regla emprica, en [ ]
* *
,
x x
S 2 x S 2 x + estn al menos el 75% de
los datos y aprox. el 95% de los datos, respectivamente. Por tanto para la variable CINE el intervalo
que buscamos ser: [ 28,39 - 2 16,8512 , 28,39 + 2 16,8512 ] = [ -5, 3124 , 62,0924 ] y como la
variable CINE es discreta y mnimo=5, el intervalo ser: [ 5 , 62 ].

17.- Seala el valor y significado de la medida de posicin central ms adecuada para la RIQUEZA VERBAL
(Analiza la existencia de extremos si lo crees necesario).
La medida de posicin central ms adecuada es la media aritmtica, ya que la Riqueza verbal es
una variable cuantitativa (discreta) y en el diagrama de cajas se puede ver que no tiene valores
extremos.

18.- Seala el valor y significado de las medidas de forma de la variable RIQUEZA VERBAL.
Asimetra=0,318 (sin unidades): al ser positiva significa que la grfica es asimtrica por la derecha
de la media y por tanto las puntuaciones mayores que 30,78 puntos (media) estn ms dispersas
que las menores.
Curtosis=-0,851 (sin unidades): al ser negativa significa que la grfica es menos apuntada que la
grfica de la distribucin normal y por tanto las puntuaciones alrededor de 30,78 puntos (media)
estn ms dispersas que en la distribucin Normal.

19.- Seala los valores y unidades de las medidas de dispersin absolutas calculadas para la variable
RIQUEZA VERBAL. Cmo calcularas otras medidas de dispersin absolutas con el ordenador?
Las medidas de dispersin absolutas calculadas por SPSS son:
Rango = 27 puntos Amplitud intercuartil = 11 puntos
2
209 , 51
2 *
) ( puntos
x
S SPSS Varianza = =

puntos
x
S SPSS Tpica Desviacin 16 , 7
*
) ( = =

Otra medida de dispersin absoluta que podramos calcular con el ordenador es la desviacin media
respecto de la mediana. Para ello debemos seguir dos pasos:
1) Calcular la variable: Z = Valor absoluto de (Riqueza verbal mediana) = ABS (VERBAL 30)
2) Calcular la media de la variable anterior: Media de Z = Desviacin media respecto de la mediana

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 18
20.- Seala los valores que forman el primer intervalo y el ltimo en el diagrama de Tallos y Hojas (Stem-
and-Leaf Plot) de la RIQUEZA VERBAL.
Los 9 valores del primer intervalo son: 18 (5 veces) y 19 (4 veces)
Los 8 valores del ltimo intervalo son: 44 (4 veces) y 45 (4 veces)
Esto es debido a que la anchura del tallo es 10 (Stem width) y la variable Riqueza verbal no tiene
decimales. Por tanto los datos hay que calcularlos mediante: Dato=Stem*10+Leaf.

21.- Comenta el diagrama de cajas dibujado para la RIQUEZA VERBAL.
En el diagrama de cajas se observa que no hay valores alejados (ni atpicos ni extremos) y que los
datos estn casi uniformemente distribuidos en las 4 partes (de 25% de datos cada una), salvo el
25% de los datos mayores que estn un poco ms dispersos, con lo que la distribucin es un poco
asimtrica por la derecha de la mediana.

22.- Compara la dispersin de las tres variables cuantitativas (EDAD, CINE y RIQUEZA VERBAL), utilizando
la medida ms adecuada, y seala la frmula y valores utilizados para calcularla.
Para comparar la dispersin de las tres variables deberemos utilizar el coeficiente de variacin, ya
que no le influye el hecho de que las variables tengan distintas unidades.
Edad:
1146 , 0
75 , 15
81 , 1
175
174
*
1
) ( = =

= =
x
x
S
n
n
x
x
S
edad CV

Asistencia anual al cine:
5918 , 0
39 , 28
85 , 16
175
174
*
1
) ( = =

= =
x
x
S
n
n
x
x
S
cine CV

Riqueza verbal:
23195 , 0
78 , 30
16 , 7
175
174
*
1
) ( = =

= =
x
x
S
n
n
x
x
S
verbal CV

Comparando los valores de los coeficientes de variacin podemos decir que todas las variables
tienen poca dispersin, pero la que tiene la menor dispersin es la Edad y la que tiene una mayor
dispersin es la asistencia anual al cine, mientras que la variable riqueza verbal tiene una dispersin
intermedia a las dos anteriores.

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 19
Fichero de empleados de USA:

23.- Indica de qu tipo son las variables Contratos anuales firmados, Categora laboral y Salario actual.
La Contratos anuales firmados es una variable numrica y sin decimales, luego es cuantitativa
discreta y adems con pocos valores distintos. La Categora Laboral es una variable de grupos sin
ordenar, luego es cualitativa nominal. El Salario actual tambin es una variable numrica, pero con
decimales, luego es una variable cuantitativa continua.

24.- Calcula los estadsticos borrados y la amplitud intercuartil de los Contratos anuales firmados.
Mediana = P(50) = 6 contratos
Varianza = (Desv.tip)
2
= (1,15)
2
= 1,3225 contratos
2

Rango = Mximo Mnimo = 8 4 = 4 contratos
Amplitud Intercuartil = P(75) P(25) = 7 5 = 2 contratos

25.- Interpreta todas las medidas de posicin de los Contratos anuales firmados. Cul es la medida de
posicin central ms adecuada para resumir esta variable?
Medidas de posicin central y su significado:
Media = 6,06 : El nmero medio de contratos anuales firmados es de 6,6 contratos.
Mediana = 6 : La mitad de los empleados han firmado 6 contratos anuales o menos (6, 5 4
contratos).
Moda = 6 : El grupo ms numeroso es el que forman los que han firmado 6 contratos anuales.
Medidas de posicin no central y su significado:
Mnimo = 4 : Los empleados han firmado 4 contratos al menos.
Mximo = 8 : Los empleados que ms contratos han firmado han firmado 8 contratos.
Percentil 25 = 5 : El 25% de los empleados han firmado 5 contratos o menos.
Percentil 75 = 7 : El 25% de los empleados han firmado 7 contratos o ms.
La medida de posicin central ms adecuada para esta variable es la media aritmtica (6,06
contratos) ya que se trata de una variable cuantitativa discreta con pocos valores posibles (y por tanto,
sin valores extremos).

26.- Estn dispersos los valores de los Contratos anuales firmados? Por qu? Dnde se localiza un
poco ms de dispersin?
Los valores de esta variable estn muy poco dispersos, como se puede observar en el diagrama de
barras y porque la desviacin tpica (1,15 contratos) es mucho menor que la media (6,06 contratos).
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 20
Grficamente se aprecia un poco ms de dispersin en los valores altos, como se puede comprobar
con el coeficiente de asimetra (0,113) un poco mayor que cero.

27.- Calcula los valores borrados en la tabla de frecuencias de Categora laboral.
Los cuatro valores borrados se calculan de la siguiente forma:
Frecuencia de Directivo = Total vlido frecuencias de Administrativo y Seguridad = 86 (63+7) = 16
Porcentaje de Administrativo = ( Frecuencia / Total ) * 100 = ( 63 / 90 ) * 100 = 70 %
Porcentaje vlido de Administrativo = ( Frecuencia / Total vlido ) * 100 = ( 63 / 86 ) * 100 = 73,2558 %
= Porcentaje acumulado = 73,3 %
Porcentaje acumulado de Seguridad = Porcentaje vlido de Administrativo + Seguridad = 73,3 + 8,1
= 81,4 %

28.- Calcula e interpreta la medida de posicin central ms adecuada para la Categora laboral.
La Categora Laboral es una variable cuantitativa nominal (grupos sin orden) luego la ms adecuada
(y la nica que se puede calcular) es la moda, que en este caso es Administrativo y significa que el
grupo ms numeroso es el de Administrativos (en este caso tambin es la mayora de empleados, ya
que son el 73,3% de los casos vlidos).

29.- Tiene sentido calcular otros estadsticos para Categora laboral? Por qu?
Como se ha comentado en el ejercicio anterior, el nico estadstico que tiene sentido calcular es la
Moda, por tratarse de una variable cualitativa nominal.

30.- Analiza la distribucin de los valores del Salario actual a partir de los cuartiles. Crees que existen
valores extremos?
Min=16800 P25=24300 Me=30750 P75=45656,25 Max=110625
|----------------------------|----------------------------|----------------------------|----------------------------|
dif.1=7500 dif.2=6450 dif.3=14906,25 dif.4=64968,75
Como se puede observar en lo anterior, el 25% de los salarios bajos tienen poca dispersin y los
siguientes 25% tambin. A partir de la mediana (30.750 dlares) los salarios estn ms dispersos (son
ms diferentes los valores), sobre todo en el 25% de salarios ms altos donde la dispersin es muy
alta.
Puede haber valores extremos en los salarios ms altos, ya que se ha observado una mayor
dispersin. Para comprobarlo, comparamos la diferencia Max-P(75)=dif.4 con el triple de la amplitud
intercuartil AI=6450+14906,25=21356,25:
Max-P(75)=dif.4=64968,75 > 3 AI=64068,75 el mximo, al menos, es un valor extremo (como se
puede comprobar en el diagrama de cajas, en el que aparece un extremo y 3 valores alejados).
ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 21

31.- Analiza con valores tipificados si el Salario actual tiene valores extremos.
Tipificando el mximo y el mnimo del Salario comprobaremos si existen extremos altos o bajos,
respectivamente:
3 1353 1
88 17970
06 37202 16800
S
x
z
x
> =

= ,
,
, min
*
min
luego el mnimo no es extremo.
3 08 4
88 17970
06 37202 110625
S
x
z
x
> =

= ,
,
, max
*
max
luego el mximo, al menos, es extremo.

32.- Cul es la medida de posicin central ms adecuada para resumir el Salario actual? Interprtala.
Como el Salario es una variable cuantitativa continua, la ms adecuada ser una media, pero no la
media aritmtica, ya que hemos comprobado en los ejercicios anteriores que hay un valor extremo.
La media recortada eliminar el 5% de los valores altos y el 5% de los bajos, en este caso
5%n=5%90=4,5 datos, luego eliminar el valor extremo (e incluso los tres valores siguientes, que son
los alejados en el diagrama de cajas), por lo que la media recortada al 5% (35.368,64) es la ms
adecuada. Es decir, el salario medio de estos empleados es de 35.368,64 dlares.

33.- Indica los valores, unidades e interpretacin de las medidas de dispersin del Salario actual.
Rango = 93.825 dlares es la diferencia entre el que cobra el menor salario y el que cobra el mayor.
Amplitud Intercuartil = 21.356,25 dlares : el 50% de salarios intermedios tienen una diferencia
mxima de 21.356,25 dlares.
Varianza (de SPSS) = 322.952.647,132 (dlares)
2
[no se interpreta]
Desviacin tpica (de SPSS) = 17.970,88 dlares es la dispersin de los salarios. Es poca dispersin
porque es menor que la media (CV<1).

34.- En qu intervalo se encuentra aproximadamente el 68% de los valores del Salario actual segn la
regla emprica? En qu intervalo tendremos aproximadamente el 95% de los datos?
Segn la regla emprica, en [ ]
* *
,
x x
S x S x + estn aproximadamente el 68% de los datos, es decir,
en [ 37.202,06 17.970,88 , 37.202,06 + 17.970,88] = [19.231,18 , 55.172,94 ]
Tambin segn la regla emprica en [ ]
* *
,
x x
S 2 x S 2 x + estn aproximadamente el 95% de los
datos, es decir, en [ 37.202,06 2 17.970,88 , 37.202,06 + 2 17.970,88] = [ 1.260,3 , 73.143,82 ], pero
como el mnimo es 16.800, el intervalo con un 95% aprox. de los salarios ser [ 16.800 , 73.143,82 ]

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 22
35.- Compara la dispersin de las dos variables cuantitativas del estudio de empleados de USA.
Las dos variables cuantitativas del fichero de empleados de USA son los Contratos anuales firmados
y el Salario actual. Para poder compara su dispersin correctamente (tienen distintas unidades y muy
distintos valores) debemos calcular el coeficiente de variacin de cada variable:
Edad: 1887 , 0
06 , 6
15 , 1
90
89
*
1
) ( = =

= =
x
x
S
n
n
x
x
S
contratos CV
Asistencia anual al cine: 4804 , 0
06 , 37202
88 , 17970
90
89
*
1
) ( = =

= =
x
x
S
n
n
x
x
S
salario CV
Como era de esperar, el salario tiene mayor dispersin, porque su CV es mayor.

36.- Interpreta las medidas de forma del Salario actual y su asimetra respecto de la mediana.
Medidas de forma:
Asimetra = 1,646 > 0: la grfica del salario ser asimtrica por la derecha de la media, es decir, los
salarios mayores de 37.202,06 dlares estn ms dispersos que los menores.
Curtosis = 2,955 > 0: la grfica del salario ser ms apuntada que la de la distribucin Normal, es decir,
los salarios alrededor de 37.202,06 dlares (media) estn ms concentrados que en la Normal.


Fichero de 20 empresas:
37.- Interpreta el significado de las medidas de posicin no central calculadas para las Ventas y analiza la
distribucin de los valores de las Ventas a partir de los cuartiles.
Mnimo = 258,33 millones : Las ventas han sido de258,33 millones al menos.
Mximo = 1575,20 millones : Las ventas ms altas han sido de 1575,20 millones.
Percentil 25 = 314,0375 : Las ventas del 25% de las empresas han sido 314.037.500 pts o menos.
Percentil 75 = 607,6850 : El 25% de empresas han tenido unas ventas de 607.685.000 pts o ms.
Distribucin de los valores (con diferencias aproximadas):
Min=258,33 P25=314,0375 Me=429,105 P75=607,6850 Max=1575,2
|----------------------------|----------------------------|----------------------------|----------------------------|
dif.1<60 dif.2=115 dif.3<180 dif.4>900
Se observa que el 25% de las empresas con menores ventas tienen una ventas ms similares y que
al aumentar las ventas aumentan un poco las diferencias entre las de unas empresas y otras, en el 75%
de las empresas de menores ventas. Sin embargo las ventas del 25% de las empresas con ventas ms
altas muestran una diferencia muy grande, que es debida a una sola empresa con ventas muy altas
como se puede comprobar en el diagrama de tallos y hojas.

ESTADSTICA EMPRESARIAL UN ENFOQUE APLICADO. Estadstica unidimensional .Ejercicios
Pgina 23
38.- Seala los valores que forman el primer intervalo en el diagrama de Tallos y Hojas (Stem-and-Leaf
Plot) de las Ventas.
Como tenemos tallo(stem)=2 con anchura(Stem width)=100 y cada uno de los valores(Leaf)=5899,
entonces los valores aproximados (slo se conocen dos cifras) son: 250, 280, 290 y 290.

39.- Analiza si las Ventas tiene valores extremos. Cul es la medida de posicin central ms adecuada
para resumir las Ventas?
En primer lugar vamos a ver si es posible que haya extremos:
Rango=1316,887>4 A.I.=4 293,6475=1174,59 luego no podemos afirmar que no hay extremos.
Para analizar si hay extremos con los cuartiles (tambin se podra hacer con tipificados):
Max-P75 = 1575,2 - 607,685 = 967,515 > 3 A.I. = 880,9425 luego hay algn valor extremo grande (al
menos el mximo). En los valores bajos, el mnimo o cercanos, no hay valores extremos porque
P25-Min<60<A.I. luego seguro que se cumple la condicin P25-Min < 3 A.I. de que no hay extremos.
La medida de posicin central ms adecuada es una media, ya que ventas es una variable continua
(numrica y con decimales), y no la media aritmtica puesto que acabamos de comprobar que las
ventas tiene valores extremos. Para saber cul de las medias (recortada al 5% o geomtrica) se debe
escoger, es necesario saber cuntos valores extremos hay. En este caso slo hay 1 valor extremo (el
mximo=1575,2) ya que segn muestra el diagrama de tallos y hojas, el siguiente valor es
aproximadamente 770, o como mucho 779,99, un valor muy cercano al P75 que no es extremo (799,99-
P75=192,305<3 A.I.). Como en este caso hay N=20 datos, el 5% supone un dato, luego la media
recortada al 5% recorta el nico extremo y resulta por ello la medida de posicin central ms adecuada.

40.- Indica los valores, unidades e interpretacin de las medidas de dispersin de las Ventas.
Rango = 1316,887 millones es la diferencia mxima entre las ventas
Amplitud Intercuartil =293,6475 millones: el 50% de las ventas intermedias tienen una diferencia
mxima de 293.647.500 pts.
Varianza (de SPSS) = 85025,1964 (millones)
2
[no se interpreta]
Desviacin tpica (de SPSS) = 291,5908 millones es la dispersin de las ventas. Es poca dispersin
porque es menor que la media (CV<1).

S-ar putea să vă placă și