Sunteți pe pagina 1din 16

MAESTRÍA EN ADMINISTRACION DE

EMPRESAS

MODULO: ESTADISTICA PARA LA

ADMINISTRACION

APUNTES

1
3.7.4. RELACION ENTRE VARIABLES

El interés de analizar dos variables conjuntamente es conocer si existe o no


relaciones entre dos variables. Los dos casos extremos en la relación entre dos
variables son:
La ausencia de relación: El conocimiento de una variable no permite conocer nada
sobre la otra variable.
El caso de dependencia funcional Y=F(X) indica que Y depende funcionalmente de
X, el conocimiento de X permite conocer, de forma exacta los valores que toma Y.
Concepto de Regresión
La covarianza y el coeficiente de correlación lineal miden el grado de asociación
lineal que hay entre las variables. Sin embargo, algunas veces podemos estar
interesados en cuantificar dicha relación.
Partimos del hecho de que una variable Y depende estadísticamente de la variable X.
Entonces Y es la variable dependiente y X es la variable independiente. Con la
regresión intentamos cuantificar esa relación.
GP INV
27,46 77
28,23 79
31,01 80
31,49 83
35,83 101
39,26 117
41,37 129
41,52 120
33,98 97
36,49 106
cov 85,1744
coef corr 0,97874641

50

45

40

35

30

25

20
72 92 112 132

2
La forma funcional corresponde a (una recta):

𝑌𝑖 = 𝑎 + 𝑏𝑋𝑖
El problema radica en que no conocemos a ni b. Una forma de obtener a y b es la
siguiente:

𝑎̂ = 𝑌̅ − 𝑏̂𝑋̅
∑(𝑌𝑖− 𝑌̅)(𝑋𝑖 − ̅̅̅
𝑋) 𝑆𝑥𝑦
𝑏̂ = =
∑(𝑋𝑖 − ̅̅̅
𝑋) 𝑆𝑥2

Coeficiente de determinación
Mide la parte de la variabilidad de Y (var dependiente) que viene explicada por la
regresión.
𝑅 2 = (𝑟)2
La principal propiedad del coeficiente de determinación es que varía entre 1 y o.
0 ≤ 𝑅2 ≤ 1

Ejercicio propuesto 2.

Con la información del archivo ventas, considerar como variable dependiente (venta
de la compañía) y como variable independiente (precio), obtener e interpretar:

 La covarianza.
 El coeficiente de correlación.
 La recta de la regresión.
 El coeficiente de determinación.

Ahora repita el ejercicio considerando como variable dependiente (venta de la


compañía) y como variable independiente (ingreso personal disponible).
Cuál de las dos variables explica mejor a la variable venta de la compañía.

3
IV. ANALISIS PROBABILISTICO
4.1. CONCEPTOS BÁSICOS DE PROBABILIDADES
Probabilidad
Puede definirse la probabilidad de un suceso como una constante en torno a la cual
tiende a estabilizarse la frecuencia relativa de ese suceso cuando se repite indefinidas
veces el experimento que lo genera.
Probabilidad es la posibilidad de que ocurra un evento en particular. Podría referirse
a:
 La posibilidad de escoger una carta negra en un juego de cartas
 La posibilidad de que una casa de la encuesta de bienes raíces selecciona de
forma aleatoria, tenga cocina a electricidad.
 La posibilidad de que un nuevo producto de consumo en el mercado tenga
éxito.
En términos generales, puede definirse la probabilidad de un suceso como una
constante en torno a la cual tiende a estabilizarse la frecuencia relativa de ese suceso
cuando se repite indefinidas veces el experimento que lo genera.
Experimento
Es toda acción sobre la cual vamos a realizar una medición u observación, es decir
cualquier proceso que genera un resultado definido.
Experimento aleatorio
Es toda actividad cuyos resultados no se determinan con certeza. Ejemplo: lanzar
una moneda al aire. No podemos determinar con certeza ¿cuál será el resultado al
lanzar una moneda al aire?, por lo tanto constituye un experimento aleatorio.
Espacio muestral y eventos
Un evento simple se puede describir mediante una sola característica. La colección
de todos los posibles eventos se conoce como espacio muestral.
Estos términos se pueden se pueden comprender mejor con un ejemplo: examínese
la baraja estándar de 52 cartas (4*13), en la que hay (4) cuatro palos (diamantes,
espadas, corazones y tréboles), cada uno tiene (13) cartas (as, rey, reina, sota, diez,
nueve, ocho, siete, seis, cinco, cuatro, tres, dos).
El espacio muestral consiste en todo el juego, 52 cartas.
El espacio muestral está compuesto por varios eventos. Si los eventos se clasifican
por palos, entonces hay 4 eventos (diamantes, espadas, corazones y tréboles). Si los
eventos se clasifican por el valor de la carta, entonces hay 13 eventos (as, rey, reina,
sota, diez, nueve, ocho, siete, seis, cinco, cuatro, tres, dos).
Otro ejemplo, al ser el espacio muestral el conjunto de todos los resultados
posibles que se pueden obtener al realizar un experimento aleatorio, considere el
experimento E: lanzar un dado; el espacio muestral correspondiente a este

4
experimento es: S = (1, 2, 3, 4, 5, 6); y un posible evento o suceso podría ser que salga
numero par , definimos el evento como A = sale número par = (2, 4, 6)
Recordemos que la regla de las probabilidades es que su valor oscila de 0 a 1.
Con el objetivo de analizar los conceptos básicos de probabilidades, utilizaremos la
siguiente tabla:
Ducha eléctrica
Total
Cuenta No cuenta
Cocina a Cuenta 72 8 80
electricidad No cuenta 7 146 153
Total 79 154 233

Probabilidad simple: se refiere a la probabilidad de que ocurra un evento simple,


también se la conoce como probabilidad marginal:
Ejemplo
Hallar la probabilidad de que la casa cuente con cocina eléctrica
P(ce)=80/233=0.34
P(ce)=no. Casas que tienen cocina eléctrica/ no. Total de casas en la muestra
P(de)=79/233= 0.34
Probabilidad conjunta: se refiere a fenómenos, que contienen dos o más eventos.
Se refiere a que tanto el evento A como el evento B tienen que ocurrir de forma
simultánea.
Ejemplo
Hallar la probabilidad de seleccionar una casa con cocina eléctrica y ducha eléctrica.
P(ce y de)=72/233=0.31
Puesto que hay 72 casas con cocina eléctrica y ducha eléctrica.
Regla de adición
P(AUB)=P(A o B)= P(A)+ P(B) –P(A y B)
P(ce o de)=P(ce) + P(de) – P(ce y de)= 0.34+0.34-0.31=0.37
Probabilidad condicional
Cuando se está calculando la probabilidad de un evento A en particular y, se tiene
información sobre la ocurrencia de otro evento, esta probabilidad se conoce como
probabilidad condicional, P(A/B).
P(A/B)=P(A y B)/P(B)
Donde:
P(A y B) es la probabilidad conjunta de A y B
P(B) es la probabilidad marginal de B

5
Ejercicio propuesto 3 (individual)

Un estudio de investigación de mercado revelo las preferencias por diferentes


deportes de hombres agrupados por edades. Se seleccionó una muestra de 1000
hombres y a cada persona se le pidió que señalara su deporte favorito. Los resultados
fueron los siguientes:

DEPORTE
Beisbol futbol básquet hockey Totales
Menos de 20 26 47 41 36 150
GRUPO 20-29 38 84 80 48 250
DE
EDAD 30-39 72 68 38 22 200
40-49 96 48 30 26 200
50 –mas 134 44 18 4 200
Totales 366 291 207 136 1000

Si el entrevistado se selecciona de forma aleatoria ¿Cuál es la probabilidad de que


a) Prefiera el beisbol?
b) Se encuentre entre 20 y 29 años de edad?
c) Se encuentre entre 20 y 29 años de edad y prefiera el futbol?
d) Tenga por lo menos 50 años de edad o prefiera el beisbol?
e) No prefiera el beisbol?
f) No prefiera el básquet?
g) Prefiera el hockey?
h) Se encuentre entre 40 y 49 años de edad y prefiera el futbol?

4.2. VARIABLES ALEATORIAS. MODELOS DE PROBABILIDAD


ASOCIADO AL CONCEPTO DE PROBABILIDAD
Los métodos estadísticos se aplican al estudio de fenómenos en cuya toma de
decisiones prevalecen condiciones de incertidumbre. Esta incertidumbre plantea al
investigador la necesidad de medirla, siendo la medida de la incertidumbre la
probabilidad está el concepto de variable aleatoria. Una variable aleatoria representa
el conjunto de valores que pueden observarse en un fenómeno aleatorio, valores que
dependen del azar y sobre los cuales es posible establecer una medida de su
probabilidad. Según el número de valores que puede tomar, la variable aleatoria
pude ser de dos tipos:
 Variable aleatoria discreta: si únicamente toma un número finito o
numerable de valores.

6
 Variable aleatoria continua: cuando puede tomar los infinitos valores
de un intervalo
Se denomina Distribución de probabilidad de una variable aleatoria a la función
que asigna probabilidad a los valores que puede tomar la variable.
Se denomina Función de distribución de una variable aleatoria X en el punto x a
la Función F(x) como:
F(x)=P(X<=x)
De esta forma, la función de distribución de la variable aleatoria X en el punto x es
la suma de todas las probabilidades contenidas en los puntos del intervalo (-OO, x]

4.2.1. VARIABLES ALEATORIAS DISCRETAS CON MODELOS


ESTÁNDAR
VARIABLE BINOMIAL

E(x)=np
V(x)=npq
Ejemplo
En una Facultad el 35% de los alumnos realiza algún deporte. Se ha obtenido una
muestra de 10 alumnos de dicha Facultad. Encontrar:
1. Esperanza y varianza de la variable.
2. Probabilidad de que más de 2 realicen algún deporte.
3. Probabilidad de que menos de la mitad realice algún deporte.

Ejemplo
Suponga que la probabilidad de tener una unidad defectuosa en una línea de
ensamblaje de máquinas es de 0.05. Cuál es la probabilidad de

7
1. Que entre 10, 2 unidades estén defectuosas
2. A lo sumo 2 se encuentren defectuosas
3. Por lo menos una se encuentre defectuosa.

Ejercicio propuesto 4
 El 20% de los trabajadores de una empresa ira a la huelga. Se seleccionan 5
trabajadores de dicha empresa. Obtenga
1. Probabilidad de que al menos tres vayan a la huelga
2. Probabilidad de que todos vayan a la huelga
3. Probabilidad de que no vaya ninguno
 Siete de cada diez estudiantes aprueba el primer parcial de una asignatura. Se
seleccionan 8 estudiantes al azar. Obtenga las probabilidades que se específica a
continuación
1. Probabilidad de que todos aprueben.
2. Probabilidad de que 3 o más aprueben.
3. Probabilidad de que ninguno apruebe

VARIABLE POISSON

Ejemplo
El número medio de accidentes ocurridos en una planta petrolera es de 2 accidentes
en 2 meses3.
1. Probabilidad de que haya más de 2 accidentes en 2 meses.
2. Probabilidad de que haya entre 2 y 8 inclusive, en 2 meses.
3. Probabilidad de que haya más de 2 accidentes en 1 mes.

8
Ejemplo
El número medio de automóviles que llega a una estación de gasolina es de 210 por
hora. Si dicha estación puede atender a un máximo de 10 automóviles por minuto,
determinar la probabilidad de que en un minuto dado lleguen a la estación de
suministro más automóviles de los que pueden atender. Hallar y representar
gráficamente la función de distribución de la variable aleatoria.

Ejercicio propuesto 5
 El número medio de robos con violencia que se registra en un barrio es de 4 al
mes. Determine las siguientes probabilidades
1. Probabilidad de que en un mes determinado no haya ningún robo de este tipo.
2. Probabilidad de que haya al menos uno en un mes dado.
3. Probabilidad de que haya entre 2 y 6, inclusive en un mes dado.
4. Probabilidad de que haya más de dos en 15 días.
 Suponiendo que las denuncias que realizan los trabajadores de cierta empresa a
la Inspección de Trabajo siguen un modelo Poisson de media 1.5 al año, obtenga
las siguientes probabilidades
1. Probabilidad de que en un año determinado la empresa no sea denunciada.
2. Probabilidad de que en un año dado se produzcan más de 4 denuncias
3. Probabilidad de que en el primer cuatrimestre del año se produzcan dos o más
denuncias.

4.2.2. VARIABLES ALEATORIAS CONTINUAS


DISTRIBUCIÓN NORMAL
La distribución normal N (μ, σ): es un modelo matemático que rige muchos
fenómenos. La experiencia demuestra que las distribuciones de la mayoría de las
muestras tomadas en el campo de la industria se aproximan a la distribución normal
si el tamaño de la muestra es grande. Esta distribución queda definida por dos
parámetros: la media μ y la desviación típica σ. Se presenta mediante una curva
simétrica conocida como campana de Gauss. Esta distribución nos da la
probabilidad de que al elegir un valor, éste tenga una medida contenida en unos
intervalos definidos. Esto permitirá predecir de forma aproximada, el
comportamiento futuro de un proceso, conociendo los datos del presente.

9
Una distribución normal de media μ y desviación típica σ se designa por N(μ, σ). Su
gráfica es la campana de Gauss:

Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la
izquierda y otra igual a 0.5 a la derecha. La probabilidad equivale al área encerrada
bajo la curva.
La distribución normal estándar, o tipificada o reducida, es aquella que
tiene por media el valor cero (μ =0), y por desviación típica uno (σ =1).

La probabilidad de la variable X dependerá del área sombreado en la figura. Y para


calcularla utilizaremos una tabla. Para poder utilizar la tabla tenemos que
transformar la variable X que sigue una distribución N(μ,σ) en otra variable Z que
siga una distribución N(0, 1).

Tipificación de la variable

10
Cálculo de probabilidades en distribuciones normales
La tabla nos da las probabilidades de P(z ≤ k), siendo z la variable tipificada.
Búsqueda en la tabla de valor de k Unidades y décimas en la columna de la izquierda
y Centésimas en la fila de superior.

11
Ejemplo
En una ciudad una de cada tres familias posee teléfono. Si se eligen al azar 90
familias, calcular la probabilidad de que entre ellas haya por lo menos 30 tengan
teléfono.
Ejemplo
Un estudio ha mostrado que, en un cierto barrio, el 60% de los hogares tienen al
menos dos televisores Se elige al azar una muestra de 50 hogares en el citado barrio.
Se pide: a) ¿Cuál es la probabilidad de que al menos 20 de los citados hogares tengan
cuando menos dos televisores? ¿Cuál es la probabilidad de que entre 35 y 40 hogares
tengan cuando menos dos televisores?
Ejercicio propuesto 5
 La media de los pesos de 500 estudiantes de un Instituto es 70 kg y la desviación
típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos
estudiantes pesan: a) Entre 60 kg y 65 kg. b) Más de 90 kg. c) Menos de 64 kg. d)
64 kg. e) 64 kg o menos.
 Se supone que los resultados de un examen siguen una distribución normal con
media 78 y varianza 36. Se pide: a) ¿Cuál es la probabilidad de que una persona
que se presenta el examen obtenga una calificación superior a 72? b) Si se sabe
que la calificación de un estudiante es mayor que 72 ¿cuál es la probabilidad de
que su calificación sea, de hecho, superior a 84?
 Suponga que un consultor está investigando cuanto tiempo necesitarían los
obreros de la fábrica para montar cierta pieza en una planta de automóviles y
determino (tiempo en segundos) que se distribuye con una normal con media 75
y desviación estándar de 6 segundos. Hallar la probabilidad de que un obrero
necesite entre 75 y 81 para terminar la tarea

12
4.2.3. INTERVALOS DE CONFIANZA
El problema que presenta la estimación puntual de un parámetro reside en que no
garantiza la precisión de la estimación. Por esta razón es necesario dar, junto a la
estimación, una medida del grado de confianza. Esto se consigue con los intervalos
de confianza que nos proporcione unos límites entre los cuales confiamos se
encuentre el valor desconocido del parámetro.
Intervalo de confianza para la media
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝑛−1, 𝛼 ≤ 𝜇𝑥 ≤ 𝑋̅ + 𝑡𝑛−1, 𝛼 )=1−𝛼
√𝑛 2 2 √𝑛
Intervalo de confianza para la varianza

𝜎̂ 2 2
𝜎̂ 2
𝑃 ((𝑛 − 2) ≤ 𝜎 ≤ (𝑛 − 2) )= 1−𝛼
𝑥𝛼2 𝑥2 𝛼
2 1− 2

Ejemplo:
Suponga que al Director de mercadotecnia de una cadena de tiendas necesita tomar
una muestra de mujeres con tarjetas de crédito para obtener información
relacionada al comportamiento de actitudes y compras. Para ello desea estimar la
cantidad promedio que gastan cada mes las mujeres de esa ciudad en compra de ropa
para uso personal. Se seleccionó una muestra aleatoria de 25 mujeres con tarjeta de
crédito y se pidió a las entrevistadas que determinen sus compras de ropa en el mes
anterior. Los resultados mostraron un promedio muestral de $us 86.40 y una
desviación estándar muestral de $us 37.5. Si el Director desea tener una confianza
del 95%, cual es el intervalo de confianza de la media obtenida?
Ejercicio propuesto 6
 El gerente de una empresa constructora desea estimar el avalúo promedio de
departamentos de una zona. Para ello obtuvo una muestra de 74 departamentos,
cuyo promedio de avalúo asciende a Bs. 215230 y que la desviación estándar es
Bs. 38490, si desea un intervalo de confianza del 99% hallar el intervalo de
confianza
 Se va a realizar durante un mes pruebas de mercado de un nuevo cereal para
desayuno. Los resultados para una muestra de 16 tiendas señalaron ventas
promedio de $us 1200 con una desviación estándar muestral de $us 180. Estime
el intervalo de confianza del 95% de las ventas promedio de este nuevo cereal.
4.2.4. PRUEBA DE HIPOTESIS
Una hipótesis estadística es simplemente una afirmación que se hace sobre una o
más características de una población. Para contrastar la hipótesis que se formula
acerca de la población podríamos tomar todos los elementos de la población, sin
embargo esto puede resultar costoso o puede no ser posible (n infinito). Entonces es
necesario observar una muestra aleatoria simple de la citada población.

13
El contraste de hipótesis es un procedimiento estadístico mediante el cual se
investiga la aceptación o rechazo de una afirmación acerca de una o varias
características de una población estadística.
Hipótesis Nula (Ho) es la hipótesis que se quiere contrastar, por tanto lo que se
acepta o se rechaza como conclusión del contraste.
Hipótesis Alternativa (Ha) es la hipótesis que nos sitúa frente a la Ho, de forma
que si se acepta la Ho, se rechaza la Ha, o de lo contrario si se Rechaza la Ho, se
acepta la Ha.
Error del tipo I, error que se comete en la decisión del contraste cuando se rechaza
la Ho, siendo correcta
Error del tipo II, error que se comete en la decisión de contraste cuando se acepta
la Ho., siendo falsa.
Prueba de dos colas
Ho: 𝜇𝑥 = 𝐴
Ha: 𝜇𝑥 ≠ 𝐴
Prueba de una cola
Ho: 𝜇𝑥 ≥ 𝐴
Ha: 𝜇𝑥 < 𝐴
Prueba de hipótesis para la media (cuando la desviación estándar poblacional
es conocida)
𝑥̅ − 𝜇𝑥
𝑍= 𝜎𝑥
√𝑛
Ejemplo:
Suponga que se obtuvo una muestra de 25 cajas de cereal con una media muestral
de 364.1 gramos y una desviación estándar poblacional de 15 gramos. El gerente
desea saber si funciona adecuadamente el proceso que asegure que en promedio,
en cada caja se está depositando 368 gramos.
Ejercicio propuesto 7
 La división de inspección del departamento de pesas y medidas está interesada
en estimar la cantidad real de refresco que se envasa en botellas de dos litros. La
planta embotelladora ha informado a la división de inspección que la desviación
estándar por botella es de 0.05 litros. Una muestra aleatoria de 100 botellas
mostro un promedio de 1.99 litros. Para un nivel de confianza de 95%, es posible
que la cantidad promedio en las botellas no fuera igual a 2 litros?
 Suponga que se conocen los resultados de una prueba de aptitud para la admisión
a estudios de grado en administración de empresas, los cuales tienen una
distribución normal con una media de 500 y una desviación estándar de la
población de 100. Si una muestra aleatoria de 12 solicitantes tiene una media

14
muestral de 537. Existe evidencia de que su resultado medio sea diferente de la
media esperada de todos los solicitantes, suponga un nivel de confianza del 99%
Prueba de hipótesis para la media (cuando la desviación estándar poblacional
no es conocida).
Existen casos en los que no se conoce la desviación estándar población, en esos casos
se puede optar por la desviación estándar muestral
𝑥̅ − 𝜇𝑥
𝑡𝑐 =
𝑆
√𝑛
𝑡𝑡 = 𝑡𝑛−1;𝛼
2
Ejemplo:
Suponga que se obtuvo una muestra de 25 cajas de cereal con una media muestral
de 364.1 gramos, se obtuvo una desviación estándar muestral de 17.3 gramos. El
gerente desea saber si funciona adecuadamente el proceso que asegure que en
promedio, en cada caja se está depositando 368 gramos.
Ejercicio propuesto 8
 El gerente de un banco deseaba estimar el importe promedio en cuentas de
ahorro de los depositantes. Se seleccionó una muestra aleatoria de 30
depositantes y los resultados señalaron un promedio muestral de $us 4750 y una
desviación estándar muestral de $us 1200. Existe evidencia que hace pensar que
la cantidad promedio que mantienen los depositantes en cuentas de ahorro es
diferente a $us 5000. Para su análisis utilice un nivel de confianza de 99%.
 La compañía de acero, entrega barras de acero con una longitud promedio de por
los menos 2.8 pies cuando el proceso funciona correctamente. De la línea de
producción se selecciona una muestra de 25 barras. La muestra señala una
longitud promedio de 2.43 pies y una desviación estándar de o.2 pies. La
compañía desea determinar si se necesita ajustar el equipo de producción.
a) Establezca la hipótesis nula y alterna
b) Si la compañía deseara probar la hipótesis al nivel de significancia de 5%, que
decisión se tomaría?
 La división de inspección del departamento de pesas y medidas está interesada
en estimar la cantidad real de refresco que se envasa en botellas de dos litros. La
planta embotelladora ha informado a la división de inspección que la desviación
estándar por botella es de 0.05 litros. Una muestra aleatoria de 100 botellas
mostro un promedio de 1.99 litros. Para un nivel de confianza de 95%, es posible
que la cantidad promedio en las botellas sea superior a 2 litros?
 El gerente de un banco deseaba estimar el importe promedio en cuentas de
ahorro de los depositantes. Se seleccionó una muestra aleatoria de 30
depositantes y los resultados señalaron un promedio muestral de $us 4750 y una
desviación estándar muestral de $us 1200. Existe evidencia que hace pensar que

15
la cantidad promedio que mantienen los depositantes en cuentas de ahorro es
superior a $us 5000. Para su análisis utilice un nivel de confianza de 99%.

16

S-ar putea să vă placă și