Sunteți pe pagina 1din 105

ESTADSTICA I

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 3

NDICE

Presentacin 5
Red de contenidos 6

UNIDAD DE APRENDIZAJE 1 Estadstica descriptiva


La estadstica 10
Poblacin y muestra 11
Variables 12
Tablas de distribucin de frecuencias 13
Medidas de tendencia central 20
Medidas de Posicin 27
Medidas de dispersin 28

UNIDAD DE APRENDIZAJE 2 Probabilidades


Anlisis combinatorio 38
Permutaciones 38
Combinaciones 39
Probabilidad clsica 42
Probabilidad condicional 43
Probabilidad total 43
Teorema de Bayes 44

UNIDAD DE APRENDIZAJE 3 Distribuciones de probabilidad


Experimento de Bernoulli 60
Distribucin Binomial 60
Distribucin de Poisson 61
Distribucin normal 67
Distribucin normal estndar 68
Teorema del lmite central 68
Aproximacin de la distribucin binomial a la distribucin normal 69
Distribucin muestral de medias 70
Distribucin muestral de proporciones 70

CIBERTEC CARRERAS PROFESIONALES


4

UNIDAD DE APRENDIZAJE 4 Anlisis de regresin y correlacin


Anlisis de regresin 86
Regresin lineal simple 86
Mtodo de mnimos cuadrados 87
Anlisis de correlacin 88

Tabla de distribucin binomial 97

Tabla de distribucin de Poisson 102

Tabla de distribucin normal estndar 104

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 5

Presentacin

El avance de las Tecnologas de Informacin y Comunicacin (TICs) ha hecho que, en la


actualidad, todo profesional est en constante contacto con informacin de naturaleza
estadstica. Es ms, muchas veces es necesario que cualquier profesional de cualquier
rea tenga que realizar alguna medicin estadstica para poder tener una idea acerca de
la marcha de una empresa, o para tomar una decisin organizacional o, finalmente, para
proyectar datos a futuro. El presente curso pretende ofrecer, al futuro profesional, las
herramientas estadsticas (tericas y de software) necesarias para organizar, calcular,
evaluar e interpretar informacin estadstica, haciendo nfasis en los fundamentos para
realizar dichos procesos.

As, se estudian los fundamentos tericos y prcticos de la Estadstica Descriptiva e


Inferencial, haciendo nfasis en la lgica de sus diferentes mtodos y tcnicas de trabajo
y los recursos de los que disponen para calcular y obtener las soluciones a los problemas
planteados. Adems, se adquiere destreza en la interpretacin y manejo de las
definiciones, teoremas y frmulas estadsticas.

En la primera parte del curso, se exponen las herramientas metodolgicas para recopilar,
organizar, presentar y analizar datos con la finalidad de describirlos o de realizar
generalizaciones. La segunda comprende la aplicacin de la teora de probabilidades y de
los modelos de distribucin probabilstica. Finalmente, en la tercera etapa, se desarrollan
modelos predictivos de regresin lineal simple que permiten contar con una herramienta,
estadsticamente confiable, para la toma de decisiones.

En las sesiones de teora, el curso se desarrolla en forma terico prctica; por lo que las
sesiones de clase tendrn exposiciones dialogadas sobre los fundamentos de los temas
que se tratarn y la resolucin de ejercicios, dndole mayor nfasis a esta ltima parte y al
anlisis e interpretacin de resultados.

Durante las sesiones de laboratorio, se emplear el uso del software de modelamiento


estadstico SPSS, con el cual se verificarn los fundamentos tericos y se resolvern
casos prcticos planteados en las guas de laboratorio.

CIBERTEC CARRERAS PROFESIONALES


6

Red de Contenidos

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 7

La estadstica como ciencia nos proporciona un conjunto de


mtodos, tcnicas o procedimientos para:

1. RECOPILAR 2. ORGANIZAR

3. PRESENTAR 4. ANALIZAR

un conjunto datos con el fin de describirlos o de realizar


generalizaciones vlidas con una medida de confiabilidad
(probabilidad) para tomar decisiones.

CIBERTEC CARRERAS PROFESIONALES


8

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 9

UNIDAD DE
APRENDIZAJE

1
ESTADSTICA DESCRIPTIVA

LOGRO DE LA UNIDAD DE APRENDIZAJE

Al trmino de la unidad, el alumno, trabajando de manera individual, calcula e


interpreta estadsticos de tendencia central, de posicin y de dispersin, sobre la base
de un conjunto de datos no agrupados o agrupados de una Tabla de Distribucin de
Frecuencias.

TEMARIO

La Estadstica

Poblacin y muestra

Variables y sus tipos

Tablas de distribucin de frecuencias

Medidas de tendencia central

Medidas de posicin

Medidas de dispersin

ACTIVIDADES PROPUESTAS

Los alumnos, trabajando de manera individual, construyen, calculan e interpretan


tablas de distribuciones de frecuencias, medidas de tendencia central, medidas de
posicin y medidas de dispersin, tanto para datos discretos como para datos
continuos.

CIBERTEC CARRERAS PROFESIONALES


10

1. LA ESTADSTICA

La Estadstica es una ciencia, parte de la matemtica aplicada, que trata acerca de la


recoleccin, organizacin, presentacin, anlisis e interpretacin de datos obtenidos
en un estudio; con la finalidad de facilitar la toma de decisiones. La Estadstica se
aplica a cualquier campo de la ciencia.

Asimismo, se divide en dos grandes grupos de trabajo:

Estadstica Descriptiva
Estadstica Inferencial

1.1. Estadstica Descriptiva

Es la rama de la Estadstica que se dedica a establecer diferentes mtodos y


procedimientos que permitan la recoleccin, organizacin, descripcin,
visualizacin y resumen de un conjunto de datos. Los datos pueden ser
resumidos numrica o grficamente.

1.2. Estadstica Inferencial

Es la rama de la Estadstica que proporciona tcnicas para estimar (predecir o


hacer inferencia) alguna caracterstica de una poblacin a partir de los
resultados obtenidos en una muestra. La inferencia estadstica siempre tiene
cierto grado de incertidumbre.

En el recuadro adjunto, proporcione tres ejemplos de aplicacin de la Estadstica


Descriptiva y tres ejemplos de aplicacin de la Estadstica Inferencial.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 11

2. POBLACIN Y MUESTRA

Definimos la POBLACIN o UNIVERSO de un proceso estadstico a la totalidad de


elementos entre los cuales se presenta determinada caracterstica susceptible de ser
estudiada. Estos elementos pueden ser personas, objetos, etc.

Definimos la MUESTRA como una parte o un subconjunto de la poblacin que se est


estudiando. Esta muestra se selecciona con el propsito de obtener informacin
acerca de toda la poblacin utilizando tcnicas de inferencia estadstica.

En el recuadro adjunto, proporcione tres ejemplos de poblacin con su respectiva


muestra.

CIBERTEC CARRERAS PROFESIONALES


12

3. VARIABLES

Es todo valor o caracterstica (magnitud, nmero, vector, etc.) de un elemento que


forma parte de la muestra y/o poblacin, que es susceptible de ser medido utilizando
algn instrumento de medicin. La determinacin de la(s) variables(s) contesta a la
pregunta: QU ESTOY ESTUDIANDO?

3.1. Variables cuantitativas

Son aquellas variables que son susceptibles de ser representadas


numricamente (indican cantidad).
Las variables cuantitativas se denominan DISCRETAS cuando la cantidad de
valores posibles que puede tomar la variable es finita; es decir, cuando estn
formadas solamente por una parte entera.
Las variables cuantitativas se denominan CONTINUAS cuando la cantidad de
valores posibles que puede tomar la variable es infinita; es decir, cuando estn
formadas por una parte entera y una parte decimal.

3.2. Variables cualitativas

Son aquellas variables que indican alguna cualidad, atributo o categora del
elemento estudiado. Se caracterizan porque por s mismos no proporcionan
valores numricos.
Las variables cualitativas se denominan ORDINALES cuando los datos
proporcionados por la variable son susceptibles de ser ordenados a travs de
una jerarqua.
Las variables cualitativas se denominan NOMINALES cuando no es posible
ordenar los datos bajo una determinada regla.

En el recuadro adjunto, proporcione tres ejemplos de cada uno de los tipos de


variables estudiadas.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 13

4. TABLAS DE DISTRIBUCIN DE FRECUENCIAS

Cuando los datos son recolectados, estos se deben ordenar y clasificar. Para realizar
esta tarea, los datos se pueden clasificar utilizando cuadros estadsticos y grficos
estadsticos.

Las Tablas de Distribucin de Frecuencias permiten la organizacin y presentacin de


un conjunto de datos de acuerdo con la variable estudiada. Se utilizan principalmente
cuando los datos son cualitativos o uno de los datos es cualitativo y el otro es
cuantitativo.

En estas tablas, el ordenamiento de los datos se realiza en funcin a algunos


parmetros bsicos que forman parte de la tabla. Estos parmetros son las
Frecuencias Absolutas (fi); Frecuencias Absolutas Acumuladas (Fi); Frecuencias
Relativas (hi) y Frecuencias Relativas Acumuladas (Hi).

4.1. Tabla de Distribucin de Frecuencias para datos discretos

Se utilizan cuando la variable es cuantitativa discreta. Se caracteriza porque no


hay que formar intervalos (no es necesario agrupar los datos)

EJEMPLO:
A continuacin, se muestra el nmero de hijos de 36 familias de Lima:

2 3 4 5 1 2 3 2 1
0 2 1 5 3 1 2 3 2
2 4 3 5 2 0 2 1 3
1 1 4 2 3 4 5 1 0

SOLUCIN:
La variable de estudio (X) es el nmero de hijos de 36 familiares. Luego,
construyendo la Tabla de Distribucin de Frecuencias, se tiene lo siguiente:

X fi Fi hi Hi
0 3 3 0,0833 0,0833
1 8 11 0,2222 0,3055
2 10 21 0,2778 0,5833
3 7 28 0,1944 0,7777
4 4 32 0,1111 0,8888
5 4 36 0,1111 0,9999
36 1

CIBERTEC CARRERAS PROFESIONALES


14

4.2. Tabla de Distribucin de Frecuencias para datos continuos

Se utilizan cuando la variable es cuantitativa continua. Se caracteriza porque se


requieren formar intervalos. Estas tablas introducen un nuevo parmetro
denominado MARCA DE CLASE (mi) que permite agrupar los datos en
intervalos.
Para formar los intervalos, se sigue la Regla de Sturges:

a) Determinar el nmero de intervalos (K): K 1 + 3.3Log(n)

b) Hallar el rango (R) de los datos: R = Xmx - Xmn

c) Determinar la amplitud (A) de los intervalos: A = R / K

d) Construir los intervalos: [ Li Ls >

1er. Intervalo: Li : Xmin Ls : Xmin + A

2do. Intervalo: Li : Xmin + A Ls : Xmin + 2A

3er. Intervalo: Li : Xmin + 2A Ls : Xmin + 3A

4to. Intervalo: Li : Xmin + 3A Ls : Xmin + 4A

Y as, sucesivamente, hasta llegar al ltimo intervalo.

e) Determinar la Marca de clase (mi) de cada intervalo: mi = (LI + LS)/2. La


marca de clase es el valor representativo del intervalo (Valor medio).

f) Hallar las frecuencias absolutas (fi) de cada intervalo, contabilizando el


nmero de datos de la muestra que pertenecen a cada intervalo.

g) Las frecuencias absolutas acumuladas (Fi), as como las frecuencias


relativas (hi y Hi) se hallan de la misma forma que para una distribucin de
frecuencias de variables cuantitativa discreta.

EJEMPLO:
Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un
examen:

33 50 61 69 80 35 52 64 71 81
35 53 65 73 84 39 54 65 73 85
41 55 65 74 85 41 55 66 74 88
42 57 66 76 89 45 59 66 77 91
47 48 60 68 78 97 60 67 77 94

SOLUCIN:

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 15

Aplicando la Regla de Sturges, encontramos que K 6,61 K = 7


El rango de los datos est dado por R = 97 33 = 64
Luego, la amplitud de los intervalos est dado por A = (64/7) = 9,143

Finalmente, construyendo la Tabla de Distribucin de Frecuencias, se tiene lo


siguiente:

Intervalos mi fi Fi hi Hi
[ 33 42,143 > 37,5715 7 7 0,14 0,14
[ 42,143 51,286 > 46,7145 4 11 0,08 0,22
[ 51,286 60,429 > 55,8575 9 20 0,18 0,40
[ 60,429 69,572 > 65,0005 11 31 0,22 0,62
[ 69,572 78,715 > 74,1435 9 40 0,18 0,80
[ 78,715 87,858 > 83,2865 5 45 0,10 0,90
[ 87,858 97 ] 92,4295 5 50 0,10 1
Total 50 XXX 1 XXX

Actividades
1. Una empresa dedicada a la fabricacin de conservas de pescado tiene planeado
introducir al mercado conservas de trucha. Para ello, le encarg a una empresa
investigadora de mercado la realizacin de un estudio mediante el que le interesaba
averiguar, entre otras cosas, la aceptacin del nuevo producto y el precio que las
personas estaran dispuestas a pagar. La encuesta fue realizada en Lima y se
entrevistaron a 250 personas. De los encuestados, el 67% estaran dispuestos a
consumir el nuevo producto. Adems, se concluy que el precio del producto debera
oscilar entre S/. 1,50 y S/. 2,5. Determine lo siguiente:
1.1. La poblacin y la muestra del estudio
1.2. Las variables y sus respectivos tipos
1.3. El o los tipos de estimaciones utilizadas en el estudio

CIBERTEC CARRERAS PROFESIONALES


16

2. Un empresario tiene la idea de implementar la venta de chicha morada en envase no


retornable. Piensa, en un principio que debe analizar la posibilidad de lanzar su
producto en lugares que sean clidos durante gran parte del ao. Para ello, realiza un
estudio de factibilidad en Piura e Iquitos. En Piura, el 90% de los 250 encuestados
est dispuesto a consumir el nuevo producto. En cambio, en Iquitos, el 85% de los
300 encuestados muestra esta disposicin. Tambin, obtuvo informacin acerca de la
utilidad que conseguira. En Piura, lograra un promedio de S/. 1,5 de utilidad por
producto y; en Iquitos, un promedio de S/. 2. Determine lo siguiente:
2.1. La poblacin y la muestra del estudio
2.2. Los estadsticos y/o parmetros si es que existen
2.3. Si tuviese que elegir entre una de las dos ciudades para llevar a cabo su
proyecto, cul debera elegir? Justifique.

3. La empresa XYZ realiz un estudio en la ciudad de Lima sobre de las principales


marcas de cerveza vendidas por el consorcio ABC, compuesto por los
supermercados S y W. El estudio se realiz en diciembre de 2009 y se entrevistaron a
un total de 1200 consumidores elegidos al azar, 500 en el supermercado S y 700 en
el supermercado W. Algunas de las informaciones se proporcionan a continuacin:

Las marcas de cerveza que se vendieron en el mes de agosto en estos


supermercados fueron Cristal, Pilsen, Cuzquea, y Bremen.
El 30% de los consumidores son de condicin media alta.
Tres personas que consumen no tienen preferencia por una marca en particular.
El 10% consume slo la marca Bremen.
El 15% de los que prefieren Pilsen viven en el Callao o en zonas aledaas.
El 45% afirm no tener problemas en consumir cualquier marca de cerveza.
Uno de los entrevistados pertenece a la clase media baja y prefiere la cerveza en
lata.
Doscientos consumidores del mercado S y 80 del supermercado W afirmaron que
la cerveza en lata presenta mejor sabor que en Six pack y que en envase
retornable.
Uno de los objetivos del estudio era estimar la verdadera cantidad de dinero
promedio que los consumidores gastan mensualmente en cerveza.

De acuerdo con el enunciado identifique lo siguiente:


3.1. La poblacin y la muestra del estudio
3.1. Las variables del estudio y los respectivos tipos

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 17

4. El siguiente conjunto de datos se refiere a los sueldos mensuales (en dlares) de 40


empleados de una empresa:

440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 557 432 591 428
440 340 558 460 560 607 382 671 512 492

Construya una tabla de distribucin de frecuencias pertinente.

CIBERTEC CARRERAS PROFESIONALES


18

5. A fin de decidir cuntos mostradores de servicio se necesitarn en las tiendas, una


cadena de supermercados quiso obtener informacin acerca del tiempo (en minutos)
requerido para atender a los clientes. Se registraron los siguientes tiempos:

3,6 1,3 0,8 1,3 1,1 0,8 1,0


0,3 0,9 0,7 3,1 2,2 1,6 1,9
0,4 5,1 1,8 0,3 1,1 0,6 0,7
1,1 1,9 2,1 0,3 0,8 1,0 1,4
1,1 0,5 1,2 0,6 0,8 1,7 0,2

Construya una tabla de frecuencias e interprete los valores de f2, m3 y H4.

6. El tiempo en minutos que demoran 30 alumnos de la seccin en terminar de contestar


esta pregunta es como se ve en la tabla:

3,36 4,28 2,32 3,12 3,86 2,92


2,08 3,26 2,42 4,00 2,12 2,68
2,18 4,28 2,22 3,96 3,36 2,12
4,14 2,02 2,82 3,96 2,42 4,24
3,22 4,02 2,68 3,86 2,92 3,56

Construya una tabla de distribucin de frecuencias donde se clasifiquen estos datos e


interprete los resultados obtenidos en m4, f1, F2, h4, H3

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 19

7. En un estudio sobre la opinin de los trabajadores de una empresa acerca de sus


ingresos. se ha obtenido los siguientes resultados:

Ingresos Hombres Mujeres


Muy inconforme 60 25
Inconforme 80 40
Resignado 95 95
Conforme 45 80

Establezca un grfico que permita comparar las opiniones de los hombres y mujeres
acerca de sus ingresos. Asimismo, indique qu grupo tiene un mayor porcentaje de
personas que no estn conformes con sus ingresos.

8. En una compaa, el sueldo mnimo de 200 empleados es de $ 150. Si se sabe que


20 empleados ganan al menos 150$, pero menos de $ 180; 60 ganan menos de
210$; 110 gana menos de $240; 180 ganan menos de $270; y el 10% restante de
empleados ganan a lo ms $ 300. Reconstruya la tabla de distribucin.

CIBERTEC CARRERAS PROFESIONALES


20

9. Los puntajes de una prueba de aptitud se tabularon en una distribucin de


frecuencias de 6 intervalos de igual amplitud. Se tienen las marcas de clase: m2 = 40
y m4 = 80. Adems, las frecuencias obtenidas fueron h1 = h6 ; h3 = h5 ; h4 = 0,25;
h2 = h4 - h1 ; h3 = h1 +0,10 y F6 = 60. Complete la distribucin de frecuencias.

5. MEDIDAS DE TENDENCIA CENTRAL

Los valores determinados como medidas de tendencia central son aquellos valores
que se toman como referencia para sealar y/o analizar el comportamiento de un
conjunto de datos. Estos valores tienen por objetivo reemplazar a todo un conjunto de
datos dentro de los anlisis y clculos estadsticos. Los ms utilizados son la Media
Aritmtica, la Mediana y la Moda

5.1. Media Aritmtica

Es la medida de tendencia central ms usada y la ms conocida. Se define


como la suma de todas las observaciones (datos) dividida entre el nmero de
observaciones. Constituye el valor representativo de los datos si es que entre
las observaciones no hay valores extremos que influyen negativamente
sucediendo lo mismo si los datos son muy dispersos. En algunos casos, la
Media Aritmtica o Promedio se suele interpretar como aquel valor que se
atribuira a cada trmino, si la suma de todos los valores de las observaciones
estuviera dividida en partes iguales entre todos los elementos de la muestra.
El clculo de la Media Aritmtica se muestra en el siguiente cuadro:

Para datos no Para datos agrupados


agrupados Discretos Continuos

X=
x .f i i
X=
m .f i i

X=
xi n n
n
X= x .h i i
X= m .hi i

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 21

Donde: xi : Valor observado


mi : Marca de clase
fi : Frecuencia absoluta
hi : Frecuencia relativa

Adems, hay que tener en cuenta la siguiente propiedad de la Media Aritmtica:


Cuando se tiene un conjunto p formado por r subconjuntos, los cuales tienen
una media X1, X2, X3, ., Xr y una cantidad de elementos igual a n1, n2, n3, , nr
respectivamente; entonces, la medida aritmtica de todo el conjunto p se
puede calcular de la siguiente manera:

X1n1 + X 2n2 + X 3n3 + ... + Xr nr


Xp =
n1 + n2 + n3 + ... + nr

5.2. Mediana

Es el valor que divide a un conjunto de datos ordenados en dos partes iguales.


Para datos no agrupados, el clculo de la mediana se realiza mediante la
siguiente regla:
Si el nmero de datos es impar, la mediana es el valor central del conjunto
de datos.
Si el nmero de datos es par, la mediana es el promedio aritmtico de los
datos centrales.
Para datos agrupados, el clculo de la Mediana se realiza de la siguiente
manera:

n / 2 Fj 1
Me = L j + A j
f
j

Donde: Lj : Lmite inferior del intervalo que contiene a la mediana


Fj : Frecuencia absoluta del intervalo que contiene a la mediana
Fj-1 : Frecuencia absoluta acumulada del intervalo anterior al que
contiene a la mediana
Aj : Amplitud del intervalo que contiene a la mediana

5.3. Moda

Es el valor que ms se repite (ms frecuente) dentro de un conjunto de datos.


La desventaja de la moda radica en que en un conjunto de datos puede existir
ms de un valor que indique la moda.
Para datos no agrupados, el clculo de la moda se realiza con un conteo de los
datos y analizando cul de ellos es el que ms repite (presenta una fi ms alto)

CIBERTEC CARRERAS PROFESIONALES


22

Para datos agrupados, el clculo de la Moda se realiza de la siguiente manera:

f j f j 1
Mo = L j + A j
( f j f j 1 ) + ( f j f j + 1 )

Donde: Lj : Lmite inferior del intervalo modal


fj : Frecuencia absoluta del intervalo modal
fj 1 : Frecuencia absoluta del intervalo anterior al intervalo modal
fj + 1 : Frecuencia absoluta del intervalo siguiente al intervalo modal

EJEMPLO DE APLICACIN

Los datos que a continuacin se muestran son las edades de las personas que han
acudido a un policlnico solicitando exmenes de despistaje de cncer.

63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

SOLUCIN:

Los datos requieren ser agrupados en una Tabla de Distribucin de Frecuencias.


Escogemos una agrupacin en 8 intervalos iguales. Entonces, la siguiente tabla
resultante es la siguiente:

Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 23

Luego, calculamos las medidas de tendencia central.

a) Para el clculo de la Media Aritmtica, se tiene lo siguiente:

(30 x1) + (38 x 2) + ( 46 x 4 ) + (54 x10 ) + (62 x16 ) + (70 x8) + (78 x3) + (86 x1)
X=
45
X = 60,044

b) Para la Mediana, observamos que sta se encuentra en el quinto intervalo.

45 / 2 17
Me = 58 + 8 = 60,750
16

c) Para la Moda, observamos que esta se encuentra en el quinto intervalo.

16 10
Mo = 58 + 8 = 61,429
(16 10 ) + (16 8 )

Actividades
1. A continuacin, se muestran los sueldos de los 35 empleados de una empresa:

250 350 450 780 591 289 358


485 540 675 551 850 328 428
470 258 500 600 300 548 752
300 620 360 528 284 820 700
460 490 510 480 568 800 690

1.1. Construya la Tabla de Distribucin de Frecuencias.


1.2. Determine las medidas de tendencia central.
1.3. Calcule el valor por encima del cual se encuentra el 80% de los datos.

CIBERTEC CARRERAS PROFESIONALES


24

2. En una librera determinada que vende enciclopedias, se contabiliz la cantidad de


ventas en los ltimos 81 das, y se obtuvo la siguiente informacin:

Enciclopedias Vendidas 0 1 2 3 4 5 6
Cantidad de das 7 11 18 20 19 1 5

2.1. Construya la Tabla de Distribucin de Frecuencias.


2.2. Interprete f1, F4, h3, H2.
2.3. Calcule las medidas de tendencia central e interprtelas.

3. Los sueldos mensuales (en dlares) de 60 empleados de la empresa Pirmide S.A.


son los siguientes:

440 560 335 587 613 400 424 466 585 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 557 432 591 428
440 340 558 460 560 607 382 671 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382

3.1. Construya la Tabla de Distribucin de Frecuencias.


3.2. Calcule las medidas de tendencia central e interprtelas.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 25

4. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos


alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a
cada uno. Si la empresa dispone a lo ms de S/. 94 000 para pagar sueldos, cul
alternativa es ms conveniente?

5. Un proveedor de servicios de Internet ha llevado a cabo un estudio para evaluar la


frecuencia de uso de este servicio en las dos facultades que existen. Se realiz una
encuesta a fines de octubre de 2005 en ambas facultades evalundose el nmero de
horas de uso del servicio de Internet y el gasto (nuevos soles) por el uso de dicho
servicio. Se obtuvo los siguientes resultados:

Minutos/da de Facultad A Facultad B


Internet Estudiantes Gasto Estudiantes Gasto
Menos de 20 20 2,5 7 2,6
[ 20 - 40> 30 3,8 10 3,5
[ 40 - 60> 140 6,0 20 6,4
[ 60 - 80> 150 7,8 35 8,1
[ 80 - 100> 50 9,6 65 10,1
[100 - 120] 10 11,5 23 12,3
Total 400 160

Efecte un anlisis comparativo sobre el tiempo de uso del servicio de Internet de los
estudiantes de ambas facultades. Utilice las medidas estadsticas necesarias.

CIBERTEC CARRERAS PROFESIONALES


26

6. El 40% de los sueldos de los empleados de una empresa es mayor o igual a 50 soles
pero menor de 60 soles; el 30% mayor o iguales a 60 soles pero menor de 70 soles;
el 15% de los empleados tienen como mnimo sueldos de 70 soles pero menores de
80 soles; y los sueldos del 15% restante son mayores o iguales a 80 soles pero como
mximo 100 soles. Halle la media aritmtica de los sueldos de los empleados.

7. El quinto ciclo de una facultad de ingeniera tiene tres secciones. La seccin A tiene
45 alumnos y la nota promedio en el curso de matemtica fue de 13. La seccin B
tiene 40 alumnos y la nota promedio en el mismo curso fue de 12. Por ltimo, la
seccin C tiene 35 alumnos y la media aritmtica de las notas en el curso de
matemtica fue de 15. Halle el promedio final del quinto ciclo de la mencionada
facultad de ingeniera.

8. Una institucin educativa tiene 20 profesores. La edad promedio de los profesores


casados, que son 12, es de 36 aos. La edad promedio de todos los profesores de la
institucin es 30 aos. Calcule la edad promedio de los profesores solteros.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 27

6. MEDIDAS DE POSICIN

Se denomina PERCENTIL k (k = 1,2,3,...,99) a la medida de posicin que determina


un valor numrico que denotaremos por Pk, que deja por debajo de s el k por 100
de los datos ordenados. As, el percentil 25 (P25) deja por debajo de s el 25% de
datos de la serie que se trate; el percentil 50 (P50) deja por debajo de s el 50% de
datos; el percentil 85 (P85) deja por debajo de s el 85% de datos de la serie que se
trate o que es lo mismo, deja por encima el 15% de los datos de la serie.

El clculo de percentil se realiza por interpolacin de la siguiente manera:

PK = LPk
n k

+ A
(
100
)
Fj 1
fj

Donde: LPk : Lmite inferior del intervalo que contiene a Pk


fi : Frecuencia absoluta del intervalo que contiene a Pk
Fi-1 : Frecuencia acumulada absoluta del intervalo inmediatamente
anterior al intervalo que contiene a Pk
A : Amplitud del intervalo

Se denomina CUARTIL a cada uno de los tres percentiles P25, P50, P75. El cuartil
uno (denotado por Q1) es igual a P25; el cuartil dos (denotado por Q2) es igual al
percentil P50 (que es la mediana); y el cuartil tres (denotado por Q3) es igual al
percentil P75.

Se denomina DECIL a cada uno de los nueve percentiles P10, P20, P30, P40, P50, P60,
P70, P80, P90 que dividen a todo el conjunto de datos en 10 partes iguales.

EJEMPLO DE CLCULO DE PERCENTIL

Para los 45 ingresos quincenales tabulados en la distribucin de frecuencias de 8


intervalos, los datos recopilados fueron los siguientes:

63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

Calcule los siguientes percentiles: P10, P25, P50, P75 y P90.

SOLUCIN:

En este caso, primero vamos a construir la tabla de distribucin de frecuencias y


luego calcularemos los percentiles solicitados

CIBERTEC CARRERAS PROFESIONALES


28

La Tabla de Distribucin de Frecuencias resultante es la siguiente:

Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1

Luego, calculamos los percentiles solicitados:


P10 = 42 + 8
(
45 10
100
)
3
a)
4 = 45


P 25 = 50 + 8
(
45 25
100
)
7
b) = 53 ,4
10


P50 = 58 + 8
(
45 50
100
)
17

c)
16 = 60 ,75


= 66 + 8
(
45 75
100
)
33

d) P75
8 = 66 ,75


P90 = 66 + 8
(
45 90
100
)
33
e) = 73 ,5
8

7. MEDIDAS DE DISPERSIN O VARIABILIDAD

Son aquellas medidas que se utilizan para analizar el grado de heterogeneidad de un


conjunto de datos. El grado de variabilidad de la informacin disponible es muy
importante en todo anlisis estadstico, pues de esto depende el grado de
confiabilidad de las estimaciones que se puedan establecer.

Las medidas de variabilidad que estudiaremos son la varianza o variancia, la


desviacin estndar y el coeficiente de variacin.

Cabe mencionar que para comparar la dispersin de dos conjuntos de datos es


preferible utilizar el coeficiente de variacin.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 29

7.1. Varianza o Variancia

Es una medida de dispersin que se define como la esperanza del cuadrado de


la desviacin de dicha variable respecto a su media. La varianza se calcula de
acuerdo con la siguiente tabla:

Para datos no Para datos agrupados


agrupados
Discretos Continuos

(X ) () (X ) .f n(X) (m ) .f n(X)
2 2 2
n X
2 2 2

V= i
V= i i
V= i i

n* n* n*

Donde: n* = n 1 si se trata de una muestra (n: tamao de la muestra)


n* = n si se trata de una poblacin (n: tamao de la poblacin)

7.2. Desviacin Estndar

Es la medida de dispersin ms utilizada en Estadstica Descriptiva, ya que


para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer tambin la
desviacin que representan los datos en su distribucin respecto de la media
aritmtica de dicha distribucin.
La Desviacin Estndar es una medida de dispersin que nos indica cunto
tienden a alejarse los valores concretos del promedio de una distribucin, es
decir, la Desviacin Estndar de un conjunto de datos es una medida de cunto
se desvan los datos con respecto a su media.
La Desviacin Estndar se calcula como la raz cuadrada de la varianza.

S= V
7.3. Coeficiente de Variacin

Es una medida de dispersin til para comparar dispersiones que se encuentran


en distintas distribuciones, pues es una medida invariante ante cambios de
escala.
El Coeficiente de Variacin siempre es menor que 1 pero mayor que 0 y se
suele expresar como porcentaje.
Para calcular el Coeficiente de Variacin, se emplea la siguiente frmula:

S
CV = x100
X

CIBERTEC CARRERAS PROFESIONALES


30

EJEMPLO DE CLCULO DE DISPERSIN

Si en una empresa A de 100 trabajadores el sueldo promedio es 500 soles, con una
varianza de 900 soles, y en la empresa B el coeficiente de variacin de los sueldos es
del 5.6%, qu podra afirmar acerca de la dispersin de los sueldos de las empresas
A y B?

SOLUCIN:
Como se trata de dos poblaciones diferentes, entonces requerimos el coeficiente de
variacin para poder compararlas.

Para la empresa A: X = 500 V = 900 S = 30

30
Entonces: CV = x100 = 6%
500
Para la empresa B: CV = 5,6%

Por lo tanto, podemos afirmar que, en la empresa A, los sueldos son ms dispersos
que en la empresa B. Igualmente, podemos afirmar que en la empresa B los sueldos
son ms homogneos que en la empresa A.

Actividades
1. En una prueba de aptitud mental, la menor y mayor puntacin fueron 50 y 200,
respectivamente. Los puntajes (sin decimales) se tabularon en una distribucin de
frecuencias simtrica de 5 intervalos de igual amplitud donde el 20% de los casos son
menores de 95 y el 70% de los casos son menores que 140. Halle el intervalo
centrado en la mediana donde se encuentran el 50% de los puntajes.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 31

6. El consumo mensual de agua (en metros cbicos) de una muestra de 225 viviendas
se tabul en una distribucin de frecuencias simtrica de cinco de amplitud iguales. Si
el consumo mnimo es de 35 m3, el consumo promedio de 45m3, y si 1/3 de la muestra
consume al menos 43m3 pero menos de 47m3, calcule lo siguiente:
2.1. Qu porcentaje de la muestra consume al menos 47 m3?
2.2. Cuntos metros cbicos como mnimo consumen el 60% de las viviendas?

7. La siguiente Tabla de Distribucin de Frecuencias muestra los resultados (sobre 100


puntos) de un resultado para un puesto de trabajo.

Intervalos mi fi Fi hi Hi
[ 26 34 > 30 1 1 0,022 0,022
[ 34 42 > 38 2 3 0,044 0,066
[ 42 50 > 46 4 7 0,089 0,154
[ 50 58 > 54 10 17 0,222 0,376
[ 58 66 > 62 16 33 0,356 0,732
[ 66 74 > 70 8 41 0,178 0,910
[ 74 82 > 78 3 44 0,067 0,977
[ 82 90 ] 86 1 45 0,022 1
Total 45 1

De acuerdo con el enunciado, identifique lo que se indica:


7.1. Qu porcentaje de datos est por debajo de 71?
7.2. Qu porcentaje de datos est por encima de 38?
7.3. Por debajo de que valor se encuentra el 27% de los datos?
7.4. Por encima de qu valor se encuentra el 65% de los datos?
7.5. Qu porcentaje de datos se tiene entre 52 y 75?

CIBERTEC CARRERAS PROFESIONALES


32

8. Los gastos mensuales en el uso de Internet de dos empresas se muestran a


continuacin:
Empresa A: Gasto promedio: 1 350 soles, Desviacin estndar: S/.78.
Empresa B: Gasto promedio: 1 450 soles, Desviacin estndar: S/.120.
Determine qu empresa tiene gastos mensuales ms homogneos. Justifique.

9. Una empresa de estudios de mercado ha realizado un trabajo, para estudiar, entre


otras variables el pago mensual por alquiler de departamentos (con caractersticas
similares) en los distritos A y B. La informacin recogida fue la siguiente:

Pago mensual por alquiler Nmero de Nmero de


(en $) Departamentos (Dist. A) Departamentos (Dist. B)
[350 , 400[ 10 9
[400 , 450[ 35 36
[450 , 500[ 70 60
[500 , 550[ 40 75
[550 , 600[ 25 90
[600 , 650[ 15 24
[650 , 700] 5 6

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 33

Con esta informacin, se calcularon los siguientes valores para el Distrito A:

Medida Estadstica Valor


Media Aritmtica 500
Moda 476,92
Variancia 4773,87
Primer Cuartil 457,14
Segundo Cuartil 489,29

9.1. Identifique la poblacin, muestra, variables y tipos de variable que puede


encontrar en el estudio.
9.2. Realice un anlisis comparativo de las distribuciones de montos mensuales por
alquileres de departamentos de los dos distritos.
9.3. Segn los contratos de alquiler, el impuesto municipal (15%) debe ser pagado
por el dueo del departamento, del mismo modo ste tambin paga el servicio
de mantenimiento del edificio $30. Cul es el valor del promedio aritmtico,
varianza, coeficiente de variabilidad de los ingresos netos por alquiler que
tienen los dueos de los departamentos? Explique.
9.4. Se considera que un distrito es ms residencial cuando el pago mensual por
alquiler es ms del 40% de los datos observados. Cul de los dos distritos se
podra considerar ms residencial?

CIBERTEC CARRERAS PROFESIONALES


34

10. Un conjunto habitacional est conformado por tres edificios de departamentos. De


estos edificios, se tiene los siguientes datos respecto al consumo mensual de
electricidad de cada uno de los edificios:
Edificio 1 : Tiene 12 departamentos que gastan en promedio 45 soles con una
desviacin estndar de 10 soles.
Edificio 2 : Tiene 9 departamentos cuyos consumos en soles son 38, 42, 56, 60,
43, 52, 41, 44, 53.
Edificio 3 : Los consumos se dan en la siguiente tabla:

Consumo en soles Departamentos


[30, 40[ 1
[40, 50[ 4
[50, 60[ 4
[60,70] 2

6.1. Cul de los edificios tiene menor consumo promedio de electricidad?


6.2. Cul es el consumo promedio en todo el conjunto habitacional?
6.3. En cul de los edificios el consumo es ms disperso?

11. Una prueba de conocimientos tipo A se calific sobre 20 puntos dando una media de
12 y una desviacin estndar de 2 puntos. mientras que una prueba de aptitud tipo B
se calific sobre 100 puntos, con una media de 70 y una desviacin estndar de 5.
7.1. En cul de las dos pruebas los puntajes son ms homogneos?
7.2. Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor rendimiento?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 35

Resumen

 Una manera de averiguar cul es la variable de un estudio estadstico es


preguntarnos lo siguiente: Qu es lo que estoy estudiando?

 Una misma variable estadstica puede tener distintas clasificaciones: puede ser
cualitativa o cuantitativa.

 Los estadgrafos o parmetros provenientes de variables cualitativas se representan


mediante proporciones (porcentajes); en cambio, los que provienen de variables
cuantitativas se representan, por lo general, mediante promedios.

 Mostrar la informacin a travs de una Tabla de Distribucin de Frecuencias permite,


a simple vista, sacar algunas conclusiones respecto al conjunto de datos que estamos
estudiando.

 Las Tablas de Distribucin de Frecuencias tienen como principal funcin facilitar el


clculo de los estadsticos o parmetros adecuados.

 Las Tablas de Distribucin de Frecuencias se pueden elaborar para datos discretos y


para datos continuos.

 En la actualidad, gracias a los distintos softwares existentes, el cuadro estadstico ha


pasado a ser una herramienta de referencia para elaborar grficos.

 El promedio es, por lo general, la medida que mejor representa los datos.

 Si los datos son muy dispersos o encontramos valores extremos es posible que el
promedio no sea representativo de los mismos. En este caso es mejor utilizar la
mediana.

 Cuando el clculo de las medidas de tendencia central se hace sobre la base de


cuadros de distribucin de frecuencias, los resultados son aproximados.

 Cuando la variable de estudio es ordinal, las medidas de tendencia central que se


utilizan son la MEDIANA y la MODA.

 Cuando la variable de estudio es escalar, las medidas de tendencia central que se


utilizan son la MEDIA, la MEDIANA y la MODA.

 Cuando en una distribucin de frecuencias la MEDIA, MEDIANA y MODA tienen el


mismo valor, se dice que es una DISTRIBUCIN SIMTRICA.

 Los percentiles nos brindan la misma informacin que nos proporciona la mediana,
pero en diferentes posiciones ya sea cuartiles, deciles, etc.

 Las medidas de posicin son tiles para establecer valores mnimos o mximos que
se deben lograr como pautas para mejorar el rendimiento de la produccin, de las
personas, etc.

 Una mayor dispersin de datos implica una menor concentracin de los mismos y
viceversa.

CIBERTEC CARRERAS PROFESIONALES


36

 Una mayor homogeneidad en los datos equivale a una menor dispersin de los
mismos y viceversa.

 A mayor coeficiente de variacin, mayor dispersin y, por lo tanto, menos


homogeneidad de los datos.

 El Coeficiente de Variacin nos permite determinar la representatividad del promedio


de un conjunto de datos, pues si es menor del 50% podemos considerar al promedio
como representativo de los datos. En caso contrario, se considera que los datos son
muy dispersos y, por lo tanto, no es recomendable utilizarla.

Bibliografa
 ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)

 WEIERS, RONALD
2006 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)

 MOYA CALDERON, RUFINO


2005 Estadstica descriptiva. Conceptos y aplicaciones. Ed. San Marcos.
(519.4 MOYA/E)

 CRDOVA ZAMORA, MANUEL


2003 Estadstica descriptiva e Inferencial. Ed. Moshera.
(519.5 CORD 2003)

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 37

UNIDAD DE
APRENDIZAJE

PROBABILIDADES

LOGRO DE LA UNIDAD DE APRENDIZAJE

Al trmino de la unidad, el alumno, trabajando de manera individual, calcula e


interpreta probabilidades simples, condicionales y totales, sobre la base de un conteo
de posibilidades acorde con determinadas condiciones de dependencia o
independencia estadstica.

TEMARIO

Anlisis combinatorio

Permutaciones

Combinaciones

Probabilidad clsica

Probabilidad condicional

Probabilidad total

Teorema de Bayes

ACTIVIDADES PROPUESTAS

Los alumnos, trabajando de manera individual, calculan e interpretan casos de


anlisis combinatorio y probabilidades clsicas, condicionales y totales.

CIBERTEC CARRERAS PROFESIONALES


38

1. ANLISIS COMBINATORIO

Es el conjunto de procedimientos que permiten determinar el nmero de resultados


de un experimento sin necesidad de conocer todos los resultados que de l se
originan. El anlisis combinatorio se basa en los dos principios bsicos: el principio de
la adicin y el principio de la multiplicacin.

1.1. Principio de la adicin

Dados dos experimentos A y B, el nmero de maneras posibles que puede


ocurrir el experimento A o B est dado por lo siguiente:

n(A o B) = n(A) + n(B)


Donde: n(A) : Nro. de formas distintas que puede ocurrir el experimento A
n(B) : Nro. de formas distintas que puede ocurrir el experimento B

1.2. Principio de la multiplicacin

Dados dos experimentos A y B, el nmero de maneras posibles que puede


ocurrir el experimento A y B est dado por lo siguiente:

n(A y B) = n(A) x n(B)

2. PERMUTACIONES

Una permutacin de un conjunto de elementos es un arreglo de los mismos siguiendo


un orden establecido, es decir, el cambio en el orden establecido SI genera casos
diferentes. Se pueden presentar los siguientes casos:

2.1. El nmero de permutaciones posibles de n elementos, todos distintos,


agrupados en sub grupos de n elementos diferentes es:

Pnn = n !

2.2. El nmero de permutaciones posibles de n elementos, todos distintos,


agrupados en sub grupos de r elementos diferentes es:

n!
Prn =
(n r ) !
2.3. El nmero de permutaciones posibles de n elementos, todos distintos,
agrupados en sub grupos de r elementos no necesariamente distintos (con
repeticin) es:

Prn( repeticin ) = nr

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 39

2.4. El nmero de permutaciones posibles de n elementos, no todos distintos y


donde se distingue n1 elementos iguales, n2 elementos iguales, hasta nk
elementos iguales (n1 + n2 + n3 +....+nk = n); agrupados en sub grupos de n
elementos es:

n!
Pnn1 ,n 2 ,n 3 ,..... n k =
n1!n 2 !n 3 ! n k !
Algunos ejemplos en los que se aplican las permutaciones son los nmeros que se
pueden formar con 3 cifras; la combinacin de 3 colores para hacer una camiseta; las
formas en que se pueden ordenar 10 personas en una fila, etc.

3. COMBINACIONES

Una combinacin de un conjunto de elementos es una seleccin de tales elementos


sin tener en cuenta el orden, es decir, el cambio en el orden de los elementos NO
genera un caso diferente.

El nmero de combinaciones de n elementos tomados de r en r (sub grupos de


r elementos) es:

n!
C nr =
r! (n r ) !
Algunos ejemplos en los que se aplican las combinaciones son el nmero de
apretones de mano en un reunin; seleccionar a los invitados de una fiesta;
seleccionar preguntas para un examen a partir de un banco de preguntas.

Actividades
1. De cuntas maneras se pueden colocar 10 chicas en una fila, de manera que dos
chicas en particular queden juntas?

CIBERTEC CARRERAS PROFESIONALES


40

1. De cuntas formas pueden ordenarse 5 personas en un sof si tienen solamente


tres asientos?

2. De cuntas formas pueden seleccionarse 6 preguntas de un total de 10?

3. Cuntos comits diferentes de 3 hombres y 4 mujeres pueden formarse con 8


hombres y 6 mujeres?

4. De cuntas maneras se puede confeccionar una bandera de franjas de 3 colores, si


se tiene tela de 5 colores distintos? Y si una de las franjas tiene que ser azul?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 41

5. Una persona tiene 15 amigos. De cuntas maneras puede invitar a 6 de ellos.


7.4. Si existen 2 parejas de casados y van siempre juntos a cualquier reunin.
7.5. Si existen dos personas que no deben estar en la misma reunin.

6. En una clnica, trabajan 18 enfermeras.


7.1. Cuntas guardias diferentes de 3 enfermeras pueden formarse?
7.2. Cuntas guardias diferentes de 3 enfermeras pueden formarse si dos ellas no
pueden trabajar juntas?

7. Se ha comprado una caja de focos que contiene 2 de 25 vatios, 3 de 50 vatios y 4 de


100 vatios. Si se escogen 3 de ellos, cuntos incluirn uno de cada potencia?

CIBERTEC CARRERAS PROFESIONALES


42

8. Diez amigos se encuentran en una fiesta. Cuntos saludos de mano se intercambian


si cada amigo estrecha la mano a todos los dems slo una vez?

9. En una biblioteca, hay 8 libros de geometra, 14 de lgebra, 10 de fsica y 5 de


qumica. De cuntas maneras un estudiante debe seleccionar cuatro libros si estos
deben ser de diferentes materias?

4. PROBABILIDAD CLSICA

La probabilidad es un nmero real que expresa la confianza o incertidumbre en la


ocurrencia de un evento cuyo resultado no se puede predecir con certeza.

4.1. Definicin clsica de probabilidad

Si un experimento aleatorio se puede realizar de n maneras posibles y


mutuamente excluyentes; y nA de ellos tiene una caracterstica A, entonces la
probabilidad que se obtenga un resultado con caracterstica A es:

nA
P( A ) =
n

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 43

4.2. Definicin axiomtica de probabilidad

Sea un experimento aleatorio E con espacio muestral y A un evento


cualquiera de . El nmero real P(A) es llamado probabilidad de ocurrencia del
evento A si satisface las siguientes condiciones:

0 P(A) 1

P() = 1

Si A y B son mutuamente excluyentes, entonces: P(A U B) = P(A) + P(B)

4.3. Propiedades y teoremas bsicos de probabilidades

Dados tres eventos A, B y C contenidos en el espacio muestral se cumple:

P() = 0

P(A U B) = P(A) + P(B) P(A B)

P(A) = 1 P(A)

P(AUBUC)=P(A)+P(B)+P(C)P(AB)P(AC) P(BC)+P(ABC)

5. PROBABILIDAD CONDICIONAL

Si A y B son dos eventos de un espacio muestral , entonces la probabilidad


condicional que ocurra el evento A dado que (si se sabe que) ocurri el evento B es:

P ( A B ) n( A B )
P( A / B ) = =
P (B ) n( B )

Cuando se aplica la Probabilidad Condicional hay que tener en cuenta el teorema de


la multiplicacin de probabilidades. Por este teorema, si dados tres eventos A, B y C
contenidos en el espacio muestral se cumple:

P(A B) = P(A).P(B / A) = P(B).P(A / B)

P(A B C) = P(A).P(B / A) .P(C / A B)

6. PROBABILIDAD TOTAL

Antes de definir la Probabilidad Total, debemos definir qu es una particin. Una


particin se da cuando los eventos B1, B2 y B3 forman una particin del espacio

CIBERTEC CARRERAS PROFESIONALES


44

muestral y son mutuamente excluyentes y colectivamente exhaustivos, por lo que


deben cumplir las siguientes condiciones:

B1 ; B2 ; B3

B1 B2 = ; B1 B3 = ; B2 B3 =

B1 U B2 U B3 =

Se define la Probabilidad Total de la siguiente manera: sean los eventos B1, B2 y B3,
los cuales forman una particin del espacio muestral y sea A otro evento cualquiera de
; entonces, la probabilidad de ocurrencia del evento A est dada por:

P(A) = P(B1 ) P A + P(B 2 ) P A + P(B 3 ) P A


B1 B2 B3

4. TEOREMA DE BAYES

Sean los eventos B1, B2 y B3; los cuales forman una particin del espacio muestral y
sea A otro evento cualquiera de , la probabilidad de ocurrencia de Bk (k = 1, 2, 3)
dado que ocurri el evento A est dada por:

P(B k ) P A
P B k = Bk
A P(B ) P A + P(B ) P A + P(B ) P A
1 B 2 B 3 B
1 2 3

P(B k ) P A
P k =
B Bk
A P(A )

Asimismo, se definen los Eventos Independientes de la siguiente manera: dos


eventos A y B son independientes estadsticamente si la ocurrencia de uno de ellos
no influye en la probabilidad de la ocurrencia del otro. Si es as, se debe cumplir:

P (A B ) = P (A ) x P (B )

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 45

Actividades
BLOQUE 1 (Probabilidad clsica)

1. Con 7 abogados y 4 mdicos se van a formar comits de 6 personas. Halle la


probabilidad de que se forme un comit en el cual se incluya lo siguiente:
1.1. Exactamente 2 mdicos
1.2. Por lo menos 2 abogados
1.3. Como mximo 3 mdicos

2. Una empresa que ofrece servicios de soporte informtico cuenta con 5 profesionales
que slo manejan Visual Basic, 4 manejan slo Unix y 3 que manejan Windows NT.
Una compaa le solicit que enven un equipo de tres personas. Calcule la
probabilidad que el equipo est formado por las siguientes personas:
2.1. Una persona que maneje slo VB, otra Unix y la otra Windows NT.
2.2. Personas que slo manejan una sola especialidad.
2.3. 2 personas que slo manejen Windows NT.

CIBERTEC CARRERAS PROFESIONALES


46

3. De 20 personas que contrajeron cierta enfermedad al mismo tiempo y que fueron


llevados a una misma sala de hospital, 15 se recuperan completamente en 3 das; al
cabo del cual, se escogen aleatoriamente 5 personas para un chequeo.
3.1. Cul es la probabilidad que los cinco sean dadas de alta?
3.2. Cul es la probabilidad que exactamente cuatro sean dadas de alta?
3.3. Cul es la probabilidad que ninguno sea dado de alta?

4. Ocho parejas de casados se encuentran en un saln. Si se escogen 2 personas al


azar, halle la probabilidad de que se cumpla lo siguiente:
4.1. Que sean esposos.
4.2. Que una sea mujer y el otro sea hombre.

5. Una urna A contiene 3 bolas rojas y 3 bolas negras, mientras que la urna B contiene 4
bolas rojas y 6 negras. Si una bola es extrada aleatoriamente de cada urna. Cul es
la probabilidad de que las bolas sean del mismo color?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 47

6. En una caja, hay 7 bolas rojas y 3 verdes. Se sacan dos bolas al azar de una en una.
Halle la probabilidad de que la primera sea roja y la segunda tambin si es que no
hay reposicin.

7. Ocho ejecutivos de una empresa llegan diariamente a su oficina en un automvil y lo


aparcan en una de las tres playas de estacionamiento con que cuentan. Si los
estacionamientos son escogidos al azar, cul es la probabilidad de que en un da
determinado se tenga 5 automviles en un estacionamiento, dos en otro y el restante
en el otro.

8. En una oficina donde se ensamblan computadoras, en una mesa hay 20 chips de los
cuales 6 estn malogrados. Primero llega el Sr. Gates y recoge 8 chips y ms tarde
llega el Sr. Apple y se lleva los restantes. Halle la probabilidad de que solamente uno
de ellos se haya llevado todos los chips defectuosos.

CIBERTEC CARRERAS PROFESIONALES


48

BLOQUE 2 (Probabilidad condicional)

1. En una universidad, el 70% de los estudiantes son de Ciencias y el 30% de Letras; de


los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%.
Si se elige aleatoriamente un estudiante, calcule la probabilidad que sea un
estudiante:
1.1. Varn, si es de Ciencias
1.2. Ciencias, si es varn
1.3. Ciencias y varn

2. Suponga en una oficina que hay 100 calculadoras de las cuales 60 son elctricas y
las otras son manuales. Adems, hay 70 mquinas nuevas mientras que las otras son
usadas. Hay 30 mquinas nuevas y manuales. Si se escoge una mquina al azar:
2.1. Cul es la probabilidad de que sea elctrica?
2.2. Cul es la probabilidad de que sea manual si se sabe que es usada?

3. La probabilidad de que un vuelo de programacin regular despegue a tiempo es 83%,


de que llegue a tiempo es 82% y de que despegue y llegue a tiempo es 78%.
Encuentre la probabilidad que un avin:
3.1. Llegue a tiempo dado que no despeg a tiempo.
3.2. Despegue a tiempo dado que lleg a tiempo.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 49

4. Un hombre tiene dos carros A y B que tienen problemas de arranque. La probabilidad


de que ambos arranquen es 0,1 ; la probabilidad de que arranque B y no A es 0,2 ;
la probabilidad de que ninguno de ellos arranque es 0,4. Halle la probabilidad de que:
4.1. El carro A arranque
4.2. Arranque A dado que B no arranc

5. La probabilidad de que un alumno apruebe Estadstica es de 2/3 y la probabilidad de


que apruebe Matemtica es 4/9. Si la probabilidad de aprobar al menos una de estas
materias es 4/5. Cul es la probabilidad de que apruebe ambos cursos?

6. En el mercado laboral, ltimamente tienen gran demanda aquellos profesionales con


conocimientos avanzados. Se sabe que el 15% de los que solicitan empleo slo
tienen conocimientos de Visual Basic, el 10% slo conoce Lenguaje C y el 5% slo
conoce Pascal. El 30% no tiene conocimiento de estas tres herramientas de
programacin. Tambin, se sabe que el 35% tiene experiencia solamente en dos de
los tres lenguajes de programacin.
6.1. Halle la probabilidad de que al entrevistar a un postulante a un puesto de
programador, este conozca Visual Basic, Lenguaje C y Pascal.
6.2. Halle la probabilidad de que un postulante conozca los 3 lenguajes si se sabe
que conoce al menos uno.

CIBERTEC CARRERAS PROFESIONALES


50

7. Un alumno de Cibertec est llevando Matemtica, Estadstica y Contabilidad. Por


experiencias anteriores, se sabe que la probabilidad de aprobar Matemtica es 0,7; el
de Estadstica 0,55; el de Contabilidad 0,5; el de Matemtica y Estadstica 0,3; el de
Matemtica y Contabilidad 0.35; el de Estadstica y Contabilidad 0,3 y los tres a la vez
0,2. Calcule la probabilidad de que el alumno:
11.1. Apruebe slo un curso.
11.2. Apruebe por lo menos dos cursos.
11.3. No apruebe algn curso.

8. En una ciudad, el 70% de los adultos escuchan radio, el 40% lee peridico y el 10%
ve televisin; entre los que escuchan radio el 30% lee peridicos y el 4% ve
televisin. El 50% de los que ven TV lee el peridico y slo el 2% de la poblacin total
lee peridico, ve TV y escucha radio. Si se elige una persona al azar, calcule la
probabilidad:
8.1. Que slo realice una de las tres actividades.
8.2. Sabiendo que lee peridico, que vea televisin.
8.3. Escuche radio o vea TV.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 51

BLOQUE 3 (Probabilidad total)

1. En un laboratorio, hay tres jaulas: en la jaula I hay tres conejos negros y dos blancos;
la jaula II tiene dos conejos negros y cuatro blancos; y en la jaula tres hay cinco
conejos negros y cinco blancos. Se selecciona al azar una jaula y se saca un conejo
al azar de esta jaula. Cul es la probabilidad de que el conejo escogido sea negro?

2. Del rcord pasado, se conoce que cierta mquina que produce tornillos trabaja
correctamente el 90% del tiempo. Si la mquina no trabaja correctamente, el 5% de
los tornillos producidos son defectuosos. Si se escoge un tornillo aleatoriamente.
Cul es la probabilidad de que este sea defectuoso?

3. Una urna contiene tres bolas rojas y X blancas. Se extrae una bola de la urna y se
reemplaza por una de otro color, se saca de la urna una segunda bola. Sabiendo que
la probabilidad de que la segunda bola sea roja es 17/50. Determine el nmero de
bolas blancas.

CIBERTEC CARRERAS PROFESIONALES


52

4. En una urna, hay dos bolas rojas y una negra. Hugo, Paco y Luis (en ese orden)
deben sacar, uno despus del otro, una bola sin restituirla posteriormente. Cul de
las tres personas tiene mayor posibilidad de sacar la bola negra?

BLOQUE 4 (Teorema de Bayes)

1. Una cadena de tiendas de venta de abarrotes desea uniformizar la red interna de


cada tienda. Cinco de las tiendas utilizan el sistema Windows NT, 8 de las tiendas
usan la red Novell y 7 usan Unix. Se sabe, por experiencia vivida, que en el 5% de las
horas de mayor congestin se cae el sistema que est operando con Novell; en el 8%
se cae el sistema que est operando con Windows NT y en el 10% se cae el sistema
que est operando con Unix.
1.1. Si un da cualquiera, en horas de mayor congestin, se cae el sistema. Cul es
la probabilidad de que haya sido en una tienda que est operando con Unix?
1.2. Si a usted le consultan acerca de qu sistema deberan utilizar todas las
tiendas, a fin de evitar que el sistema se suspenda en las horas de mayor
congestin, qu aconsejara? Base su respuesta en los datos del problema y
en criterios probabilsticos.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 53

2. Una compaa de desarrollo urbano est considerando la posibilidad de construir un


centro comercial en un sector de Lima. Un elemento vital en esta consideracin es un
proyecto de una autopista que une este sector con el centro de la ciudad. Si el
concejo municipal aprueba esta autopista, hay una probabilidad de 0,90 de que la
compaa construya el centro comercial en tanto que si la autopista no es aprobada la
probabilidad es de solo 0,20. Basndose en la informacin disponible, se estima que
hay una probabilidad de 0,60 que la autopista sea aprobada. Dado que el centro
comercial fue construido, cul es la probabilidad de que la autopista haya sido
aprobada?

3. La compaa que ensambla automviles Nen Gnesis se ha presentado a una


licitacin para ensamblar un nuevo modelo de automvil. La probabilidad de que
Nen Gnesis gane la licitacin es de 0,90 si una firma competidora Akira S.A. no se
presente a ella, en tanto que es de slo 0,20 si Akira S.A. se presenta. El gerente
general de Nen Gnesis estima que hay una probabilidad de 0,80 que Akira S.A. se
presente.
3.1. Cul es la probabilidad de que Nen Gnesis gane la licitacin?
3.2. Dado que Nen Gnesis gan la licitacin, cul es la probabilidad de que Akira
S.A. se haya presentado a ella?

CIBERTEC CARRERAS PROFESIONALES


54

4. Dos mquinas producen un mismo artculo. La probabilidad de que la mquina 1


produzca un artculo defectuoso es 0,01, mientras que la mquina 2 produce un
artculo defectuoso con probabilidad 0,02. De un gran lote de artculos producidos por
ambas mquinas se extrae uno al azar. Halle la probabilidad de que siendo el artculo
escogido defectuoso, este provenga de la mquina 1.

5. Una estacin meteorolgica suele acertar el 60% de las veces que pronostica da
lluvioso. La probabilidad de que acierte su pronstico dado de que el da no es
lluvioso es 0,8. Se sabe que la probabilidad de que llueva un da cualquiera es 0,25.
Cul es la probabilidad de que llueva si el pronstico es correcto?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 55

6. En un almacn de una firma de fusibles, se encuentra 80 cajas con 100 fusibles cada
una: 20 cajas contienen fusibles producidos por una empresa A, 30 cajas contienen
fusibles producidos por una compaa B, el resto de cajas contiene fusibles
producidos por una compaa C. A produce el 3% de artculos defectuosos, B el 5% y
C el 4% de artculos defectuosos. Si se selecciona una de estas cajas al azar, se
toma uno de sus fusibles y se encuentra que es defectuoso. Cul es la probabilidad
de que haya sido producida por B?

7. La compaa KANCIO est considerando comercializar una computadora. La


probabilidad de que la compaa tenga xito es 0,8 si es que una firma competidora
no introduce un producto similar en el mercado, en tanto que la posibilidad de xito es
slo del 40% si la firma competidora introduce un producto similar. KANCIO estima
que hay una probabilidad del 30% que la firma competidora comercialice el producto.
7.1. Calcule la probabilidad de que KANCIO no tenga xito.
7.2. Si KANCIO no tuvo xito, cul es la probabilidad de que la competencia haya
lanzado su producto?

CIBERTEC CARRERAS PROFESIONALES


56

8. El 100% de una poblacin de electores se divide en tres estratos sociales


excluyentes: baja, media y alta; de manera que la clase baja o media son el 90% del
total, y la clase media o alta el 40% del total. De los primeros sondeos realizados para
las prximas elecciones, se afirma que el porcentaje de electores que votaran por el
candidato D puede ser 30% de clase baja, 50% de clase media, 70% de clase alta. Si
se elige un elector al azar, cul es la probabilidad de que pertenezca a la clase alta
del electorado, si vota por el candidato D?

Resumen

 En el anlisis combinatorio, una conjuncin (y) implica una multiplicacin; en cambio,


una disyuncin (o) implica una suma.

 Debemos utilizar permutaciones si queremos cambiar, ordenar, arreglar, colocar,


situar, ubicar, etc. un conjunto de datos.

 Debemos utilizar combinaciones si debemos combinar, escoger, seleccionar, elegir,


etc.

 Para el anlisis estadstico, por lo general, no es necesario saber cules son los
elementos de un experimento, sino cuntos elementos son.

 Una probabilidad se puede interpretar como el porcentaje de veces que va a ocurrir


un determinado evento.

 La probabilidad NUNCA puede ser mayor que uno.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 57

 Los eventos tienen un comportamiento similar al de los conjuntos. Por ello, los
diagramas de Venn-Euler son bastante tiles en el clculo de probabilidades.

 En probabilidad condicional, uno de los eventos acta como condicionante y es un


evento que se expresa como que ya ocurri.

 Si dos eventos no pueden ocurrir simultneamente (eventos mutuamente


excluyentes), entonces su probabilidad condicional es cero.

 Si queremos calcular la probabilidad de ocurrencia simultnea o sucesiva de una


serie de eventos, debemos utilizar el teorema de multiplicacin de probabilidades.

 Si la probabilidad de ocurrencia de un evento depende del resultado que se haya


dado en un evento anterior, debemos utilizar el teorema de multiplicacin de
probabilidades.

 Si al calcular la probabilidad de ocurrencia de un evento y este depende de la


ocurrencia de otros eventos, debemos utilizar el teorema de la probabilidad total.

 El uso del teorema de probabilidad total se facilita utilizando diagramas de rbol o


cuadros de probabilidades.

 El teorema de Bayes nos permite calcular una probabilidad condicional en la que la


ocurrencia del evento condicionante depende de la ocurrencia de otros eventos. Es
por ello que previamente se debe calcular la probabilidad del evento condicionante
utilizando el teorema de probabilidad total.

 Si queremos calcular la probabilidad de ocurrencia simultnea o sucesiva de una


serie de eventos donde la ocurrencia de alguno de ellos no influye en la ocurrencia de
cualquier otro (no existe dependencia), debemos utilizar el teorema de ocurrencia
simultnea de eventos independientes.

Bibliografa
 MOYA CALDERON, RUFINO
2007 Probabilidad e inferencia estadstica. Editorial San Marcos.
(519.5 MOYA 2007)

 ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)

 DEVORE, JAY L.
2005 Probabilidad y estadstica para ingeniera y ciencias. Editorial Thomson
(519.5 DEVO 2005)

 WEIERS, RONALD
2007 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)

CIBERTEC CARRERAS PROFESIONALES


58

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 59

UNIDAD DE APRENDIZAJE

DISTRIBUCIONES DE PROBABILIDAD

LOGRO DE LA UNIDAD DE APRENDIZAJE

Al trmino de la unidad, el alumno, trabajando de manera individual, calcula e


interpreta la probabilidad de ocurrencia de un evento empleando distribuciones de
probabilidad para datos discretos y/o continuos.

TEMARIO

Experimento de Bernoulli

Distribucin Binomial

Distribucin de Poisson

Distribucin normal estndar

Teorema del lmite central

Aproximacin de la distribucin binomial a la distribucin normal

Distribucin muestral de medias

Distribucin muestral de proporciones

ACTIVIDADES PROPUESTAS

Los alumnos, trabajando de manera individual, identifican funciones de


probabilidad y calculan probabilidades utilizando la distribucin Binomial, la
distribucin de Poisson y la distribucin normal en sus diferentes casos de uso.

CIBERTEC CARRERAS PROFESIONALES


60

1. EXPERIMENTO DE BERNOULLI

Un experimento aleatorio es considerado un EXPERIMENTO DE BERNOULLI si


cumple con lo siguiente:

El experimento tiene solamente dos resultados posibles denominados xito y


Fracaso
La probabilidad de xito se mantiene constante cada vez que se realiza el
experimento.

Algunos ejemplos en que se presenta un experimento de Bernoulli son los siguientes:

Lanzar una moneda


Llegar a tiempo a una reunin
Escoger una persona capacitada en Estadstica
Aprobar el curso de Matemtica

2. DISTRIBUCIN BINOMIAL

Se aplica cuando un experimento aleatorio de Bernoulli es repetido n veces y


adems la probabilidad de xito se mantiene constante en cada una de las veces que
se realiza la prueba.

La Distribucin Binomial se utiliza cuando estamos interesados solamente en conocer


el nmero total de xitos en un proceso de n ensayos DISCRETOS al margen del
orden en que se presenten.

La funcin de probabilidad para la Distribucin Binomial es la siguiente:

P[X = k / B : n, ] = C ( ) (1 )
n k n k
k

Donde: X = Variable aleatoria


= Probabilidad de xito del experimento de Bernoulli
n = Nmero de pruebas de Bernoulli
K = Nmero de eventos con xito dentro de las n pruebas

Adicionalmente, en la Distribucin Binomial se tienen en cuenta los siguientes


parmetros:

Valor Esperado: E(x) = n.


Varianza: V(x) = n..(1 )

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 61

3. DISTRIBUCIN DE POISSON

Un experimento aleatorio es una DISTRIBUCIN DE POISSON si es que dicho


experimento expresa la probabilidad de un nmero k de eventos discretos que
ocurren en una frecuencia media conocida (denominada parmetro ) o intervalo
continuo.

El factor constituye el valor promedio de ocurrencias de eventos para el intervalo en


que est definida la variable aleatoria.

Algunos ejemplos en donde se presenta la distribucin de Poisson son los siguientes:

Cantidad de vehculos que llegan a un grifo durante una hora.


Cantidad de llamadas que llegan a una central telefnica por cada turno.
Cantidad de manchas de pintura en un mural por cada m2.
Cantidad de bacterias en cada cm3 de agua.
El nmero de servidores web accedidos por minuto.
Nmero de consultas a una base de datos por da.

La funcin de probabilidad para la Distribucin de Poisson es la siguiente:

e .k
P[X = k / P : ] =
k!
Donde: X = Variable aleatoria
= Valor promedio de ocurrencias para el intervalo en que est definida la
variable.
K = Nmero de eventos comprendidos en la frecuencia del parmetro

Adicionalmente, en la Distribucin de Poisson, se tienen en cuenta los siguientes


parmetros:

Valor Esperado: E(x) =


Varianza: V(x) =

4. RELACIN ENTRE LA DISTRIBUCIN BINOMIAL Y LA


DISTRIBUCIN DE POISSON

Cuando N tiende a infinito y es tal que el producto entre ambos parmetros tiende
a ser igual al parmetro ; entonces, la distribucin de la variable aleatoria Binomial
tiende, o sea, se puede aproximar, a una distribucin de Poisson. Para esto, la
equivalencia de parmetros es la siguiente:

= (n)
En la prctica, esta aproximacin se suele utilizar cuando es pequeo y el valor de n
es muy grande.

CIBERTEC CARRERAS PROFESIONALES


62

Actividades
BLOQUE 1 (Distribucin Binomial)

1. Si X denota el nmero de caras en un solo lanzamiento de 4 monedas, calcule lo


siguiente:
1.1. P (X = 3)
1.2. P (X < 2)
1.3. P ( X 2)
1.4. P (1 < X 3)

2. Si se lanzan 6 monedas al mismo tiempo, halle la probabilidad de obtener lo


siguiente:
2.1. Dos o ms caras
2.2. Menos de 4 caras
2.3. Por lo menos 4 caras
2.4. Calcule el valor esperado y la varianza de X

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 63

3. Se sabe que el 40% de las personas que se presentan a un empleo son altamente
capacitadas en el manejo de Visual Basic. Si 25 personas se presentan a un empleo:
3.1. Cul es la probabilidad de que 10 sean altamente capacitadas en VB?
3.2. Cul es la probabilidad de que por lo menos 2 sean altamente capacitadas en
el manejo de Visual Basic?

4. Una computadora no funciona el 20% de las veces que se prende. Cul es la


probabilidad de que en 10 intentos:
4.1. No funcione exactamente 5 veces.
4.2. No funcione por lo menos dos veces.
4.3. Funcione exactamente 4 veces.

5. Suponga que la mquina A produce el doble de artculos que la mquina B. Se sabe


que el 6% de los artculos que produce la mquina A son defectuosos, mientras que
el 3% de los artculos producidos por la mquina B son defectuosos. Suponga que se
junta la produccin diaria de estas mquinas y se toma una muestra aleatoria de 10
artculos. Calcule la probabilidad de obtener exactamente 3 artculos defectuosos.

CIBERTEC CARRERAS PROFESIONALES


64

6. Suponga que los motores de un avin de cierta marca, que operan


independientemente, tienen una probabilidad de falla de 0,1. Suponga que un avin
efecta un vuelo exitoso si al menos la mitad de sus motores operan normalmente.
Determine cul avin, uno con cuatro y otro con seis motores, tiene mayor
probabilidad de efectuar un vuelo exitoso.

7. Se ha elaborado un examen de seleccin mltiple consistente en 10 preguntas. Hay 5


respuestas posibles para cada pregunta. Suponga que ninguno de los estudiantes
que va a rendir el test concurri a clase o que no estudi para el examen. El profesor
que toma el examen ha establecido que para aprobar debe contestar correctamente
al menos 6 preguntas. Cul es la probabilidad de aprobar?

8. Se sabe que la probabilidad de que falle un sensor de temperatura de una incubadora


es de 0,35. En un hospital se han instalado dos incubadoras de los modelos A y B, la
incubadora A posee 6 sensores y la incubadora B posee 9 sensores. Suponga que
una incubadora realiza una medicin correcta de la temperatura de un beb si al
menos los dos tercios de sus sensores funcionan correctamente. Cul de los
modelos de incubadoras elegira?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 65

BLOQUE 2 (Distribucin de Poisson)

1. Una cajera de un supermercado puede atender en promedio a dos clientes por


minuto. Calcule la probabilidad para que:
1.1. Pueda atender a 5 clientes en el lapso de dos minutos.
1.2. Pueda atender por lo menos a dos clientes en el lapso de un minuto.

2. Los accidentes de trabajo, que se producen por semana en una fbrica, siguen la ley
de Poisson, de tal manera que la de probabilidad que haya 5 accidentes es 16/15 de
que haya 2.
2.1. Halle el parmetro de la distribucin de Poisson.
2.2. La probabilidad de que no haya accidentes en tres semanas.

3. Una de cada cinco veces que se lleg a un puente levadizo, ste se encontraba
levantado por lo que se tuvo que detener el auto para luego continuar el camino.
3.1. Calcule la probabilidad de que en las siguientes siete aproximaciones al puente
este no se halle levantado.
3.2. Cul es el nmero de veces que se espera encontrar el puente levantado?

CIBERTEC CARRERAS PROFESIONALES


66

4. Suponga que cierto alimento produce una reaccin alrgica en un 0,01% de una
poblacin grande. Si 100 000 personas comen este alimento diario en promedio:
4.1. Cul es la probabilidad de que 5 de ellos sean, alrgicos a este alimento?
4.2. Cul es el nmero esperado de personas con reaccin alrgica?

5. En una compaa, el sistema queda suspendido a razn de 2 veces por mes.


Determine la probabilidad de que:
5.1. En dos meses, el sistema quede suspendido por lo menos 4 veces.
5.2. En dos meses, el sistema quede suspendido ms de 5 veces, si se sabe que
luego de un mes el sistema ya qued suspendido una vez.

6. Suponga que cierta enfermedad rara afecta al 0,1% de la poblacin grande. Se


escogen aleatoriamente a 5000 personas de esta poblacin y son sometidos a un
examen para detectar la enfermedad.
6.1. Cul es el nmero esperado de personas con dicha enfermedad?
6.2. Cul es la probabilidad que exactamente 10 personas queden afectadas por la
enfermedad?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 67

5. DISTRIBUCIN NORMAL

La distribucin normal, tambin llamada distribucin de Gauss o distribucin


gaussiana, es la distribucin de probabilidad que aparece con ms frecuencia en
estadstica y probabilidades por las siguientes razones:

Su funcin de densidad (funcin matemtica de la distribucin) es simtrica y


con forma de campana, lo que favorece su aplicacin como modelo a gran
nmero de variables estadsticas.
Es lmite (aproximacin) de otras distribuciones.
Se relaciona con multitud de resultados ligados a la teora de las probabilidades
gracias a sus propiedades matemticas.

Algunos ejemplos de reas en donde se aplica la Distribucin Normal son los


siguientes:

Parmetros de mercadeo y de opinin


Tendencias electorales
Efectos fisiolgicos ocasionados por frmacos, virus, etc.
Caractersticas de consumo de cierto producto por un grupo de individuos
Caracteres psicolgicos como el cociente intelectual
Rendimiento y Ancho de banda en redes LAN y WAN
Nivel de ruido en Telecomunicaciones
Determinacin del tiempo de vida de equipos industriales

La Distribucin Normal tiene una funcin de densidad continua:

1 x 2

1


2
f (x) = e dx

2

Donde: X = Variable aleatoria


= Media Aritmtica
= Desviacin Estndar

CIBERTEC CARRERAS PROFESIONALES


68

6. DISTRIBUCIN NORMAL ESTNDAR

Una variable aleatoria continua Z tiene distribucin normal estndar si sigue una
distribucin normal con = 0 y = 1. Esto se suele denotar por: Z N (0,1)

La Distribucin Normal Estndar nos permite calcular la probabilidad de ocurrencia de


una variable aleatoria que sigue una distribucin normal cualquiera. Para ello,
previamente, se debe estandarizar (transformar) la variable aleatoria X con una media
cualquier y una desviacin estndar cualquiera a una nueva variable con las
caractersticas de la distribucin normal estndar; es decir:

X ~ N( , 2 ) Z ~ N(0 , 1)

Esta transformacin se realiza mediante la siguiente frmula:

x
z=

Este proceso de transformacin permite el uso de tablas estadsticas previamente
elaboradas, en las cuales se tienen los valores de probabilidad de la variable
normalizada Z. Con esto, el clculo de la probabilidad resulta ms prctico, sencillo y
rpido.

7. TEOREMA DEL LMITE CENTRAL

Se dice que N variables aleatorias X1, X2, X3,......, XN tienen la misma distribucin de
probabilidad con media y desviacin estndar , si tienen la misma funcin de
probabilidad en el caso de variable discreta, o una misma funcin de densidad en el
caso de variable continua.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 69

El Teorema del Lmite Central indica que, en condiciones muy generales, la


distribucin de la suma de variables aleatorias tiende hacia una distribucin normal
cuando la cantidad de variables es muy grande.

Entonces, si X1, X2, X3,......, Xn son n variables aleatorias independientes igualmente


distribuidas con media y desviacin estndar , entonces la distribucin de la
variable aleatoria:

Zn =
(X1 + X2 + X3 + .... + Xn ) n
n

8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA


DISTRIBUCIN NORMAL

Sabemos que una variable aleatoria discreta se distribuye binomialmente con


parmetros N y . Si se define la variable X = X1 + X2 + X3 + .. + Xn, donde cada Xi
es una variable aleatoria de Bernoulli con valor esperado y varianza n(1-) y,
adems, N es grande y tiende a 0.5 se puede aproximar la distribucin Binomial a la
distribucin normal.

X N [n , n (1 - )]

En la prctica, la aproximacin resulta ms adecuada cuando n > 5


Al usar la distribucin normal como una aproximacin de la binomial, se aproxima la
distribucin de una variable aleatoria discreta con la de una variable aleatoria
continua; por lo que se debe hacerse una correccin por continuidad segn la
siguiente tabla:

Probabilidad Correccin de Continuidad

P (X = k) P [(k 0,5) X (k + 0,5)]


P (k1 X k2) P [(k1 0,5) X (k2 + 0,5)]
P(X < k) P [X (k 0,5)]
P (X k) P [X (k + 0,5)]
P(X > k) P [X (k + 0,5)]
P (X k) P [X (k 0,5)]

De esta manera, en la aproximacin de la distribucin Binomial a la distribucin


Normal, la distribucin de la variable aleatoria se realiza de la siguiente manera:

X 0,5 n
Z=
n(1 )

CIBERTEC CARRERAS PROFESIONALES


70

9. DISTRIBUCIN MUESTRAL DE MEDIAS

Una distribucin muestral de medias se presenta cuando una MUESTRA aleatoria de


tamao n es extrada de una POBLACIN que posee distribucin normal con media
y desviacin estndar .

Si una muestra aleatoria de tamao "N" es extrada de una poblacin con distribucin
dada, con media y desviacin estndar , entonces la distribucin de la variable
aleatoria con media muestral (X ) se aproxima cada vez ms a una distribucin
normal cuando "n" tiende al infinito; es decir:

X N (X , X )

As, la distribucin de la variable aleatoria para una distribucin muestral de medias


se realiza de la siguiente manera:

( X ) n
Z=

Sin embargo, cuando la muestra de tamao n es extrada de una poblacin finita N
sin reemplazamiento con media aritmtica y desviacin estndar , la media
muestral debe multiplicarse por el factor de correccin relacionado con su poblacin
N. As, para los casos en que hay que aplicar esta correccin, la distribucin de la
variable aleatoria ser la siguiente:
(X ) n
Z =
Nn

N 1

10. DISTRIBUCIN MUESTRAL DE PROPORCIONES

Si una muestra aleatoria de tamao "n" es extrada de una poblacin con distribucin
dada, con proporcin poblacional , entonces la distribucin de la variable aleatoria
de una proporcin muestral (p) se aproxima cada vez ms a una distribucin normal
cuando "n" tiende a infinito; es decir:

p N ( p , p )
As, la distribucin de la variable aleatoria para una distribucin muestral de medias
se realiza de la siguiente manera:

X
Z=
(1 )
n
Ntese que representa la probabilidad de xito de un experimento de Bernoulli.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 71

Al igual que la Distribucin Muestral de Medias, cuando la muestra de tamao n es


extrada de una poblacin finita N sin reemplazamiento, la distribucin debe
multiplicarse por el factor de correccin relacionado con su poblacin N. As, para
los casos en que hay que aplicar esta correccin, la distribucin de la variable
aleatoria ser:

Z=
X 1
2n
( )
(1 ) N n
n N 1

Asimismo, cuando la muestra n es pequea, es necesario introducir un factor de


correccin de continuidad igual a 1/2n. As, cuando se presenta este caso, se tiene:

X 1
Z= 2n
(1 )
n

Actividades
BLOQUE 1 (Distribucin Normal Estndar)

1. Los pesos de las impresoras marca ZZ se distribuyen normalmente con media 1,5 kg.
y desviacin estndar 0,3 kg. Determine lo siguiente:
1.1. La probabilidad de que una impresora elegida al azar pese menos de 1,3 Kg.
1.2. El porcentaje de impresoras que pesan entre 1,4 y 1,65 Kg.
1.3. Si la produccin de impresoras es de 5 000, cuntas pesan ms de 1,75 Kg.?

CIBERTEC CARRERAS PROFESIONALES


72

2. El tiempo que demora cargar un sistema se distribuye normalmente con media 20


seg. Y desviacin estndar de 2,5 seg. Determine lo siguiente:
2.1. La probabilidad de que el sistema se demore en cargar menos de 18 seg.
2.2. El porcentaje de veces que el sistema se demora en cargar ms de 21 seg.

3. Del aeropuerto al centro de la ciudad se puede llegar mediante dos caminos. Si se


viaja por el camino A, el tiempo est distribuido normalmente con media 27 minutos y
varianza de 25 minutos. Si se viaja por el camino B, el tiempo est distribuido
normalmente con media 25 minutos y desviacin estndar de 12 minutos. Por cul
camino es preferible ir al centro de la ciudad si se dispone de 30 minutos?

4. La presin sangunea media en hombres de 20 a 25 aos de edad es 123 unidades


con desviacin tpica de 13,7 unidades. Si se selecciona al azar uno de estos
hombres, calcule la probabilidad de que su presin sangunea est comprendida
entre 120 y 128 unidades. Suponga una distribucin normal.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 73

5. Se ha encontrado que el tiempo de servicio que se requiere por persona en una caja
bancaria tiene una distribucin aproximadamente normal con media de 130 segundos
y varianza de 2025 segundos.
5.1. Calcule la probabilidad de que se requiera menos de 100 segundos
5.2. Cul es el tiempo mnimo que utilizan el 20% de las personas que ms se
demora?

6. El bar Un par ms ha instalado una mquina automtica para la venta de cerveza.


La mquina puede regularse de modo que la cantidad media de cerveza por vaso
sea la que se desea; sin embargo, en cualquier caso esta cantidad tendr una
distribucin normal con una desviacin estndar de 5,9 mililitros.
6.1. Si el nivel se ajusta a 304,6 mililitros, qu porcentaje de los vasos contendrn
menos de 295,7 mililitros?
6.2. A qu nivel medio debe ajustarse la mquina para que slo el 2,28% de los
vasos contengan menos de 295,7 mililitros?
6.3. A qu nivel medio debe ajustarse la mquina para que el 84,13% de los vasos
contenga menos de 313,6 mililitros?

CIBERTEC CARRERAS PROFESIONALES


74

7. Una fbrica de neumticos hace una prueba para medir la duracin de sus llantas y
verific que la duracin de las llantas tena distribucin normal, con media 48000 Km.
y desviacin estndar de 2000 Km. Si se sabe que las llantas se venden asegurando
que duran ms de 45 000 Km., cul es la probabilidad de que de 5 llantas vendidas,
exactamente tres tengan una duracin menor a la asegurada?

8. Se est construyendo un grupo de 100 casas en la urbanizacin San Borja. El


material empleado en las redes de desage es tal que el 9,512% de las tuberas de
desage tiene periodos de duracin que exceden los 15 aos y que el 62,556%
tienen perodos de duracin que exceden los 9 aos. Considerando que la
distribucin de probabilidad de los periodos de duracin de estas tuberas es normal,
determnese la media y la varianza de esta distribucin.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 75

BLOQUE 2 (Teorema del Lmite Central)

1. Los pesos de los paquetes recibidos en un departamento de almacenamiento tienen


una media de 300 libras y una desviacin tpica de 50 libras. Cul es la probabilidad
de que el peso de 25 paquetes recibidos al azar y cargados en un ascensor supere el
lmite de seguridad del ascensor, que es de 8200 libras?

2. Una linterna grande es alimentada por cinco bateras. Suponga que la vida de una
batera est normalmente distribuida con media de 120 horas y varianza de 100
horas. La linterna dejar de funcionar si se agota una o ms de sus bateras.
Suponiendo que las vidas de las bateras son independientes, cul es la
probabilidad que la linterna funcione ms de 100 horas?

3. El peso de las impresoras marca XX modelo G 1560 se distribuye normalmente con


media 1,2 Kg. y con desviacin estndar de 0,6 Kg. Estas impresoras se colocarn en
cajas que pueden soportar como mximo 16 Kg. Cul es la probabilidad de que 11
impresoras colocadas en una de las cajas supere la capacidad de carga de la misma?

CIBERTEC CARRERAS PROFESIONALES


76

4. Un camin de reparto transporta cajones cargados de artculos varios. Si el peso de


cada cajn se distribuye normalmente con media 50 lb. y una varianza de 25 lb.
Cuntos cajones pueden ser transportados en el camin de tal forma que la
probabilidad de que la carga total exceda a 1 tonelada sea slo 0,10?
Asuma: 1Tn = 2204 libras

5. Un motor industrial tiene una vida promedio de 5200 horas con una desviacin
estndar de 530 horas. En una planta de refrigeracin, se instalan 3 de estos
motores: uno principal y los otros dos de reserva, de manera que cuando uno falla,
otro lo reemplazar de manera automtica. Si la vida de cada motor es
independiente, cul es la probabilidad de que los motores de la planta funcionen en
conjunto al menos 15500 horas pero menos de 15800 horas?

6. Suponga que los pesos de los pasajeros que viajan por aire en los vuelos
establecidos que parten de un aeropuerto grande siguen una distribucin normal con
media de 78kg. y varianza de 100 kg. Encuentre los lmites (simtricos alrededor de la
media), de tal manera que el 95% de los pasajeros tengan un peso lmite dentro de
estos valores. Cul es la probabilidad de que el peso total de una muestra al azar de
100 pasajeros exceda a 8 000 Kg.?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 77

BLOQUE 3 (Aproximacin de la Distribucin Binomial a la Distribucin Normal)

1. Una firma comercializa sus productos va Internet a una lista de 100 000 clientes
potenciales para decidir acerca de la comercializacin de un nuevo producto. La firma
selecciona una muestra de 100 personas para ofrecerles dicho artculo. Si 30 o ms
de estos clientes estn dispuestos a adquirirlo, se proceder a su comercializacin.
1.1. Cul es la probabilidad de que comercialice el artculo si en realidad slo el
20% de todos los clientes lo comprasen?
1.2. Cul es la probabilidad de que comercialice el artculo si en realidad slo el
36% de todos los clientes lo comprasen?

2. En un almacn, se tienen 300 fusibles, y por experiencia se sabe que hay un 2% de


defectuosos en la produccin de fusibles.
2.1. Calcule la probabilidad de que exista exactamente un fusible defectuoso.
2.2. Calcule la probabilidad de que no haya ms de 5 fusibles defectuosos.

3. En una poblacin grande de moscas, el 25% tiene mutacin de alas. Una muestra de
300 insectos es escogida al azar. Calcule la probabilidad de que ms de 60, pero no
ms que 90 insectos de la muestra, tengan mutacin de alas.

CIBERTEC CARRERAS PROFESIONALES


78

4. Cierto virus ha invadido una escuela y ataca a la mitad de los estudiantes. Si se toma
una muestra aleatoria de 200 alumnos, calcule la probabilidad de que:
4.1. En dicha muestra, el 49% sea atacada por el virus.
4.2. En la misma muestra, ninguno presente sntomas del virus.

5. Suponga que un 10% de las llantas de un fabricante tienen defectos en la superficie, y que
los embarca en lotes de 100.
5.1. Cul es la probabilidad de que un lote contenga 8 menos llantas con defectos en
su superficie?
5.2. Un comprador mayorista recibe 500 lotes. Cul es la probabilidad de que al menos
140 lotes contengan 8 menos llantas con defectos en la superficie cada uno?

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 79

BLOQUE 4 (Distribuciones Muestrales)

1. Las lmparas que fabrica cierta empresa tienen una vida de 800 hrs. y una desviacin
tpica de 60 hrs. Halle la probabilidad de que una muestra aleatoria de 16 lmparas
tengan una vida media entre 769 y 810 hrs.

2. Estudios recientemente realizados determinaron que hay una probabilidad de 0,40 de


que un sistema quede infectado por un virus a travs de Internet. De un grupo de 50
computadoras conectadas a Internet, cul es la probabilidad de que por lo menos
23, pero no ms de 25, queden infectadas?

3. Se sabe que la probabilidad de falla de la tarjeta integrada de un computador es 0,12.


Si se compran 50 computadoras, halle la probabilidad de que queden inutilizadas ms
de 15 computadoras.

CIBERTEC CARRERAS PROFESIONALES


80

4. Ciertos tubos fabricados por una compaa tienen una duracin media de 800 horas y
una desviacin estndar de 60 horas. Halle la probabilidad de que una muestra al
azar de 196 tubos, tomada entre ellos, tenga una duracin media:
4.1. Entre 790 y 810
4.2. Menor de 785 horas

5. Una firma de pedidos por correo sabe por experiencias anteriores que de las
circulares que enva por correo, el 10% tendr respuesta. Suponga que se envan 20
circulares como prueba de mercado en una regin geogrfica. Adems, suponiendo
que se puede aplicar la tasa de respuestas del 10% en la nueva regin, calcule la
probabilidad de que menos del 20% de la gente responda. Asimismo, calcule la
probabilidad de que contesten entre el 25% y 35% de la gente.

6. Un sistema est formado por 100 componentes que funcionan independientemente.


La probabilidad de que cualquier componente falle durante el periodo de operacin es
igual a 0,10. Si el sistema s funciona al menos con 85 componentes, calcule la
probabilidad de que no funcione el sistema.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 81

7. Una empresa multinacional tiene una poblacin de 250 vendedores. Estos


vendedores tienen un nivel medio de ventas de 5200 dlares con una desviacin
estndar de 1200 dlares. Si se seleccionan al azar una muestra de 20 vendedores,
cul es la probabilidad de que su nivel de ventas est comprendido entre 5000 y
5800 dlares?

8. Un jugador peruano de ftbol acierta 3 de 5 disparos penales. Suponiendo que


durante toda su carrera realiza 120 lanzamientos, determine la probabilidad de que
anote por lo menos 45 goles.

CIBERTEC CARRERAS PROFESIONALES


82

Resumen

 En una distribucin Binomial y una distribucin de Poisson, se debe tener en cuenta


que la variable por estudiar debe ser discreta.

 Para un proceso Binomial, se debe tener en cuenta la muestra por estudiar y la


probabilidad de xito.

 Para un proceso de Poisson, se debe tener en cuenta la ocurrencia de eventos


discretos en un intervalo continuo.

 Cuando la cantidad de eventos es muy grande, la Distribucin Binomial puede


aproximarse a la Distribucin de Poisson.

 En una distribucin normal, se debe tener en cuenta que la variable que se estudia
debe ser continua.

 Para una distribucin normal estndar, se debe tener en cuenta la media promedio y
la desviacin estndar.

 Para el mejor manejo de las tablas, el valor encontrado debe aproximarse a la


milsima.

 En el uso de Teorema de Lmite Central, se debe tener en cuenta que las n


variables aleatorias independientes por estudiar deben ser continuas.

 El uso de la aproximacin de la distribucin binomial a la normal se realiza cuando la


muestra sea grande.

 Para un proceso de aproximacin, debe tenerse en cuenta los parmetros tomados


para la aproximacin.

 Los valores de las muestras con sus respectivas distribuciones son considerados
vlidos para cualquier poblacin finita o infinita, discreta o continua cuando n es
mayor o igual a 30.

 Si la poblacin es normal, los teoremas sobre distribuciones muestrales se cumplen


cualquiera que sea el tamao de la muestra.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 83

Bibliografa
 MOYA CALDERON, RUFINO
2007 Probabilidad e inferencia estadstica. Editorial San Marcos.
(519.5 MOYA 2007)

 MITACC MEZA, MXIMO


1996 Tpicos de estadstica descriptiva y probabilidad. Ed. San Marcos.
(519.5 MITA 1996)

 CRDOVA ZAMORA, MANUEL


2003 Estadstica descriptiva e Inferencial. Ed. Moshera.
(519.5 CORD 2003)

 DEVORE, JAY L.
2005 Probabilidad y estadstica para ingeniera y ciencias. Editorial Thomson
(519.5 DEVO 2005)

CIBERTEC CARRERAS PROFESIONALES


84

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 85

UNIDAD DE APRENDIZAJE

ANLISIS DE REGRESIN LINEAL Y CORRELACIN

LOGRO DE LA UNIDAD DE APRENDIZAJE

Al trmino de la unidad, el alumno, trabajando de manera individual, construye una


ecuacin de regresin lineal simple que asocie dos variables con un grado de
explicacin estadsticamente significativo, mediante la aplicacin del mtodo de los
mnimos cuadrados.

TEMARIO

Anlisis de regresin

Regresin lineal simple

Mtodo de mnimos cuadrados

Anlisis de correlacin

ACTIVIDADES PROPUESTAS

Los alumnos elaboran ecuaciones de regresin lineal y calculan su nivel de


confiabilidad para la prediccin de los datos.
Los estudiantes estiman datos con la ayuda de la ecuacin de regresin.

CIBERTEC CARRERAS PROFESIONALES


86

1. ANLISIS DE REGRESIN

El objetivo del anlisis de regresin es el de establecer una relacin cuantitativa entre


dos o ms variables seleccionadas. Trata de establecer un modelo estadstico que
permite predecir, explicar o estimar el valor de una variable (dependiente) en funcin
de otras variables (independientes).

El modelo que se establezca puede tener la forma de la ecuacin de una recta


(modelo lineal), de la ecuacin de una parbola, de la funcin logartmica, de la
funcin exponencial, etc.

Asimismo, segn el nmero de variables independientes, el modelo de regresin


puede ser de dos tipos:

Simple: Cuando solamente existe una variable independiente


Mltiple: Cuando existe ms de una variable independiente

Para establecer cul es el modelo que se utilizar, es conveniente elaborar un


Diagrama de dispersin.

1.1 Diagramas de dispersin

Son diagramas que utilizan el sistema cartesiano para mostrar los valores de
dos variables para todo un conjunto de datos. Estos datos se representan en
una grfica como un conjunto de puntos, relacionando el valor de una variable
(eje X) con su valor correspondiente en la otra variable (eje Y)

Los diagramas de dispersin permiten determinar el tipo de correlacin que


puede existir en las dos variables analizadas. Asimismo, la correlacin puede
ser positiva (cuando las dos variables guardan una relacin directa), negativa
(cuando las los variables guardan una relacin inversa) o nula (cuando las
variables no estn correlacionadas.

2. REGRESIN LINEAL SIMPLE

Este anlisis implica realizar un conjunto de clculos matemticos para establecer un


modelo matemtico que permita explicar a la variable Y (dependiente) en funcin de
la variable independiente X.

En un grfico de dispersin, lo que se trata de determinar es un ajuste de todos los


puntos hacia una lnea recta.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 87

El anlisis de regresin tiene los siguientes supuestos:

Cada valor de las variables X e Y se distribuye normalmente.


Las medias de las distribuciones normales (de cada valor de X e Y) se
encuentran sobre la recta de regresin.
Las desviaciones estndar correspondientes son iguales.
Los valores de Y son estadsticamente independientes.

El modelo de regresin lineal simple tiene la forma: Y = a + b.X

Donde los coeficientes a y b son los siguientes:

a intercepto con el eje Y o la variacin de Y que no es explicada por X


b es la pendiente de la recta o el valor que vara Y cuando X aumenta en
una unidad.

3. MTODO DE MNIMOS CUADRADOS

Para calcular estos coeficientes, se utiliza el mtodo de mnimos cuadrados. Este


mtodo requiere la obtencin de los parmetros SC(X), SC(Y) y SP(XY); a partir de
los cuales se obtendrn los coeficientes a y b.

X=
X y Y=
Y
n n

( X) 2
( Y )2

SC( X) = X 2
y SC( Y ) = Y 2

n n

SP( XY) = XY
( X)( Y )
n

SP( XY)
b= y a = y bx
SC( X)

CIBERTEC CARRERAS PROFESIONALES


88

3.1. Error Estndar de Estimacin (SXY)

Al realizar la estimacin de la variable dependiente Y utilizando la recta de


regresin, es obvio esperar que el resultado no sea exacto. La diferencia
encontrada entre el valor real y el valor obtenido con la ecuacin de regresin
se le denomina error. Por lo tanto, se define el Error Estndar de Estimacin
(SXY) como la desviacin promedio de todas las observaciones con respecto a
la recta de regresin. Este Error de Estimacin se calcula de la siguiente
manera:

SC( Y ) b 2SC( X)
S XY =
n2

4. ANLISIS DE CORRELACIN

El anlisis de correlacin consiste en la aplicacin de un grupo de tcnicas


estadsticas que nos permiten medir el nivel de intensidad de la relacin que puede
existir entre dos variables. Este anlisis ayuda en el proceso estadstico de
determinar si esas dos variables estn o no fuertemente relacionadas.

Para determinar el nivel de intensidad de la relacin entre las dos variables


estudiadas, se utiliza el Coeficiente de Correlacin de Pearson (r), cuyo valor est
comprendido entre 1 y 1. El valor del coeficiente r se calcula a travs de la
siguiente frmula:

SP ( XY )
r=
[SC ( X )][ SC ( Y )]
La interpretacin del Coeficiente de Pearson se muestra en la siguiente Tabla:

Si r = 0, no existe relacin lineal.


Si r = 1, existe una correlacin positiva perfecta.
Si 0 < r < 1, existe una correlacin positiva.
Si r = -1, existe una correlacin negativa perfecta.
Si -1 < r < 0, existe una correlacin negativa.

Como se puede observar, cuando r tiende a 1, diremos que la relacin entre las
variables es bastante intensa y adems directa; en cambio, si el valor de r es
cercano a 1, la relacin tambin es muy intensa pero inversa. Por otra parte, si el
valor de r se acerca a cero, podemos afirmar que no existe ninguna correlacin.

Una vez que se ha establecido el modelo de regresin, nos tenemos que hacer una
pregunta final: qu tan confiables son las predicciones que se hagan a travs del
modelo obtenido? Para determinar esto, tendremos que calcular el Coeficiente de
Determinacin (r2). Este coeficiente nos indica el porcentaje en que la variacin de la
variable dependiente es explicada por la variable independiente. Dicho de otra
manera, el Coeficiente de Determinacin nos indica el nivel de confiabilidad que se
debe tener para los resultados estimados con la ecuacin de regresin. Los valores

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 89

de este coeficiente se encuentran comprendidos entre 0 y 1 y mientras ms cercano


de encuentre de 1, el modelo ser ms confiable. Su clculo se realiza de la siguiente
manera:

b 2 [ SC ( X )]
r =
2

SC ( Y )

5. EJEMPLO DE APLICACIN

En la siguiente tabla, se muestran las ventas que tuvo una empresa en 10 aos
pasados. Sobre la base de esta informacin, se pide determinar lo siguiente:
a) La recta de regresin y el error estndar de estimacin.
b) El coeficiente de correlacin y el coeficiente de determinacin.
c) El estimado de ventas que esta empresa tuvo en el ao 2001.

AO VENTAS
1991 0.2
1992 0.4
1993 0.5
1994 0.9
1995 1.1
1996 1.5
1997 1.3
1998 1.1
1999 1.7
2000 1.9

SOLUCIN:
Primeramente, es necesario determinar cul de las variables es independiente (X) y
cul es dependiente (Y). Seguidamente, se realizan los primeros clculos para
determinar los promedios y las sumatorias. (ver cuadro adjunto)

CIBERTEC CARRERAS PROFESIONALES


90

Luego, se realizan los clculos correspondientes al anlisis de regresin:

2
N
N
X
(19955)2 = 82,5
i=1
SC( X) =
i=1
Xi2
N
= 39820285-
10
2
N
N
Y
(10,6)2 = 2,884
i=1
SC( Y) =
i=1
Yi2
N
= 14,12
10
N N
N
X Y

i=1 i=1 19955x10,6
SP( XY) =
i=1
Xi Yi
N
= 21166,8
10
= 14,5

SP( XY ) 14,5
b= = = 0,176
SC( X) 82,5

a = Y b X = 1,06 (0,176 x1995,5 ) = 350,148

Despus, la recta de regresin est dada por lo siguiente:

Y = 350,148 + 0,176 X

Tambin, el Error Estndar de Estimacin ser el siguiente:

SC( Y) b 2 SC( X) 2,884 (0,176)2 82,5


S XY = = = 0,202633
N 2 10 2

Para el anlisis de regresin, el coeficiente de correlacin y el coeficiente de


determinacin estn dados por lo siguiente:

SP( XY ) 14,5
r= = = 0,94003
[SC( X)][SC( Y )] 82,5 x 2,884

r 2 = (0,94003 ) = 0,88366
2

Finalmente, la estimacin de ventas (en millones de dlares) para el ao 2001 es


como sigue:

Y = 350,148 + 0,176X
Y = 350,148 + 0,176(2001)
Y = 2,028

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 91

Actividades
1. Un analista toma una muestra aleatoria a 10 embarques recientemente enviados por
camin de una compaa y registra la distancia en kilmetros y el tiempo que demora
la entrega desde que el embarque estuvo listo para su transportacin. Estos datos se
muestran a continuacin:

Embarque 1 2 3 4 5 6 7 8 9 10
Tiempo (das) 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
Distancia (Km) 825 215 1070 550 480 920 1350 325 670 1215

1.1. Construya un diagrama de dispersin y determine si un anlisis de regresin


lineal es apropiado para relacionar la distancia en kilmetros y el tiempo que
demora la entrega desde que el embarque estuvo listo para su transportacin.
Justifique su respuesta.
1.2. Determine el grado de correlacin entre las variables y determine el nivel de
confiabilidad que tendr la ecuacin de regresin.
1.3. Mediante el mtodo de mnimos cuadrados, halle una ecuacin que permita
estimar el tiempo de demora a partir de la distancia.
1.4. Calcule el error estndar de estimacin e interprtelo.

CIBERTEC CARRERAS PROFESIONALES


92

2. El tiempo en segundos en que una computadora con procesador XTF se demora en


compilar un sofisticado programa de regresin se cree que depende de la cantidad de
KB que pueda tener el archivo datos necesario para que el programa determine los
resultados que se esperan. Para 10 archivos de distintos datos, se obtuvo la
siguiente informacin:

x = 1450 x = 218 ,500


2

y 2
= 47225
y = 673 xy = 101,570
2.1. Determine la recta de regresin.
2.2. Estime el tiempo que la computadora se demorar en ejecutar el programa
cuando se utiliza un archivo datos de 180 KB.

3. A continuacin, se presenta una serie cronolgica de la produccin de cierto artculo


(en miles de artculos) y el costo total (en miles de dlares) del mismo.
Determine el modelo de regresin que sirva para estimar el costo total de produccin.
Interprete los parmetros que considere necesarios para sustentar su respuesta.

Ao Produccin Costo Total


1985 12.70 8.12
1986 4.60 9.71
1987 9.60 9.77
1988 3.20 10.19
1989 15.90 6.69
1990 38.80 3.14
1991 16.90 6.13
1992 28.20 4.18
1993 11.40 7.33
1994 7.90 10.27
1995 10.60 9.66
1996 22.50 5.76
1997 37.50 3.50
1998 12.60 6.85
1999 8.60 11.29

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 93

4. El tiempo (en segundos) que demora un cajero automtico en atender a un cliente se cree
que se puede estimar en funcin del nmero de operaciones (X1) que realiza el cliente y el
monto retirado (X2, en cientos de soles). Para ello, se han establecido tres modelos:

Modelo I: Y = 45.6 + 15.6X1 SC(x) = 986.58 SC(Y) = 251500.56


Modelo II: Y = 19.5 + 2.56X2 SC(x) = 12239.84 SC(Y) = 251500.56

Determine el mejor modelo, justificando adecuadamente su respuesta. Para dicho


modelo, estime el tiempo en segundos que el cajero demorar en atender a una
persona que realiza 4 operaciones y retira en total 850 soles. (Asuma lo que
considere necesario).

CIBERTEC CARRERAS PROFESIONALES


94

5. En economa, la funcin de demanda de un producto a menudo se estima mediante la


regresin de la cantidad vendida en miles (Q) sobre el precio en dlares (P). La compaa
Matel est tratando de estimar la funcin de demanda para su nueva mueca Sally, y ha
recabado los siguientes datos:

Precio por unidad (P) 20,0 17,5 16,0 14,0 12,5 10,0 8,0 6,5
Cantidad vendida (Q) 125 156 183 190 212 238 250 276

Halle la ecuacin de regresin lineal y estime la cantidad vendida si los precios fueran
de 15 dlares. Qu tan confiable es esta ecuacin? Justifique su respuesta.

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 95

Resumen
 El Anlisis de Regresin Lineal Simple es un mtodo estadstico que permite
establecer un modelo estadstico que permita encontrar una relacin cuantitativa
entre dos variables. Este modelo sigue la ecuacin de una recta: Y = a + bX

 Se debe tener cuidado en definir la variable independiente y la variable dependiente


para tener una correcta regresin.

 No necesariamente los puntos de dispersin pueden asegurar la trayectoria de la


ecuacin de regresin lineal.

 El Error Estndar de Estimacin mide la desviacin promedio de todas las


observaciones con respecto a la recta de regresin.

 El anlisis de correlacin permite medir el grado de intensidad de la relacin que


existe entre dos variables. Este anlisis ayuda en el proceso estadstico a determinar
si es dos variables estn o no fuertemente relacionadas.

 El Coeficiente de Correlacin de Pearson (r) se utiliza para determinar el nivel de


intensidad de la relacin entre las dos variables estudiadas. Su valor est
comprendido entre 1 y 1.

 El Coeficiente de Determinacin (r2) nos indica el nivel de confiabilidad que se debe


tener para los resultados estimados con la ecuacin de regresin. Los valores de este
coeficiente se encuentran comprendidos entre 0 y 1.

Bibliografa
 ANDERSON, DAVID R.
2008 Estadstica para administracin y economa. Editorial Thomson
(519.5 ANDE 2008)

 MOYA CALDERON, RUFINO


2007 Probabilidad e inferencia estadstica. Editorial San Marcos.
(519.5 MOYA 2007)

 WEIERS, RONALD
2009 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson
(519.5 WEIE)

CIBERTEC CARRERAS PROFESIONALES


96

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 97

TABLA DE DISTRIBUCIN BINOMIAL

P [X k / B: n,k]

CIBERTEC CARRERAS PROFESIONALES


98

TABLA DE DISTRIBUCIN BINOMIAL

P [X k / B: n,k]

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 99

TABLA DE DISTRIBUCIN BINOMIAL

P [X k / B: n,k]

CIBERTEC CARRERAS PROFESIONALES


100

TABLA DE DISTRIBUCIN BINOMIAL

P [X k / B: n,k]

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 10 1

TABLA DE DISTRIBUCIN BINOMIAL

P [X k / B: n,k]

CIBERTEC CARRERAS PROFESIONALES


102

TABLA DE DISTRIBUCIN DE POISSON

P [X k / P: ]

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 10 3

TABLA DE DISTRIBUCIN DE POISSON

P [X k / P: ]

CIBERTEC CARRERAS PROFESIONALES


104

TABLA DE DISTRIBUCIN NORMAL STANDAR

CARRERAS PROFESIONALES CIBERTEC


E st a d s t ica I 10 5

TABLA DE DISTRIBUCIN NORMAL STANDAR

CIBERTEC CARRERAS PROFESIONALES

S-ar putea să vă placă și