Sunteți pe pagina 1din 59

1

DIDACTICA ESTADSTICA I
Dr. Claudio Gutirrez P.
Ingeniero Civil Industrial Marcelo Seplveda M.
Orientacin del Texto.
Este material ha sido preparado para que sea complemento al trabajo desarrollado en la
asignatura Estadstica I, y los cuadernos complementarios tecnolgicos.
IDEAS FUNDAMENTALES:
Aplicar la Estadstica que constituye un instrumento metodolgico bsico para la investigacin
experimental, el mundo empresarial, poltico y profesional.
Usar el computador, como un recurso imprescindible al analizar datos.
Realizar por los estudiantes un anlisis comprensible de los conceptos y tcnicas estadsticas.
Captulo I
1.1.Qu es la estadstica?
En lenguaje comn se llama estadstica a colecciones de datos, presentados generalmente en
formas de tablas y grficos. Es as como se habla de estadsticas de uso y cobertura del suelo,
estadsticas del sector pesquero, del mercado del trabajo, del comercio exterior, de inmigracin,
de seguridad y defensa, de produccin, de turismo.

"La estadstica es una tcnica especial apta para el estudio cuantitativo


de los fenmenos de masa o colectivo, cuya mediacin requiere una
masa de observaciones de otros fenmenos ms simples llamados
individuales o particulares". (Gini, 1953.)

"La estadstica es la ciencia que trata de la recoleccin, clasificacin y


presentacin de los hechos sujetos a una apreciacin numrica como
base a la explicacin, descripcin y comparacin de los fenmenos".
(Yale y Kendal, 1954).

Es considerada por algunos autores como una rama de la matemtica


que se ocupa de la recoleccin, clasificacin e interpretacin de datos
(Enciclopedia Barda Educativa, 2009, p629).

Una ciencia que estudia la interpretacin de datos numricos (Garzo, y


Garca, 1988. p5).

Sin embargo hay quienes prefieren no encasillarla como una rama o ciencia y la definen como un
arte o un mtodo.

Conjunto de mtodos (metodologa) que trata de la recoleccin,


presentacin y agrupacin de los datos, as como del anlisis,
interpretacin, proyeccin e inferencia de ellos.(Sote, 2005, p.13)

El contenido de la estadstica moderna incluye la recopilacin,


presentacin y caracterizacin de la informacin a fin de que auxilie
tanto en el anlisis de datos como en el proceso de toma de decisiones.
Berenson, M y Levine, D. Estadstica bsica en administracin. PrentinceHall Hispanoamericana, 4ta. Ed., 1992.

La estadstica, como campo de estudio, es el arte y la ciencia de dar


sentido a los datos numricos. Hildebrand, D. y Ott, L. Estadstica
Aplicada a la Administracin y a la Economa. Addison-Wesley
Iberoamerica, 3ra. Ed., 1997.
La estadstica se define a menudo como un conjunto de mtodos para
la toma de decisiones en condiciones de incertidumbre. Harnett, D. y
Murphy, J. Introduccin al Anlisis Estadstico. Addison-Wesley
Iberoamerica, 1987.
La estadstica estudia el comportamiento de los fenmenos llamados de colectivo. Est
caracterizada por una informacin acerca de un colectivo o universo, lo que constituye
su objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que
constituye su objeto formal, y unas previsiones de cara al futuro, lo que implica un
ambiente de incertidumbre,que constituyen su objeto o causa final. Cabri, 1994, en
Didctica de la Estadstica, Batanero, P. 2001.
La estadstica es el estudio de los fenmenos aleatorios. [] El aspecto ms importante
de la estadstica es la obtencin de conclusiones basadas en los datos experimentales.
Canavos, G. Probabilidad y Estadstica. McGraw Hill, 1988.

Estadstica es un conjunto de mtodos para planear estudios y


experimentos, obtener datos y luego organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en los datos. Triola,
2009
Estadstica Ciencia que recoge, organiza, presenta, analiza e interpreta
datos con el fin de propiciar la toma de decisiones ms eficaz. Lind,
Marchal y Wathen, 2008
La Estadstica es la ciencia que se encarga de recoger, organizar e
interpretar los datos. Gorgas, Cardiel y Zamorano, 2009

Estadstica Rama de las matemticas que estudia la recoleccin,


anlisis, interpretacin y presentacin de masas de informacin
numrica. Websters New Collegiate Dictionary, 2009
La Estadstica se define como el arte y la ciencia de reunir datos,
analizarlos, presentarlos e interpretarlos. Anderson, Sweeney y Williams,
2008
La Estadstica se ocupa de los mtodos cientficos que se utilizan para
recolectar, organizar, resumir, presentar y analizar datos as como para
obtener conclusiones vlidas y tomar decisiones razonables con base en
este anlisis. Spiegel y Stephens, 2009
Qu palabras clave resaltara de estas citas?
Aportamos algunas: experimento, fenmeno, datos, informacin, mtodos,
tcnicas, toma de decisiones, incertidumbre.

HOJA DE APRENDIZAJE 1. Definicin de Estadstica


Autor
Coincidencias de autores
4
Gini

Tcnica

Es un estudio
cuantitativo

Estudia

fenmenos
de masa o
colectivo

Yale y
Kendal

Ciencia

Trata de la
recoleccin,
clasificacin y
presentacin
de hechos

Enciclopedia
Barda

Rama de las
Matemticas

Garzo y
Garca

Ciencia

Sote

Conjunto de
Mtodos

Se ocupa de la
recoleccin,
clasificacin e
interpretacin
de datos
Estudia la
interpretacin
de datos
Trata de la
recoleccin,
presentacin y
agrupacin de
los datos
Incluye la
recopilacin,
presentacin y
caracterizaci
n de la
informacin
Da sentido a
los datos
Ayuda en la
toma de
decisiones en
condiciones de
incertidumbre

Berenson
y Levine

Hildebran
d y Ott
Harnett y
Murphy

Arte y
Ciencia
Conjunto
de
Mtodos

Cabra

Canavos

Triola

Conjunto
de
Mtodos

Lind,
Marchal y
Wathen

Ciencia

Gorgas,
Cardiel y
Zamorano

Ciencia

estudia el
comportamient
o de los
fenmenos
llamados de
colectivo
estudio de los
fenmenos
aleatorios

Previsiones de
cara al futuro, lo
que implica un
ambiente de
incertidumbre

Para planear
estudios y
experimento
s

Llega a
conclusiones
basadas en los
datos
Propicia la
toma de
decisiones
ms eficaz

obtencin de
conclusiones
basadas en datos
experimentales

Es una apreciacin
numrica base de
la
explicacin, descri
pcin y
comparacin de los
fenmenos

As como del
anlisis,
interpretacin,
proyeccin e
inferencia de datos
Ayuda tanto en el
anlisis de datos
como en el proceso
de toma de
decisiones
Datos numricos

Utiliza un modo propio


de razonamiento, el
mtodo estadstico

Palabras clave:
Datos, mtodos, informacin, fenmenos, toma de decisiones, anlisis, recoleccin, clasificacin,
presentacin, interpretacin, incertidumbre

Un primer anlisis de estas definiciones nos permite apreciar una falta


importante de acuerdo, pero todas poseen elementos en comn. Cada
descripcin implica que los datos se recolectan, con la inferencia como
objetivo. Cada una demanda seleccionar un subconjunto de un gran conjunto
de datos, ya sea existente o conceptual, para inferir las caractersticas del
conjunto.
La informacin obtenida a travs de la recopilacin anlisis, presentacin e
interpretacin de datos, proporciona a directivos, administradores y personas
que deben tomar decisiones especialmente en los negocios y en la economa
una mejor comprensin del negocio o entorno econmico, permitindoles as
tomar mejores decisiones con base en mejor informacin.

Divisin de la Estadstica:
Estadstica Descriptiva. Es una serie de mtodos para organizar, resumir y
presentar datos de manera informativa. Nieves y Domnguez, 2010
Mucha de la informacin generada a partir de los datos estadsticos generados
en la industria y los negocios es de naturaleza descriptiva. Constituye la base
de cualquier anlisis cuantitativo de datos.
Estadstica Inferencial. Mtodos que se emplean para determinar una
propiedad de una poblacin con base en la informacin de una muestra de
ellas. Lind, Marchal y Wathen, 2012
1.2. Conceptos bsicos.
Unidad de anlisis-Poblacin-Muestra-Censo
Unidad de anlisis, se les denomina tambin casos o elementos, el inters se
centra en sobre qu o quines se recolectarn los datos, es decir, en los
partcipes, individuos, objetos sucesos de estudio, lo que depender del diseo
de la investigacin y de los alcances de la investigacin.
En nuestro cuaderno de trabajo tecnolgico 1, se puede apreciar que la unidad
de anlisis o sea sobre quien se recolectarn los datos, (a quien se aplicar la
encuesta) lo constituyen los estudiantes de la carrera IA.

Una vez definida la unidad de anlisis se procede a delimitar la poblacin que


va a ser estudiada.
Poblacin. Una poblacin (o universo) es el conjunto de todos los posibles
individuos, objetos, o mediciones de inters para resolver un problema dado.
Sera necesario hacernos algunas preguntas.
De qu poblacin se trata? Se trata de todos los estudiantes de IA del pas?
Tal vez sera muy ambicioso, en este caso se trata de las caractersticas
personales de los estudiantes de IA de la UDP al primer semestre ao 2015. Las
poblaciones deben situarse claramente en torno a sus caractersticas de
contenido, de lugar y en el tiempo.
La mayora de los problemas de inters involucran poblaciones infinitas, o
poblaciones finitas que son difciles, costosas o imposibles de inspeccionar,
esto nos obliga a seleccionar, por procedimientos adecuados, una parte de
elementos de la poblacin que sea representativa de esta.
Muestra.
Es la parte de la poblacin que se desea analizar. Nieves y Domnguez, 2010
la muestra es en esencia, un subconjunto de elementos de la poblacin.
En nuestro cuaderno de trabajo tecnolgico 1 se observa claramente que la
muestra consiste en los estudiantes (unidad de anlisis) del curso de
Estadstica I de la carrera de IA del primer semestre ao 2015
El principal objetivo al realizar un anlisis estadstico es conocer algunas
propiedades de la poblacin en estudio. Si la poblacin es finita, el mejor
procedimiento es la observacin de cada unidad de anlisis (siempre que sea
posible).
Cuando se examina la caracterstica que nos interesa en una muestra y luego
se generaliza estos resultados a la poblacin esta generalizacin a la poblacin
se realiza por medio de la parte de la estadstica que se conoce como
Inferencia Estadstica.
Censo. Estudio estadstico realizado sobre toda la poblacin.
Por ejemplo los estudios motivacionales en empresas suelen abarcar a todos sus
empleados para evitar que los excluidos piensen que su opinin no se toma en
cuenta. Hernndez, Fernndez y Baptista, 2010

Generalmente en un estudio estadstico, estamos interesados en analizar un


algn aspecto parcial de los elementos (unidades de anlisis) que componen la
poblacin, por ejemplo en el caso de los estudiantes del cuaderno de trabajo
tecnolgico 1 la edad, el gnero, el nmero de personas que componen su
familia, sus hbitos de estudio, estos aspectos parciales reciben el nombre de
caractersticas de los elementos de una poblacin, y son por su naturaleza

variables de modo que en distintos individuos pueden tomar valores o


caractersticas distintas.
Variable. Es una caracterstica de inters observada en la Poblacin y que est
sujeta a diferentes resultados o valores. Aquella caracterstica que se observa
o se mide sobre las unidades elementales se denomina variable.
Ejemplo: Gnero, Edad, Peso, Altura, Promedio, Horas de estudio semanal,
Formularse preguntas mientras lees
Para representar los distintos tipos de datos empleamos variables.
Tipos de variables. Generalmente las variables estadsticas se clasifican en
variables cualitativas y cuantitativas.
Variables Cualitativas o de atributo. Cuando la caracterstica que se
estudia es de naturaleza no numrica recibe el nombre de variable cualitativa.
Ejemplo: Gnero, Rama Educativa, Tipo de Colegio, Comuna de residencia.
Variable Cuantitativa. Cuando la variable que se estudia se representa
numricamente recibe el nombre de variable cuantitativa.
Ejemplo: Edad, Peso, altura, N de integrantes del grupo familiar.
Las Variables Cuantitativas pueden ser de dos tipos: Variables Cuantitativas
Discretas o Variables Cuantitativas Continuas.
Las variables discretas son aquellas que solo pueden tomar una cantidad (finita
o infinita) numerable de valores.
Una variable discreta es aquella para la cual no existen valores posibles entre
las unidades adyacentes de una escala. Pagano, 1999
Las variables continuas toman cualquier valor dentro de un intervalo
especfico. O sea cuando pueden tomar tericamente infinitos valores entre
dos valores dados. Una variable continua es aquella que, tericamente, puede
asumir un nmero infinito de valores entre las unidades adyacentes de una
escala. Pagano, 1999
Por otra parte, las variables se pueden clasificar en unidimensionales, cuando
solo se mide una caracterstica de los elementos de la muestra, o
bidimensionales, tridimensionales, y en general ndimensionales, cuando se
estudien simultneamente varias caractersticas de cada elemento.
HOJA DE APRENDIZAJE N 2
1. Mencione cuales son las principales razones de emplear muestras en un estudio
estadstico, en lugar de utilizar la totalidad de la poblacin.
2. D tres ejemplos de poblaciones donde sea costoso investigar a toda la poblacin, tres
ejemplos en donde sea impracticable y tres donde sea imposible.
3. Proponga ejemplos de una poblacin de personas, otra de objetos y defina algunas
posibles variables sobre las cuales podra efectuar un estudio estadstico.

Datos.
Son hechos, informaciones y cifras que se recogen, analizan y
resumen para su presentacin e interpretacin. Para la recoleccin de los datos
se requiere de los llamados niveles de medicin. La escala de medicin
determina la cantidad de informacin contenida en el dato e indica la manera
ms apropiada de resumir y de analizar estadsticamente estos. El nivel de
medicin de los datos rige los clculos que se llevan a cabo con el fin de
resumir y presentarles. Tambin determina las pruebas estadsticas que se
deben realizar.
Los datos se pueden generar de distintas maneras: Tomando una muestra,
diseando un experimento, realizando un Censo.
La recopilacin de datos puede ser generada por el propio investigador en cuyo
caso la fuente de datos se denomina primaria o por terceros que
correspondera a una fuente de datos secundaria.
De la recopilacin de datos pueden observarse muchas caractersticas
diferentes para un mismo individuo. Estas caractersticas, dependiendo del tipo
de los valores que originan, pueden medirse con cuatro tipos distintos de
escalas de medida.
Clasificacin de los datos a travs de escalas de medicin
Existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn.
La medicin ms baja, o ms primaria, corresponde al nivel nominal. La ms
alta, o el nivel que proporciona la mayor informacin relacionada con la
observacin, es la medicin de razn.
Datos de nivel nominal. En este caso las observaciones acerca de una variable
cualitativa se pueden clasificar y contar. No se puede realizar entre ellas
operaciones aritmticas, ni establecer relaciones de orden. Ejemplos: Grupo
sanguneo, profesiones, genero.
Datos de nivel ordinal. Las clasificaciones de los datos se encuentran
representadas por conjuntos de etiquetas o nombres (alto, medio, bajo), las
cuales tienen valores relativos, las categoras obtenidas pueden ser ordenadas.
Ejemplos: Grado de educacin de un grupo de personas, grado de mejora de
un paciente.
Las variables cuantitativas pueden estar medidas en escala de intervalos o en
escala de razn.
La escala de Intervalos representa un nivel superior de medicin que la escala
de medicin ordinal.
Es posible comparar intervalos de valores debido a que a lo largo de toda la
escala, dos valores adyacentes representan siempre la misma diferencia de
magnitud. Es decir la diferencia entre valores constituye una magnitud
constante Una particularidad de esta escala es que el valor cero es arbitrario.
Adems de clasificar y ordenar a los individuos, cuantifica la diferencia entre
dos clases, puede indicar cuanto ms significa una categora que otra. Es

necesario definir una unidad de medida y un origen, que por su naturaleza es


arbitrario. Ejemplo: Temperatura, escala cronolgica.
El nivel ms alto de medicin es la escala de razn. Adems de tener las
propiedades de las otras escalas, tiene un cero absoluto. Posee todas las
caractersticas del nivel de intervalo, aunque, adems, el punto 0 tiene sentido
y la razn entre dos nmeros es significativa. Ejemplos: Nivel de Ingresos,
Volumen de ventas, edad.
El nivel elegido para medir una caracterstica condiciona el resto del anlisis
estadstico, pues las tcnicas utilizadas deben tener en cuenta la escala que se
ha empleado. A mayor nivel utilizado, mayor nmero de tcnicas pueden
aplicarse.
Captulo II
El principal objetivo de la estadstica descriptiva es sintetizar conjuntos de
datos mediante tablas o grficos resumen, con el fin de poder identificar el
comportamiento caracterstico de un fenmeno y facilitar su anlisis
exhaustivo.
Descripcin de Datos.

Despus que los datos fueron cargados en la base de datos, se procede a su "tabulacin" es
decir a ubicarlos en cuadros o tablas con la finalidad de ordenarlos y analizarlos.
Tabla de distribucin de frecuencias.
Tablas estadsticas que agrupan diversos valores de una variable, simplificando
los datos. Vergara y Quesada, 2012.
Una tabla de distribucin de frecuencia es un resumen tabular de datos que
muestra el nmero (frecuencia) de elementos en cada una de las diferentes
clases disyuntas (que no se sobreponen). Anderson, Sweeney, Williams, 2008
Es un procedimiento estadstico que tiene por finalidad organizar y resumir un
conjunto de datos.
Organizacin de datos cualitativos
La empresa LM realiz una encuesta sobre el grado de aceptacin de un nuevo
producto por sus clientes. Para esto solicit a 30 clientes que valoraran el
nuevo producto empleando la siguiente escala.
1: Muy Malo 2: Malo

3: Regular

4: Bueno

5: Muy Bueno

Siendo los resultados los siguientes:


3

10

4
5

5
4

5
5

4
3

4
3

3
4

2
5

2
4

5
3

5
2

Para elaborar la tabla de frecuencias es necesario en primer lugar identificar la


variable en estudio, en este caso se trata de la variable cualitativa Grado de
aceptacin, la cual toma cinco valores (clases). Para poder operar con los datos
o realizar alguna referencia sobre ellos, podemos representar la variable
(caracterstica a observar- Grado de aceptacin por una letra de las ultimas del
alfabeto (convencin) por ejemplo X y a la modalidad nmero i de dicha
variable con la notacin x i ; ni representar el nmero de individuos que
presenta esa modalidad que se llamara frecuencia absoluta.
Frecuencia Absoluta: ni
Corresponde por lo tanto al N de observaciones en cada clase.
Frecuencia Relativa: hi
Con la finalidad de valorar la representatividad de cada categora respecto al
total de datos se calcula la frecuencia relativa hi obteniendo sus valores a
partir de la razn entre cada ni y el N total de observaciones (n). Al
multiplicar por 100 tenemos la frecuencia %.

Grado de Aceptacin

Frecuencia Absoluta:

ni

Frecuencia Relativa:

hi

Muy Malo

Malo
Regular
Bueno
Muy Bueno
Total

3
7
9
11
30

3/30
7/30
9/30
11/30
1

Luego de tabular los datos, se procede a su graficacin. En este ltimo sentido


hay que tener en cuenta que el mtodo grfico no nos permite ver detalles,
pero si permite analizar rpidamente los datos, incluso en forma comparativa.
Adems al momento de graficar se deber tener en cuenta la distinta
naturaleza de las variables, ya que las variables cualitativas tienen una
restriccin en cuanto al tipo de grficos a utilizar, que no existe en las variables
cuantitativas. Las primeras slo admiten grficos de torta, barras o superficies;
en tanto que las segundas no presentan ninguna limitacin.
Representacin grfica de datos cualitativos
El instrumento ms comn para representar una variable cualitativa en forma
grfica es la grfica de barras en ella, las clases se representan en el eje
horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase
son proporcionales a las alturas. Las barras deben quedar distanciadas, dado
que la variable de inters es de naturaleza cualitativa, las barras no son
adyacentes.

11

G r a d o d e a c e p t a c i n d e l n u e vo p r o d u c t o
11

12
10

9
7

8
6
N de Clientes

4
2
0

Fuente: Depto. De Marketing empresa LM, Diciembre, 2014

Otro tipo de grfica til para describir informacin cualitativa es la grfica


circular, o aerograma o grfica de pastel. Esta muestra la parte o
porcentaje que representa cada clase del total de nmeros de frecuencia.
Para construirle se asocia la frecuencia relativa de los datos con los 360 grados
de la circunferencia
Distribucin % de Clientes respecto a la aceptacin del nuevo producto

10%
37%

23%

30%

Muy Malo

Malo

Bueno

Muy Bueno

Regular

Fuente: Depto. De Marketing empresa LM, Diciembre, 2014

Pictograma. Son grficos de columnas en los que stas se han sustituido


por dibujos alusivos al tema que se est tratando.
Construyamos un pictograma a partir de la siguiente informacin que se refiere
al N de estudiantes por carrera en una Facultad de Ingeniera.

12

Carrera

N de Estudiantes

Ingeniera Civil Industrial

1180

Ingeniera Civil en Informtica y


Telecomunicaciones

371

Ingeniera Civil en Obras Civiles

457

Fuente: Secretara de Estudios Escuela de Ingeniera Industrial, xxxx, 2014

N de Estudiantes por carrera


1400
1200
1000
800
600
400
200
0

1180

371

457

Fuente: Secretara de Estudios Escuela de Ingeniera Industrial, xxxx, 2014


Organizacin de datos Cuantitativos.
Las tablas estadsticas para variables cuantitativas discretas son similares a las
para variables cualitativas. Incluyndose en este caso el orden en la variable.
De un grupo de 20 estudiantes se obtuvo los siguientes datos recogidos al
realizar la pregunta. Cunto es el N de personas que integran su grupo
familiar?
3 8 5 1 5 1 4 4 3 2 2 2 1 5 7 7 3 4 4 4
0
La variable a considerar es N de personas del Grupo Familiar, claramente una
variable discreta, la denotaremos por Y i y construiremos la distribucin de
frecuencias correspondiente.
La tabla que sigue corresponde a una tabla de distribucin de frecuencias de
una variable cuantitativa discreta. En ella se ha valorado todos los tipos de
frecuencias.

13

1
2
3
4
5
7
8
10

2
3
3
5
3
2
1
1
20

0,1
0,15
0,15
0,25
0,15
0,1
0,05
0,05
1

2
5
8
13
16
18
19
20

20
18
15
12
7
4
2
1

0,1
0,25
0,4
0,65
0,8
0,9
0,95
1

1
0,9
0,75
0,6
0,35
0,2
0,1
0.05

Frecuencias Acumulativas
Frecuencia Absoluta acumulada ascendente:
Algunas veces de una variable estadstica, es interesante conocer el nmero de
valores que son menores que uno dado, estas se obtienen sumando a la
frecuencia absoluta de un valor todas las anteriores, de igual modo se obtienen
las frecuencias relativas acumuladas.
Frecuencia Absoluta acumulada descendente:
Otras veces queremos determinar el nmero de valores de la variable que son
mayores que uno dado, estas se obtienen sumando a la frecuencia absoluta
del ltimo valor que toma la variable las
Inmediatamente anteriores.

14

Componentes del Grupo Familiar


10

5
N ee Integrantes del Grupo Familiar

2
0

Frecuencia de la caracterstica

Fuente: Estadstica curso, semestre 1/2015

Organizacin de datos cuantitativos continuos.


Intervalos y Marcas de clase.
Dependiendo del tipo de datos si se trata de una variable cuantitativa continua
se debe tener cuidado al definir los intervalos de clase disjuntos a considerar.
Para definir los intervalos de clase debemos considerar:
1. N de intervalos de clase a considerar.
2. Determinar la amplitud o ancho del intervalo.
3. Determinar los intervalos mismos.
Para determinar el nmero de intervalos, no existe una regla fija, adems
debemos considerar la prdida de la informacin que supone el agrupamiento.
Una forma que se utiliza a menudo es tomar un entero prximo a la raz
cuadrada del nmero de datos como nmero de intervalos.
Algunos elementos a considerar:
Mximo: Se le llama al mayor valor que toma la variable en toda la serie de
datos.
Mnimo: Es el menor valor que toma la variable en toda la serie datos.
Recorrido de la Variable: Es la diferencia entre Mximo y el Mnimo de la
serie de datos.
Intervalo de Clase: Corresponde a cada uno de los intervalos en que
podemos dividir el recorrido de la variable. Estos pueden ser o no de la misma
amplitud.
Extremo superior del intervalo de clase: Es el mximo valor de la variable
en dicho intervalo., se representar por i.

15

Extremo inferior del intervalo de clase: Es el mnimo valor de la variable


en dicho intervalo, lo representaremos por i1
Marca de clase: Es el punto medio de cada intervalo de clase. Se representa
por X i y es el promedio de los extremos del intervalo.
Convenio: Si el extremo superior de un intervalo de clase coincide con el
inferior de la siguiente, los intervalos se suponen semiabiertos por la derecha,
o sea, en cada intervalo de clase.
Consideremos la siguiente muestra que corresponde a datos de altura de un
grupo de estudiantes universitarios.
1,51

1,72

1,7

1,53

1,73

1,63

1,68

1,85

1,5

1,6

1,69

1,61

1,72

1,69

1,76

1,6

1,7

1,53

1,67

1,67

1,75

1,66

1,73

1,69

1,6

1,53

1,56

1,59

1,56

1,64

Con la finalidad de resumir la informacin y adquirir una visin global y


sinttica de la misma, agruparemos los datos en intervalos, debemos
considerar que esto implica una prdida de informacin que ser preciso tener
en cuenta.
Mximo: 1,85
Mnimo: 1,50
RV: 1,85-1,50
RV=0,35
m=nmero de intervalos= 30 =5,477
Consideraremos 6 intervalos de clase. m=6

Ci =anc h o delintervalo
Para lograr un manejo cmodo de la amplitud, ampliaremos el valor Mximo en
una unidad.

Ci =

RV 0,36
=
=0,6
m
6

De esta manera la tabla quedara estructurada de la siguiente manera:

X i1

Xi

Xi

1,5

1,56

1,53

1,5
6
1,6
2
1,6
8
1,7

1,62

1,59

1,68

ni
5

30

0,1
7
0,23

12

25

1,65

0,17

17

18

1,74

1,71

10

0,33

27

13

1,8

1,77

0,07

29

0,1
7
0,4
0
0,5
7
0,9
0
0,9

1,00
0,83
0,60
0,43
0,10

16

4
1,8

7
1,86

1,83

0,03

30

1,0
0

0,03

Tres grficas son de utilidad para representar una distribucin de frecuencias


agrupadas.
Histograma: Grfica en la que los intervalos de clases se sealan en el eje
horizontal y las frecuencias de cada intervalo de clase en el eje vertical. Las
frecuencias de clase se representan por medio de las alturas de las barras,
stas se dibujan de manera adyacente.
Histograma que representa la altura de los estudiantes de.....
12
10

10
8
6
N de estudiantes

7
5

4
2

2
1

Estatura en metros

Fuente: Ctedra Estadstica I, 1-2015

Polgono de frecuencias: Es otra forma de representar los datos, es la lnea


que resulta de unir los puntos medios de los intervalos de clase.

17

Poligono de frecuencias que representa la altura de los estudiantes de la asignatura....

N de Estudiantes

12
10
8
6
4
2
0

Estatura en metros

Fuente: Ctedra Estadstica I, 1-2015


Distribuciones de frecuencia acumulada: Para trazar una distribucin de frecuencias
acumulativas, se ubica el lmite superior de cada intervalo de clase a lo largo del eje x y las
correspondientes frecuencias acumulativas a lo largo del eje y.

Grfico de estaturas menores o iguales que

35
30
25
20
15
10
5 5
0

27 29 30
12

17

N de estudiantes

Estatura en metros

Fuente: Ctedra Estadstica I, 1-2015

CAPITULO III
Descripcin de datos.

18

En los captulos anteriores hemos analizado la forma de organizar y


presentar los datos en forma significativa. Las tablas de distribucin de
frecuencia no nos permiten realizar afirmaciones cuantitativas que caractericen
a la distribucin como un todo, tampoco se puede establecer comparaciones
cuantitativas entre dos o ms distribuciones.
El siguiente paso del anlisis de datos es el clculo de una serie de valores,
llamados estadsticos, que nos proporcionan un resumen de acerca de cmo se
distribuyen los datos.
Estos estadsticos se pueden clasificar cmo:
Medidas o estadsticos de localizacin central.
A estas medidas a menudo se les llama promedios. El propsito de estos
consiste en sealar el centro de un conjunto de valores.
Medidas o estadsticos de dispersin.
Nos proporcionan una medida de la desviacin de los datos con respecto a
los valores de tendencia central. Este concepto se refiere a la medida en la cual
los datos son distintos unos de otros, debido a su dispersin.
Si slo toma en cuenta las medidas de ubicacin de un conjunto de datos
para comparar varios conjuntos de datos llegara a una conclusin incorrecta.
Adems de las medidas de localizacin debe considerar la dispersin de los
datos. Una medida de ubicacin, slo describe el centro de los datos. Esto
resulta ser importante, pero no dice nada con respecto a la dispersin de los
datos. Una medida de dispersin pequea indica que los datos se acumulan
con proximidad a la media aritmtica, por consiguiente, la media se considera
representativa de los datos. Por el contrario una medida grande de dispersin
indica que la media no es confiable ya su valor podra deberse a que existen
valores extremos o quesea debido a la gran variabilidad de los datos.
Medidas o estadsticos de forma.
Nos proporcionan una medida de la forma grfica de la distribucin.
Medidas o estadsticos de localizacin central.
La principal medida de tendencia central es la media aritmtica, la media
aritmtica de una muestra la representaremos por una letra mayscula que
simboliza a la variable con una raya sobre ella por ejemplo x y se calcula
para datos brutos (no agrupados) mediante la expresin
n

xi
x =

Si los datos estn agrupados, utilizaremos la formula:


n

xi ni
x =

La agrupacin de los valores de la variable implica una prdida de informacin


sobre dichos valores.

19

Propiedades de la Media Aritmtica.


1. La suma de las desviaciones de los valores con respecto a ella es
igual a cero. Es decir:

( x i x ) ni =0

2. La media aritmtica del producto de una constante, b, por una variable,


x i , es igual al producto de la constante por la media aritmtica de la
variable dada.
i=n

i=n

b xi ni
i=1

b x i ni
=

i=1

=b x

3. La media aritmtica de la suma de dos variables, x e y, es igual a la


suma de las medias aritmticas de cada una de las variables.

x+ y=x + y

Esta propiedad se cumple para cualquier N de variables.


4. La media aritmtica de la suma de una constante entera, b, con una
variable, x, es igual a la suma de la constante, b, con la media aritmtica
de la variable dada.
i=n

i=n

(b+ x i )n i
i=1

nb+ xi ni
=

i=1

=b+ x

Caractersticas:
1. Todo conjunto de datos cuantitativos tiene una media.
2. Todos los valores se encuentran incluidos en el clculo de la
media.
3. La media es nica para un conjunto de datos.
4. La media aritmtica es sensible a valores extremos.
Mediana.
La Mediana se suele definir como el valor ms intermedio una vez que los
datos han sido ordenados en forma creciente. Se suele denotar por Me
Para hallar la mediana de una distribucin de datos no agrupados debemos:
1. Ordenar las observaciones en orden ascendente.
2. Si el nmero de observaciones n es impar, Me es la observacin central
de la lista ordenada. Me se halla contando (n+1)/2 observaciones desde el
comienzo de la lista.
3. Si el nmero de observaciones n es par, Me es la media de las dos
observaciones centrales de la lista ordenada.

20

Cabe destacar que es preferible el uso de la mediana como medida descriptiva


central cuando se quiere reducir o eliminar el efecto de valores extremos en un
conjunto de datos (muy grandes o muy pequeos).
Para calcular la Mediana para datos agrupados, utilizaremos la siguiente
frmula:

n
N i 1
2
'
Med=Y i 1 +C i
ni

Y 'i1

: Lmite inferior del intervalo de clase mediano.

Ci : Ancho del intervalo mediano


n/2 : Tamao muestral dividido en dos
N i1 : Frecuencia absoluta acumulada ascendente inmediatamente anterior

al intervalo mediano

ni : Frecuencia absoluta del intervalo mediano


Propiedades de la Mediana.
Los datos extremos en un conjunto, no tienen ninguna influencia en el valor de mediana. Es
posible decir que cuando los datos contengan valores extremos, es preferible usar a la mediana
como medida de localizacin central.

En una tabla de frecuencias, una marca de clase no puede ser calculada para
una clase abierta.
Aunque la media aritmtica es la medida de localizacin central ms
empleada, en algunas situaciones se prefiere la mediana.
La Moda.
Se define como aquel valor del conjunto de datos que se presenta con mayor
frecuencia. Esto quiere decir que si elegimos aleatoriamente un dato de un
conjunto, el valor con mayor probabilidad de ser seleccionado es la moda. La
moda se simbolizar por Mo.
Hay situaciones en que la frecuencia mayor se presenta con dos o ms valores
distintos. Cuando esto ocurre hay ms de una moda.
Si los datos contienen ms de una moda se dice que los datos son bimodales.
Si contienen ms de dos modas, son multimodales. En los casos multimodales
casi nunca se da la moda, porque dar tres o ms modas no resulta de mucha
ayuda para describir la localizacin de los datos.
La moda para datos no agrupados, se obtiene por simple observacin.

Para datos agrupados emplearemos la siguiente frmula:

21

Mo=Y 'i1+ Ci

ni+1
ni +1+ ni1

Ejercicios Resueltos:
1. En los siguientes casos, identifique: Poblacin y Variable. Clasifique la
variable:
a) En la empresa Alfa se desea estudiar el nmero de horas no trabajadas por
sus empleados.
b) En una fbrica se desea medir el tiempo que cada trabajador demora en
armar cierto producto.
c) En una empresa de seguros se desea estudiar el monto de las primas
contratadas por los clientes.
d) En la Municipalidad de Santiago se estudia las marcas de automviles que
tienen su patente obtenida en dicha Municipalidad.
e) En un Instituto Profesional se estudia las carreras que los alumnos siguen.
f) En una cooperativa se desea estudiar el nivel de educacin que tienen sus
socios.

Caso
a)
b)

c)
d)

e)
f)

Poblacin
Empleados de la
empresa Alfa
Trabajadores de
una fbrica
Clientes en una
empresa de
seguros
Autos con
patentes de la
Municipalidad de
Santiago
Alumnos de un
Instituto
Profesional
Socios de una
Cooperativa

Variable
N de horas no
trabajadas
Tiempo que se
demora en el
armado de cierto
producto
Monto de las
primas
contratadas
Marcas de
automvil

Clasificacin
Cuantitativa
Discreta
Cuantitativa
Continua

Carreras que se
imparten

Cualitativa
Nominal

Nivel de
educacin

Cualitativa
Ordinal

Cuantitativa
Continua
Cualitativa
Nominal

22

2.
Una empresa ha clasificado sus operaciones segn el riesgo de
accidente que tendran sus empleados. Una muestra aleatoria de 30
operaciones entreg los siguientes resultados:
P S A S A S M S S A P P S S M P P M M S M P A A A M M M A S
El cdigo utilizado para el riesgo de accidente es:
S = Sin riesgo; P = Pequeo riesgo; M = Mediano riesgo y A = Alto riesgo.
a) Construya la tabla de distribucin de frecuencias y determine e intrprete:
2, h3, 4, h1, 3 y H3
Riesgo de
Accidente

N de
operaciones

Ni

hi

Hi

9
6

9
15

0,30
0,20

0,30
0,50

23

0,27

0,77

7
30

30

0,23
1

( ni )
Sin Riesgo
Pequeo
Riesgo
Mediano
Riesgo
Alto Riesgo
Total

2=6
6 de las operaciones en estudio presentan pequeo riesgo de accidente.
h3=0,27
27 % de las operaciones en estudio presentan riesgo mediano de accidente.
4=7
7 de las operaciones en estudio presentan alto riesgo de accidente.
h1=0,3
30 % de las operaciones en estudio no presentan riesgo de accidente.
3 =23
23 de las operaciones en estudio tienen a lo ms mediano riesgo de
accidente.
H3 =0,77
77 % de las operaciones en estudio tienen a lo ms mediano riesgo de
accidente.
b) Construya un grfico circular y un grfico de barras.
SOLUCIN: Grfico Circular

23

Distribucin del riesgo de Accidente en las operaciones

Alto Riesgo; 23%


Sin Riesgo; 30%
Mediano Riesgo; 27%

Pequeo Riesgo; 20%

Distribucin del riesgo de Accidente en las operaciones


Alto Riesgo

Mediano Riesgo
Riesgo

Pequeo Riesgo

Sin Riesgo

9
0

10

N de operaciones

3.- El Administrador de un gimnasio est interesado en conocer la distribucin de las edades de


las 42 personas inscritas en su local, por ese motivo es que recopil las siguientes edades:
26 16 21 34 45 18 41 20 56 60 24 61 28 32
38 22 48 27 22 30 39 33 18 23 27 46 30 34
62 25 25 38 29 31 28 62 49 59 19 20 23 24
a) Construya la tabla de distribucin de frecuencias, agrupando los datos en intervalos.

24

1 Determinar el rango o recorrido de la variable RV

RV =VMaxVMin

RV =6216=46 aos
2 Hallar el nmero de clases o intervalos m

m= n= 42= 6,48 6
Ci

3 Determinar amplitud de las clases o intervalos

Ci =

RV 46
=
m
6

Con la finalidad de trabajar con ms comodidad ampliaremos el RV a 48 para de esta


manera tener intervalos de ancho 8
4 Construir la tabla de distribucin de frecuencias.
Edades
16-24
24-32
32-40
40-48
48-56
56-64

xi

N de Personas ni N i
20
28
36
44
52
60

11
13
7
3
2
6
42

11
24
31
34
36
42

hi

Hi
0,26
0,31
0,17
0,07
0,05
0,14
1

b) Construya un histograma, un polgono de frecuencias y una ojiva.

Histograma que representa la distribucin de edades


80
60
40
N| dePersonas 20

20

28

36

44

52

Edad en aos

Fuente:

60

0,26
0,57
0,74
0,81
0,86
1

25

Polgono de frecuencias absolutas que representa la distribucin de las edades


13

14
11

12
10

N de personas 6
3

4
2
0

12 20 28 36 44 52 60 68
Edades en aos

Fuente

Ojiva que representa la distribucin de las edades


45
42
40
36
35
34
31
30
25
24
N de personas 20
15
10 11
5
0
24 32 40 48 56 64
Edades en aos

Fuente:
4. El siguiente cuadro de frecuencias resume los sueldos mensuales (en
miles de $) de los trabajadores de una empresa
Sueldo
mensual
200-240
240-280
280-320
320-360
360-400
400-440
440-480
480-520

ni
32
20
28
48
32
16
20
4

Ni

26

Complete la tabla de distribucin de frecuencias con la informacin


necesaria para determinar:
Sueldo
mensual

ni

200240
240280
280320
320360
360400
400440
440480
480520

32

Ni

hi

Hi

32

0,16

0,16

200

52

0,10

0,26

168

0,84

80

0,14

0,40

148

0,74

128

0,24

0,64

120

0,6

160

0,16

0,80

72

0,36

176

0,08

0,88

40

0,2

196

0,10

0,98

24

0,12

200

0,02
1,00

1,00

0,02

20
28
48
32
16
20
4
200

a) Qu sueldo est en el centro de la distribucin?

n
N i1
2
Med=
Y i1+ Ci
ni

Med=320+40

n/2=100

200
80
2
=336,7 miles de pesos
48

b) Qu porcentaje de los trabajadores gana $370.000 o menos?

370=360+40

j
200128
100
32

0,25*32=2j-128
8+128=2j
136/2=j
J=68%

27

c) Qu intervalo abarca el 40% central de los sueldos?


30%

40%

30%

p35 p75

(30/100)200=60

p30= 280+40

p30= 280+40

30
20052
100
28

( 6052
28 )

p30= 280+40

( 288 )

p35=280+12,8=292,8 miles de pesos


(70/100)200=140

p70 = 360+40

( 140128
)
32

p70= 360+40

( 1232 )

p70= 360+15=375 miles de pesos


Intervalo=375 miles de pesos- 292,8 miles de pesos =82,2 miles de pesos
d) Cul es el sueldo promedio?
Sueldo
mensual

ni

200240
240280
280320
320360

32

Xi

Xi*ni

220

7040

260

5200

300

8400

340

16320

20
28
48

28

360400
400440
440480
480520

32
380

12160

420

6720

460

9200

500

2000
67040

16
20
4
200

67040
X =
=335,2 miles de pesos
200
e) Qu % de trabajadores gana el sueldo promedio o menos?

j
20080
335,2=320+40 100
48
2 j80
15,2/40=
48

0,38*48=2j-80
18,24+80=2j
98,24/2=j
J=49,12%
f) Construya el histograma de la distribucin de sueldos
Histograma que representa la distribucin de sueldos mensuales de los
trabajadores de la empresa xxxx, en el perodo xxx
60
48

50
40

32

28

30
20
10
0

20

32

16

20

29

Sueldos en miles de pesos


Fuente:
5.- Los datos que se muestran a continuacin representan el costo de la
energa elctrica durante el mes de julio del 2006 para una muestra aleatoria
de 50 departamentos con dos dormitorios en una ciudad grande.
N de Trabajadores

Costo de energa elctrica en dlares.

96

171

202

178

157

185

90

116

141

149

206

95

163

108

119

147

102

153

197

127

82

172

111

148

213

130

165

175

123

128

144

168

109

167

206

175

130

143

187

166

139

149

150

154

114

135

191

137

129

158

a) Construya una tabla de frecuencias, considere 7 intervalos de clase.


b) Elabore un histograma de frecuencias y un polgono de frecuencias con
los datos.
c) El porcentaje de departamentos con costos menores de 135 dlares.

a.Yi1 N i hi n i Yi Yi
82
101
120
139
158
177
196
b)

101
120
139
158
177
196
215

91,5
110,5
129,5
148,5
167,5
186,5
205,5

4
7
8
12
10
4
5
n=50

0,08
0,14
0,16
0,24
0,20
0,08
0,10

4
11
19
31
41
45
50
1,00

30

Fuente: ccccc

Fuente: CCCC

c)
jn

Ni

p j Yi1 Ci 100

ni

j 50

100 11
135 120 19

31

15 * 8 j
11
19
2
(6,32 11) * 2 j
j 34,64
Un 34,64 % de los Departamentos. tienen costos menores de 135 dlares.

6.- En un taller de reparacin de automviles se recogen datos sobre los das


de permanencia de los vehculos a reparar en l, y se obtiene:
as de estancia
1
2
3
4
5
8
N de coches
23
12
7
10
3
2
a. Calcula el nmero medio aritmtico de das de permanencia.
Das
de
estancia
1
2
3
4
5
8
15

N de
coches Yi ni
23
12
7
10
3
2
1
58

Ni
23
24
21
40
15
16
15
154

23
35
42
52
55
57
58

X 2,66 das
b. Cuntos das como mximo permanecen en el taller el 75% de los
automviles, que menos permanecen en el taller?

3
* 58 0,75 * 58 43,5
4

Q3 4 das
c. Calcula e interpreta la Mediana de los das de permanencia de los
vehculos a reparar.
N /2 =29
Me=2 das
El 50% del total de automviles permanecen 2 o menos das en el taller de
reparacin.
7.- La Subsecretara de Transporte realiz un estudio para medir, en horario
punta, el tiempo de recorrido de los buses de la Lnea E-205 del Transantiago.
Los resultados obtenidos en una muestra aleatoria de 95 de dichos buses, se
resumen en el siguiente grfico :

32

Se ha establecido que si el tiempo de recorrido de los buses excede en ms


de una desviacin estndar al tiempo promedio de recorrido de la flota en
estudio, se producen atochamientos en los paraderos.
Determine qu proporcin de estos buses estaran provocando ste
problema.
La tabla asociada al grfico es:
Tiempos(mi
n)
15,5 a 18,5
18,5 a 21,5
21,5 a 24,5
24,4 a 27,5
27,5 a 30,5
30,5 a 33,5
33,5 a 36,5
Total
-

17
20
23
26
29
32
35
---

5
12
18
20
23
12
5
95

5
17
35
55
78
90
95
----

Se pide calcular el porcentaje k correspondiente a la expresin :

Pk M X Y
Con :

Luego :
=== K = 83,337263
Luego, la proporcin pedida est dada por :

33

Como:
Conclusin: por lo tanto, la proporcin de buses que supera los 30,7926
minutos provocando atochamiento en los paraderos es: 16,66%,
(aproximadamente 16 buses)
8.- El bajo promedio y la gran dispersin del monto de las ventas, determin
la realizacin de un curso de tcnicas de venta para los vendedores de la
seccin Electrnica de una Multitienda.
A continuacin se resume la informacin del monto de las ventas (en diez
Miles de $), correspondiente al mes previo al desarrollo del curso.
Seccin
Electrni
ca

Venta
Promedio
610

Desviacin Estndar de
las Ventas
384

Nmero
vendedores
18

Los montos de las ventas realizadas por stos vendedores (en diez
Miles de $) el mes siguiente a la finalizacin del curso, fueron los que a
continuacin se indican:
Ventas
Seccin Electrnica
( Diez miles $ )
N de Vendedores

yi

y i ni

400 - 500

450

900

500 - 600

550

1650

600 - 700

650

2600

700 - 800

750

5250

800 - 900

850

y i2 ni

405000
907500
1690000
3937500
TOTAL

18

1700

1445000
12100

8385000
a) Con la realizacin del curso, la Multitienda esperaba disminuir en a lo
menos un 50 %
la dispersin relativa del monto de las ventas en dicha seccin. Determine si el
curso satisfizo stas expectativas y si adems se
lograron superar las
deficiencias que determinaron su realizacin.

de

34

Antes del Curso

Despus del Curso

M X 610 ; S X 384 ; CV 0,6295


CV 0,1757
0,4538
(CV )
0,7209
0
,
6295
Luego :

M X 672,2222 ; S X 118,1127 ;

Con la realizacin del curso se superaron las deficiencias que lo motivaron


pues, disminuy la dispersin del monto de las ventas de la seccin y aument
su valor promedio.
Como consecuencia de lo anterior, se logr una disminucin de la dispersin
relativa en ms en 50 %.
a) El sueldo mensual S obtenido por un vendedor de la seccin
Electrnica se relaciona

con el monto V de sus ventas mediante la expresin S 0,07 V 35 ( Diez


miles $ ). Calcule el costo que tuvo para la Multitienda el pago de los sueldos
de los vendedores de dicha seccin el mes siguiente a la finalizacin del curso.

S 0,07 V 35

S 0,07 * 12100 35 882

S1 0,07 10980 35 803,6


S S1 78,4

(Diez miles $)

35

Medidas de dispersin
Son estadsticos que nos proporcionan una medida del mayor o menor
agrupamiento de los datos respecto a los valores de tendencia central. Todos
son valores mayores o iguales a cero siendo esto ltimo ausencia total de
dispersin.
Estas nos indicarn la variabilidad de los datos en torno a su valor promedio, es
decir si se encuentran muy o poco esparcidos en torno a su centro. Se pueden
definir entonces, diversas medidas de desviacin o dispersin, siendo stas
fundamentales para la descripcin estadstica de la muestra. Las medidas de
dispersin son estadsticos que nos proporcionan una medida del mayor o
menor agrupamiento de los datos respecto a los valores de tendencia central.
Existen varias medidas de dispersin (o variacin); las ms usadas son el rango, el rango
intercuartil y la desviacin estndar.

Rango. El rango de un conjunto de nmeros es la diferencia entre el nmero


mayor y el nmero menor del conjunto. Es la medida de variabilidad ms
sencilla. Y slo considera dos valores de la variable.
Rango = Valor mximo valor mnimo

El rango es muy fcil de calcular, pero como depende nicamente de los


valores mximo y mnimo, no es tan til como otras medidas de variacin que
incluyen cada valor. Es muy sensible a valores extremos.

Sin embargo, vale la pena resaltar que el rango se utiliza mucho en


aplicaciones estadsticas al control de calidad, donde lo comn es
emplear muestras con tamaos n = 4 o n = 5 ya que en estos casos la
prdida de informacin no se considera relevante.

Recorrido intercuartlico.
A partir de los cuartiles se pueden definir algunos ndices de dispersin. El ms
usado es la diferencia entre el tercer y el primer cuartil, Q3 - Q1, llamado
recorrido intercuartlico.

36

Esta medida que no se ve afectada por los valores extremos contiene el 50%
de los datos, dejando a la izquierda el 25% inferior de estos y a la derecha el
25% superior de las observaciones. Se representa por:

Q=Q 3Q1

En general, se desea una medida de variabilidad que dependa de todas las


observaciones y no slo de unas pocas; as que parece razonable medir la
variacin en trminos de las desviaciones relativas a alguna medida de
localizacin (generalmente esta medida es la media)
Varianza.
La varianza es una medida de variabilidad que utiliza todos los datos y el
promedio aritmtico de los cuadrados de las desviaciones respecto a la media
se representa por S 2 y se calcula mediante la formula
n

S 2=

( x ix )2ni
1

En forma simplificada:
n

S=

x i2ni
1

- x 2

Su inconveniencia al ser utilizada como medida de dispersin respecto a la


media, es que no viene expresada en la misma unidad de medida que sta, es
cuadrtica. Poe ello suele utilizarse en su lugar un estadstico que se deriva de
esta la desviacin tpica o estndar, se simboliza por S. La desviacin estndar
se define como la raz cuadrada positiva de la varianza
Y su frmula es:

S=

x i2ni
1

x 2

Algunas veces la desviacin estndar de una muestra de datos se define usando como el
denominador, en las ecuaciones (n 1) en lugar de n. Esto se debe a que el valor que as se
obtiene es una mejor aproximacin a la desviacin estndar de la poblacin de la que se ha
tomado la muestra. Con valores grandes de n (n > 30), prcticamente no hay diferencia entre las
dos definiciones.

La desviacin estndar es ms fcil de interpretar que la varianza debido a que


la desviacin estndar se mide en las mismas unidades que los datos.
Coeficiente de variacin o de variabilidad. (CV)
Los estadsticos anteriores han medido la dispersin en cifras absolutas.

37

El coeficiente de variacin CV es una medida de dispersin relativa y se


simboliza por:

CV

s
* 100
x

Su utilidad radica en que es independiente de la unidad utilizada en los valores


de la variable, por lo que se pueden comparar distribuciones cuyos datos estn
medidos en distintas unidades, por ejemplo pesos y dlares. Sin embargo es
poco prctico cuando la media es prxima a cero, por el valor tan desmesurado
que toma.
En general, el coeficiente de variacin es un estadstico til para comparar la
variabilidad de variables que tienen desviaciones estndar distintas y medias
distintas
Ejercicios
1. Suponga que un inversionista desea adquirir acciones en una de dos
compaas A o B, listadas en la Bolsa de Valores. Si ninguna de las compaas
ofrece dividendos a sus clientes y ambas tienen igual clasificacin (segn los
servicios de inversin) en trminos del crecimiento potencial, el inversionista
quiz considere la volatilidad o variabilidad de ambas acciones para ayudar en
la decisin de inversin.
Supngase que cada accin de la compaa A ha promediado $ 150.000 en
los ltimos meses, con desviacin estndar de $ 30.000. Adems, durante el
mismo perodo el precio promedio de las acciones en la compaa B fue de $
36.000 con una desviacin estndar de $ 12.000.
Cmo puede determinar el inversionista cules acciones son ms variables?
(Utilice los estadgrafos adecuados y realice los clculos necesarios para
argumentar su respuesta).

SA
30.000 $
100 %=
100 %=20 %
x A
150.000
SB
12.000
=
100 %=
100 %=33 %
x B
36.000

Como =20 %<=33 %, se puede concluir que el precio de las acciones


de la empresa B es ms variable que el precio de las acciones de la empresa A.

2. Un fabricante de pilas para linternas tom una muestra de 13 piezas de la


produccin de un da y las utiliz de forma continua hasta que comenzaron a
fallar. El resultado en horas de funcionamiento fue:
342, 426, 317, 545, 264, 451, 1049, 631, 512, 266, 492, 562, 298
a) Calcule la varianza, la desviacin tpica y el coeficiente de variacin.

38

b) Utilizando la informacin anterior, Qu se aconsejara al fabricante si l


deseara anunciar que sus pilas duran 400 horas?

N Pila

x =
1

1
2
3
4
5
6
7

Duraci
n (en
Horas)
342
426
317
545
264
451
1049

8
9
10
11
12
13
TOTAL

631
512
266
492
562
298
6155

2
116964
181476
100489
297025
69696
203401
110040
1
398161
262144
70756
242064
315844
88804
344722
5

X i 6155
=
=473,46 hrs .
n
13

2
x

S =

x 2
1
1

3447225 ( x ) =
13
2

( 473,46 )2 =41.005,33 hrs 2

S x = 41.005,33=202,50 hrs
202,50
CV =
100=42,77
473,46

Como el promedio de la muestra de 13 piezas de la produccin de un da es


473,46 horas podemos indicar que se superan ampliamente las 400 horas que
el fabricante deseara anunciar como duracin. Sin embargo, la media
aritmtica es un estadstico sensible a valores extremos, esto quiere decir que
si algn dato dentro de la muestra es muy alto o muy bajo, el promedio se ver
alterado.
Es interesante obtener otra medida estadstica central la mediana, la cual no
se ve afectada por valores extremos, puesto que slo se tienen en cuenta las
observaciones centrales de la muestra y es adecuada para distribuciones

39

asimtricas o cuando hay valores atpicos como es el caso de la muestra de


pilas. La Me es Me= 451 hrs. Si Sacamos el recorrido de la variable RV=707
horas. Resulta tambin alto, lo que indicara alta variabilidad de los datos esto
nos indicara que la alta dispersin se debe a la gran variabilidad existente
entre los datos y no a la existencia de valores extremos
1
1
1
1
1
1
1
1
1
1
1
1
1

La desviacin tpica es
cual nos indica que
muy alta en los datos
coeficiente
de
% podemos indicar
el tamao de la media
variable tambin es
refleja
una
gran
datos recopilados en
.
No es aconsejable
anuncie que sus pilas

264
266
298
317
342
426
451
492
512
545
562
631
1049

1
2
3
4
5
6
7
8
9
10
11
12
13

de 202,50 horas, lo
existe una dispersin
y
al
tener
un
variacin de un 42,77
que la relacin entre
y la variabilidad de la
muy alta, lo cual
heterogeneidad de los
la muestra.
que el fabricante
duran 400 horas.

3.-En una empresa se agrupan los sueldos en Miles de $, segn la


Seccin en la que el trabajador se desempea. La informacin es la siguiente:
Sueldos (en M$) en la Seccin Ventas
330 260 350 400 265 200 450 300 500 250
Sueldos (en M$) en la Seccin Produccin
240 260 300 250 265 200 400 250 300 200
Un reporte de la Seccin Recursos Humanos seala que la dispersin relativa de los
sueldos es mayor en la Seccin Ventas que en la Seccin Produccin. Usando el
estadgrafo adecuado seale si est de acuerdo o no con la afirmacin.
Sea X: Sueldo (en M$) en la Seccin Ventas e Y: Sueldo (en M$) en la Seccin
Produccin.

Seccin
Ventas
Sueldo
Trabajado (en M$)
r
1
330
2
260

Xi

108900
67600

Seccin
Produccin
Trabajador Sueldo (en M$)

Yi2
1
2

240
260

57600
67600

40

3
4
5
6
7
8
9
10
TOTAL

350
400
265
200
450
300
500
250
3305

122500
160000
70225
40000
202500
90000
250000
62500
1174225

3
4
5
6
7
8
9
10
TOTAL

300
250
265
200
400
250
300
200
2665

90000
62500
70225
40000
160000
62500
90000
40000
740425

10

X =

xi
1

3305
=330,5 M $
10
n10

y =

Yi
1

2665
=266,5 M $
10

S 2x =

x 2i
1

( x ) =

1.174 .225
2
( 330,5 ) =8.192,5 M $
10

S x = 8.192,5 =90,51M$

CV x =

90,51
100=27,39
330,5
n

2
y

S =

y 2i
1

- ( y )2 =

740.425
2
(266,5 ) =3.020,25M$
10

S x = 3.020,25 =54,96M$
CV y =

54,96
100=20,62
266,5

41

Como =27,39 %>=20,62 %, se comprueba lo sealado por la


seccin Recursos Humanos.
4.-Supongamos que dos empresas desean repartir beneficios entre sus
cuatro principales accionistas, y que el reparto se realiza de la siguiente forma
(en miles de bolvares)
Empresa A
Empresa B
1r accionista
100
1200
2 accionista
500
1300
3r accionista
300
1400
4 accionista
100
1100
Cul de los dos repartos el ms equitativo? Justifica el resultado en base al
anlisis estadstico del reparto.

x =

1000
=250
4

5000
Y =
=1250
4
Empres
aA
1r
accionista
2
accionista
3r
accionista
4
accionista

Empresa
B

Miles de Bolvares

Miles de Bolvares

( X i 2)

( Y i2 )

100

1200

10000

1440000

500

1300

250000

1690000

300

1400

90000

1960000

100
1000

1100
5000

10000
360000

1210000
6300000

2
x

S =

x 2i
1

( x )

360000
(250 )2=9000062500=27500
4

S x =165,83 Miles de Bolvares


n

2
B

S =

Y 2i
1

( y )

6.300 .000
- ( 1250 )2 =1.575.000-1.562.500=12500
4

S y =111,8 Miles de Bolvares

42

165,83
100=66,33
250
111,8
CV B=
100= 8,94 %El reparto es ms equitativo en la Empresa B.
1250

CV A=

Distribuciones Bidimensionales
Diremos que tenemos una muestra estadstica bidimensional cuando sobre
cada elemento de la muestra se realiza la observacin simultnea de dos
Variables.
Es muy frecuente que nos interese realizar el anlisis en ms de slo una
variable. Por ejemplo, una compaa aseguradora de autos podra estar
interesada en el nmero de vehculos propiedad de un tenedor de plizas, as
como en el nmero de quienes conducen un vehculo en la familia. Un
economista podra necesitar medir la cantidad gastada por semana en
comestibles en una familia, y tambin el nmero de personas de esa familia.
Un agente de ventas de bienes races podra medir el precio de venta de una
propiedad residencial y la superficie en pies cuadrados de la sala.
Cuando dos variables se miden en una sola unidad experimental, los datos
resultantes se denominan datos bivariados. Cmo se deben presentar estos
datos? No slo son importantes ambas variables cuando se estudian por
separado, sino que el experimentador tambin puede explorar la relacin entre
las dos variables. Los mtodos para graficar datos bivariados, ya sean
cualitativos o cuantitativos, permiten estudiar las dos variables juntas. Al igual
que con datos univariados, se usan diferentes grficas segn el tipo de
variables que se midan.
Tenemos en este caso una variable estadstica bidimensional, representada por
la pareja de smbolos (x, y) y que en general, para una muestra de n
elementos, podr tomar los valores (x1, y1), (x2, y2), ... , (xN, yN). Las
variables x e y no tienen por qu ser del mismo tipo, pudiendo ser cada uno de
ellas de tipo cuantitativo o cualitativo.
Adems en el caso de ser ambas variables cuantitativas cada una de ellas
podr ser continua o discreta.
Distribuciones de frecuencias de una variable bidimensional
De la misma manera que el anlisis de la distribucin de frecuencias de una
variable unidimensional constituye un primer paso para la descripcin
estadstica de la muestra, el estudio de la distribucin de frecuencias de una
variable bidimensional es de gran utilidad

43

Tabulacin de variables estadsticas bidimensionales.


Consideraremos dos tipos de tabulaciones.
Para variables cuantitativas, que reciben el nombre de tabla de Correlacin.
Para variables cualitativas, que reciben el nombre de tabla de Contingencia.
Al igual que en el caso unidimensional, el primer paso para el estudio de la
distribucin de frecuencias es la construccin de una tabla de frecuencias.
Supongamos que tenemos n pares de medidas de una variable bidimensional
(x, y). Diremos que dos pares de medidas sern iguales (o estarn repetidos)
cuando coincidan ambas componentes. Supongamos que x puede tomar los k
valores distintos x1, x2, . . . , xk, y que y puede tomar los l valores diferentes
y1, y2 . . Supongamos que tenemos n pares de medidas de una variable
bidimensional (x, y)., donde k no tiene porqu ser igual a l.. , yl .
Para construir la tabla de frecuencias habr que contabilizar el nmero de
veces que cada par distinto de la variable bidimensional aparece repetido,
ordenndose dichos valores en la llamada tabla de frecuencias de doble
entrada, donde en ordenadas se escriben los diferentes valores de x y en

x i Y j y 1
x1
n11
x2
x3
n31

y2

y3
n13

Yj

ni .

hi .

n22
n33

.
.
.

xi
n. j
h. j

abscisas los valores de y:

nij = n i . n. j =n
Tipos de Distribuciones.
Cuando se estudian conjuntamente dos variables, se originan tres tipos de
distribuciones:
Distribuciones Conjuntas, Distribuciones Marginales y Distribuciones
Condicionales.
a. Distribuciones Conjuntas.
La frecuencia relativa conjunta, del par (xi, yj) es el cociente entre la frecuencia
absoluta conjunta y el nmero total de observaciones: hij
b. Distribuciones Marginales.
Cuando trabajamos con ms de una variable y queremos analizar las
distribuciones de frecuencias de cada una de las variables unidimensionales de
manera independiente, se originan las distribuciones marginales.

44

Distribucin Marginal de la Variable

Xi
x1
x2
x3

ni .
n1.
n2.
n3

hi .

Xi
Ni.

Hi.

Ni.

Hi.

H. j

N. j

H. j

.
n

Distribucin Marginal de la Variable

Y j
y1
y .2
y3

n. j
n.1
n.2
n.3

h. j

Yj
N. j

.
n

c.
d. Distribuciones Condicionales.
Consideremos a los n.j individuos de la poblacin que representan la modalidad
yj de la variable Y, y obsrvese la columna j-esima de la tabla. Sus n.j
elementos constituyen una poblacin, que es un subconjunto de la poblacin
total. Sobre este subconjunto se define la distribucin de X condicionada por yj,
que se representa por X / yj; su frecuencia absoluta se representa por ni / j, y
su frecuencia relativa por hi / j, para i = 1, 2, 3,,

Siendo hi / j=

nij
. El
n. j

razonamiento es anlogo cuando condicionamos la variable Y a un


determinado valor de X, es decir Y /xi
Covarianza

La covarianza mide la forma en que varan conjuntamente dos variables X e Y,


lo que nos interesa principalmente es saber si existe algn tipo de relacin
entre ellas.
r

s xy =

xiy jnij i=1 j =1


n

xy

45

La covarianza no es un parmetro acotado, y puede tomar cualquier valor real,


por lo que su magnitud no es importante; lo significativo es el signo que adopte
la misma.
Al tener la covarianza entre ambas variables signo positivo, podemos deducir
que existe una relacin directa o positiva entre ambas variables, es decir,
cuando aumenta la X i tambin aumenta Y i
Si tiene signo negativo significa que existe una relacin inversa, y si es cero
que no existe ninguna relacin entre las variables.
Tablas de contingencia
Cuando tenemos la informacin de 2 variables de tipo cualitativo o de una
variable cualitativa y otra cuantitativa, se dispone de una tabla de
contingencia.
Como a las variables cualitativas no se les puede someter a operaciones de
sumas, restas y divisiones, al venir expresadas en escalas nominales u
ordinales no tiene sentido hablar de medias marginales, condicionadas,
varianzas, etc.; si podramos calcular la moda en el caso de que se empleara
una escala nominal y de la mediana si utilizamos escalas ordinales.
Dependencia e independencia
Independencia
Cuando no se da ningn tipo de relacin entre 2 variables o atributos, diremos
que son independientes. Existir dependencia cuando los valores de una
distribucin condicionan a los de la otra.
Dada dos variables estadsticas X e Y, la condicin necesaria y suficiente para
que sean independientes es:

ni .
nij n n . j
=
; i , j
n
n

Dependencia estadstica (existe relacin aproximada).


Existen caracteres que ni son independientes, ni se da entre ellos una relacin
de dependencia funcional, pero si se percibe una cierta relacin de
dependencia entre ambos; se trata de una dependencia estadstica.
Cuando los caracteres son de tipo cuantitativo, el estudio de la dependencia
estadstica se conoce como problema de regresin, y el anlisis del grado de
dependencia que existe entre las variables se conoce como problema de
correlacin.

Ejercicios
1.-

46

Se ha realizado una encuesta a un grupo de conductores de la lnea A para analizar su edad (


Y j ) y el nmero de accidentes que han sufrido ( X i ). A partir de la misma,
se obtuvieron los siguientes resultados:
X/Y
0
1
2
n. j

20,30

74
7
3
84

30,40
40,50
50,60

82
78
72
6
5
6
2
2
1
90
85
79
Xi
ni .
X ini .
X 2i ni .
0
0
0
313
1
29
29
29
2
18
36
9
47
65
351

[ 60,70 ]

ni .

7
5
1
13

313
29
9
351

A partir de estos
datos, se le pide que
determine para este
conjunto de
conductores:
a) Las medias y
varianzas de las
distribuciones
marginales.
Distribucin marginal de la variable Nmero de accidentes.

47
=0,13 accidentes
351
2
s =0,190,018=0,172
s=0,41
x =

Distribucin marginal de la variable Edad del conductor.

Yj

n. j

y jn. j

y 2jn . j

25
35
45
55
65

84
90
85
79
13
351

2100
3150
3825
4345
845
14265

52500
110250
172125
238975
54925
628775

x =
2 628775
x i =
=1791,38
351
2

S =1791,381651,69=139,69

14265
=40,64 aos
351

47

S=11,82aos
b) El nmero medio de accidentes que tienen los conductores con edades
comprendidas entre los 40 y los 50 aos.

Xi

n.3

x in.3

0
1
2

78
5
2
85

0
5
4
9

x =

9
=0,1 accidentes
85

c) La covarianza entre las dos variables.

y
- X
Cov ( x , y )= XY

= 0250,74+03582+ 04578+05572+0657+1257+ 1356


XY
351
=1.975/351=5,6

Y =5,3
X

Cov ( x , y )= XY

y =5,6-5,3=0,3
X

Relacin positiva
d) Qu edad tendra como mucho un conductor con un solo accidente para
encontrarse en el grupo del 20 % de los ms jvenes?

2030
3040
4050
5060
6070

n2.

N 2.

13

18

24

29

29

0,229N i1
ni
5,80
+ 10
7
+ 8,3 =28,3 aos

P20=Y i1 + Ci
P20=20
P20=20

Probabilidades

Las probabilidades en el ambiente de los negocios es una herramienta muy importante en la


toma de decisiones, quien toma las decisiones, pocas veces cuenta con la informacin completa

48

para hacerlo, al tomar una decisin se decide sobre situaciones que debern ocurrir en un futuro
cercano o no tan prximo, pero existe riesgo de que la decisin a tomar pueda no ser la correcta.
Esta medida del riesgo podra asociarse a una probabilidad o posibilidad de que las cosas no
salieran como estaba esperado, sino que por imponderables o tal vez futuras situaciones no
previstas puedan hacer fracasar las decisiones. Por otro lado el conocer las probabilidades de que
ocurran las cosas, ayuda a tomar una mejor decisin debido a que ayudan a confiar en la decisin
a tomar conociendo que si situaciones similares han ocurrido en el pasado, es probable que
puedan continuar en el futuro.

Experimento: Es cualquier proceso que genera resultados bien definidos.


Tipos de experimentos:
Experimentos Determinsticos: Son aquellos en donde no hay
incertidumbre acerca del resultado
que ocurrir cuando stos son repetidos varias veces.
Experimentos Aleatorios:
Son aquellos en donde no se puede anticipar el resultado que ocurrir, pero si
se tiene una completa idea acerca de todos los resultados posibles del
experimento cuando ste es ejecutado.
Espacio Muestral. Al conjunto de todos los resultados posibles de un experimento

aleatorio le denominamos espacio muestral o suceso seguro.


Tipos de espacios mustrales:
Espacios muestrales discretos: Son espacios muestrales cuyos elementos
resultan de hacer conteos, y por lo general son subconjuntos de los nmeros
enteros.
Espacios muestrales continuos: Son espacios muestrales cuyos elementos
resultan de hacer mediciones, y por lo general son intervalos en la recta Real.
Las decisiones en el mundo de los negocios a menudo se basan en un anlisis
de problemas asociados con la incertidumbre, tales como:

Cul es la posibilidad de que las ventas se reduzcan si incrementamos


los precios un 15%?

Cul es la probabilidad que un nuevo producto tenga xito?

Cul es la posibilidad de que el proyecto se termine a tiempo?

49

Cul es la probabilidad de que la nueva inversin sea exitosa?

Estos y muchos otros casos, de "posibilidades" asociados a la toma de


decisiones estn relacionados con un concepto estadstico muy conocido en el
mundo de los negocios y se conoce como "probabilidad"
La probabilidad es una medicin numrica de la posibilidad de que un evento,
hecho o suceso ocurra. De esta manera podra utilizarse como una medida del
grado de incertidumbre asociado a una decisin empresarial, segn los eventos
comentados precedentemente. Si estuviese disponible la probabilidad,
podramos determinar la posibilidad de ocurrencia de cada uno de los cuatro
eventos anteriores.
Los valores de probabilidad es comn asignarles en una escala de cero (0) a
uno (1). Un valor de probabilidad cercano a cero indica que la posibilidad de
ocurrencia del evento es poco factible, en cambio un valor de probabilidad
cercano a uno indica que es muy factible que ocurra el evento. Otros valores de
probabilidades entre cero y uno, representan distintos grados de confiabilidad
de que ocurra un evento. La grafica siguiente muestra esta condicin.
No ocurrir
1.0

Ocurrir
0.25

0.50

0.75

1.00

Un valor de probabilidad cercano a cero indica que la posibilidad de ocurrencia


del evento baja, en cambio un valor de probabilidad cercano a uno indica que
es muy factible la ocurrencia del evento. Otros valores de probabilidades entre
cero y uno, representan distintos grados de posibilidad de que ocurra el evento.
Al analizar un experimento en particular el primer paso es definir
cuidadosamente sus posibles resultados. Cuando hayamos definido todos los
resultados, tendremos el espacio muestral para el experimento. El espacio
muestral es el conjunto de todos los resultados posibles del experimento.
Cualquier resultado en particular se conoce como un punto muestral y
corresponde a un elemento del espacio muestral. Sobre estos puntos
muestrales se asigna la probabilidad.

50

Evento o suceso. Es un subconjunto del espacio muestral. Un evento es un


conjunto de puntos muestrales
Si se encuentran definidas las probabilidades de los eventos muestrales, la
probabilidad de un evento es igual a la suma de las probabilidades de los
varios puntos muestrales que componen el evento.
Tipos de sucesos.
Sucesos mutuamente excluyentes.
Son sucesos que no pueden ocurrir al mismo tiempo.

Perspectivas para asignar probabilidades:


La probabilidad de un resultado experimental es una medida numrica de la
posibilidad que ocurra el resultado experimental.
En la asignacin de probabilidades a resultados experimentales, deben
satisfacerse dos requisitos bsicos de probabilidades:
1. Los valores de probabilidad asignados a cada resultado experimental
deben estar comprendidos entre 0 y 1.
0 P (Ej.) 1
2. La suma de todas las probabilidades de los resultados experimentales,
debe sumar 1.
P (Ej.) = P (E1) + P (E2) + P (E3) + + P (En) = 1
Identificamos P (Ej.) como la probabilidad que ocurra el resultado j del
experimento E
En la prctica frecuentemente se usan el mtodo clsico, el mtodo de frecuencia relativa y el
mtodo subjetivo. Veremos a continuacin en que consiste cada uno de ellos.

Mtodo clsico de determinacin de probabilidades


En primer lugar debemos determinar el espacio muestral asociado. Suponiendo que un
experimento tiene n resultados posibles, entonces la probabilidad de cada evento es la misma,
esto es: 1/n

51

Ejemplo tirar un dado el espacio muestral de este es S = {1, 2, 3, 4, 5, 6} con seis posibles
resultados, por ello las probabilidades sern de 1/6 para cada uno. Ejemplo:
P(1) = 1/6 ; P(2) = 1/6 ; P(3) = 1/6 ; P(4) = 1/6 ; P(5) = 1/6 ; P(6) = 1/6
Originalmente el mtodo clsico se desarroll para analizar problemas concernientes con juegos
de azar, en los que a menudo es posible suponer resultados con igual probabilidad. Sin embargo
estas suposiciones no se cumplen siempre, por lo que se requieren mtodos alternativos para
determinacin de probabilidades.

La probabilidad clsica parte del supuesto de que los resultados de un


experimento son igualmente posibles.
Mtodo emprica o de frecuencia relativa.
sta se basa en el nmero de veces que ocurre el evento como proporcin del
nmero de intentos conocidos. El enfoque emprico de la probabilidad se basa
en la llamada ley de los grandes nmeros. Consideremos que una mayor
cantidad de observaciones proporcionarn un clculo ms preciso de la
probabilidad.
Considere una empresa que se est preparando para introducir un nuevo
producto en el mercado. A fin de estimar la probabilidad de que un cliente
adquiera el producto, se ha establecido una evaluacin del mercado de
pruebas en la que el personal de ventas visitar clientes potenciales. Existen
dos resultados posibles para cada una de las ventas realizadas: el cliente
compra o no compra el producto. No hay ninguna razn para suponer que
los resultados experimentales tengan o deban tener igual posibilidad, por lo
que ya no resulta practico el mtodo clsico de asignacin de probabilidades.
Suponga que en la evaluacin del mercado de prueba del producto se hizo
contacto con 500 clientes potenciales; 100 de ellos compraron el producto,
pero 400 no lo hicieron. En efecto, entonces, hemos repetido el experimento
500 veces de entrar en contacto con un cliente y hemos encontrado que el
producto solo fue comprado 100 veces del total, por lo que podramos decidir
utilizar la frecuencia relativa del nmero de clientes que compraron el producto
como una estimacin de la probabilidad.

52

Mtodo subjetivo
Probabilidad de un evento en particular que asigna un individuo a partir de
cualquier informacin que encuentre disponible.
Los mtodos clsicos y de frecuencia relativa, no pueden aplicarse en todas las situaciones en las
que se desea asignar probabilidades, en algunos casos los resultados no tienen igual probabilidad
de ocurrencia, en otros no hay informacin de frecuencias relativas.
En el mtodo subjetivo, podremos utilizar cualquier dato disponible, adems de nuestra
experiencia e intuicin, Sin embargo una vez considerada toda la informacin disponible,
debemos especificar un valor de probabilidad que exprese nuestro grado de creencia de que
ocurra un resultado experimental.

Algunas reglas para calcular probabilidades.


Regla aditiva de las probabilidades.
Existen dos reglas de la adicin, la regla general y la especial de la adicin.

Reglas de la adicin.
Regla general de la adicin.
Los resultados de un experimento pueden no ser mutuamente excluyentes.
P(A o B) = P(A) + P (B) P(A y B)
En el caso de la expresin P(A o B), la palabra o sugiere que puede ocurrir A o
puede ocurrir B. Esto tambin incluye la posibilidad de que A y B ocurran.
Cuando dos eventos ocurren al mismo tiempo, la probabilidad se denomina
probabilidad conjunta.
Regla especial de la adicin

Si dos eventos A y B son mutuamente excluyentes, la regla especial de la


adicin establece que la probabilidad de que ocurra uno u otro es igual a la
suma de sus probabilidades.
P(A o B) = P(A) + P (B)
Reglas de la multiplicacin
Existen dos reglas de la multiplicacin, la regla especial y la regla general.
Regla general de la multiplicacin
Esto ocurre si dos o ms eventos son dependientes.
Cuando el evento B ocurre despus del evento A, y A influye en la probabilidad
de que el evento B

53

suceda, entonces A y B no son independientes.


Probabilidad condicional
Probabilidad de que un evento en particular ocurra, dado que otro evento haya
acontecido.
Se define por:

P( A/ B)=

P (A B)
P( B)

si P( B)> 0

Regla general de la multiplicacin

P( A B)=P( A) P(B / A)
Regla especial de la multiplicacin
La regla especial de la multiplicacin requiere que dos eventos, A y B, sean
independientes, y lo son
si el hecho de que uno ocurra no altera la probabilidad de que el otro suceda.
Independencia de sucesos si un evento ocurre, no tiene ningn efecto sobre la
probabilidad de que otro
evento acontezca.

P(A y B) = P(A) P (B)


Teorema de la probabilidad Total
Supongamos un conjunto de sucesos
divisin del espacio Muestral

A1 , A2, , Ak

constituyendo una

S (la unin de todos ellos tales la unin de estos sucesos es el suceso S, o sea
son sucesos exhaustivos
y adems son mutuamente excluyentes. Es decir

A 1 A 2=

Supongamos ahora un Evento B que est relacionado con todas las particiones
del espacio muestral E.

aA A

A2
ByA1

A1

54

ByA
2
ByA3

A3

Ai
P( B)=P( Ai ) P( B / A i)
i=k

P ( B )=
i=1

P( B)=P( A 1) P( B/ A 1)+ P( A 2)P( B / A 2)+ P(A 3)P(B/ A 3)


Regla de Bayes
Supongamos un conjunto de sucesos A 1 , A 2 , , A k ; k subpoblaciones
mutuamente excluyentes y exhaustivas con probabilidades previas P (A1), P (A2),...,
P (Ak). Si ocurre un evento B, la probabilidad posterior de Ai dada B es la
probabilidad condicional.

P( Ai/ B)=

P( A i) P( B/ A i )
P (B)

Ejercicios
En la tabla siguiente se muestran algunas caractersticas de los 10.000
solicitantes de prstamos de una importante Institucin Financiera.
Grado de
Tipo
Riesgo
de prstamo
Personal (P)
Hipotecario
(H)
Total

Riesgo Bajo
(B)

Riesgo
Mediano (M)

Riesgo Alto
(A)

Total

2250
750

4000
1200

1200
600

7450
2250

3000

5200

1800

10000

Para responder a las preguntas que siguen construiremos una tabla de


probabilidades.
Grado de
Tipo
Riesgo
de prstamo
P
H

0,225
0,075

0,400
0,120

0,120
0,060

Total

0,745
0,225

55

Total

0,300

0,520

0,180

Se les ha clasificado conforme a dos variables: Tipo de Prstamo y al Grado de


Riesgo.
Suponga que se escoge en forma aleatoria la cuenta de uno de los solicitantes
de prstamos.
a) Qu probabilidad existe que la cuenta escogida sea de las
catalogadas como Riesgo Mediano (M)?

P ( M ) =0,52
b) Qu probabilidad existe de que se trate de una transaccin de
Riesgo Alto (A) si el tipo de prstamo se sabe es de Tipo Hipotecario
(H)?

P( A/ H )=

P ( A H)
P( H )

P( A/ H )=0,060 /0,225=0,267
c) Qu probabilidad hay de que la cuenta escogida sea un Prstamo
Personal (P)?

P ( P )=0,745
d) Qu probabilidad existe que la cuenta escogida sea un Prstamo
Hipotecario (H) si fue catalogado de Riesgo Mediano (M)?

P( H / M )=( P(H M ))/(P( M ))

P( H / M )=0,120/0,520=0,231
e) Sea A el evento el solicitante de prstamo fue clasificado de Alto
Riesgo (A) y B el evento que l solicit un prstamo de Tipo Personal
(P). Son independientes los eventos A y B?

P ( A B ) =P ( A )P ( B )
0,120 0.134
Los eventos no son independientes.
f)

Cul es la probabilidad de que los Grados de Riesgo sean Bajo (B) o


de Alto Riesgo (A)?
Son esos sucesos mutuamente excluyentes?

P ( BUA )=P ( B ) + P ( A )P( B A )

56

La P( B A) =0 pues ambos sucesos no pueden ocurrir al mismo tiempo,


son mutuamente excluyentes.

P ( BUA )=0,300+ 0,180=0,480


PROCESOS ESTOCSTICOS FINITOS
Un proceso estocstico finito, se refiere a una sucesin finita de experimentos,
de tal suerte que cada experimento tiene un nmero finito de resultados.

Un proceso estocstico, como su nombre lo indica es un proceso que implica


una sucesin finita de pasos.
PROCESOS ESTOCSTICOS FINITOS Y RBOLES DE PROBABILIDADES

La mejor manera de formular un proceso estocstico, es mediante la utilizacin


del diagrama de rbol, de tal manera que cada columna de ramales del
diagrama, se refiera al conjunto de posibles resultados de cada experimento.
As pues, la primera columna de ramales se refiere a los resultados posibles del
primer experimento (primer paso), la segunda columna de ramales se refiere a
los posibles resultados del segundo experimento (segundo paso), etc. A cada
uno de los resultados posibles del experimento se le debe asignar la
probabilidad correspondiente.
De acuerdo a lo anterior, si se desea calcular la probabilidad de un evento
cualquiera, basta con multiplicar entre si las probabilidades de cada una de los
resultados de acuerdo a la ruta que sigue el evento solicitado, segn el
principio de la multiplicacin en la probabilidad condicional.

Supongamos las siguientes cajas:


La caja X tiene 10 ampolletas, de las que 4 son defectuosas.
La caja Y tiene 6, de las que slo una es defectuosa.
La caja Z tiene 8, de las que 3 estn defectuosas.
Se escoge una caja al azar, y entonces se escoge una ampolleta al azar de la
caja elegida. Hallar la probabilidad p de que la bombilla no sea defectuosa.
Podemos identificar dos experimentos en sucesin:
1. La eleccin de una de las tres cajas.
2. La eleccin de una ampolleta que puede ser defectuosa (D) o no
defectuosa (ND)

57

p ( D )=

p ( ND )=
P(CX)=

2
5

3
5

1
3

p ( D )=
p (CY )=

1
3
p ( ND )=

p (CZ )=

1
6

5
6

1
3
p ( D )=

3
8

p ( ND )=

5
8

El diagrama de rbol anterior describe el proceso y nos da la probabilidad en


cada rama del rbol.
El teorema de la multiplicacin nos dice que la probabilidad de un sendero
dado del rbol es el producto de las probabilidades de cada rama del sendero.
Por ejemplo, la probabilidad de elegir la caja CX y una bombilla no defectuosa
ND de dicha caja X es:

1
3
3
1
=
5
5
Si nuestro inters se concentra en elegir al azar una bombilla ND. Como hay
tres caminos independientes que nos llevan a una bombilla no defectuosa,
la suma de las probabilidades de estos caminos nos da la probabilidad
requerida.

1
1
1
3
5
5
3
3
3
247
p ( ND )=
+
+
=
0,686
5
6
8
360
LEY DE PROBABILIDAD TOTAL
B

A1

58

A3

A2

Es una de las aplicaciones ms importantes de la probabilidad condicional y se


enuncia en la siguiente forma: Si generalizamos el diagrama anterior, se tienen
K sucesos mutuamente excluyentes: A1, A2, A3........Ak, cuya unin es igual al
espacio muestral S y si adems se tiene otro suceso B relacionado con los K
sucesos anteriores, entonces se cumple que:

B=S B

A
( 1 B) ( A 2 B ) ( A 3 B ) ( A k B)
B=
A
( 1 B) p ( A 2 B ) p ( A 3 B ) p( A k B)
p ( B )= p
Como se trata de la unin de eventos mutuamente excluyentes, entonces la
probabilidad de la unin es igual a la suma de las probabilidades, segn el
axioma aditivo de probabilidad, as:

A
( 1 B)+ p ( A 2 B )+ p ( A 3 B ) + + p( Ak B)
p ( B )= p
Aplicando la Ley multiplicativa de probabilidad para eventos dependientes:

A
A2

B / A2
A3

B / A3
( 1)p ( B / A 1 ) + p
p ( B )= p

59

LEY DE PROBABILIDAD DE BAYES PARA K EVENTOS


Si se tienen K sucesos mutuamente excluyentes: A1, A2, A3........Ak, y exhaustivos, y si adems
se tiene otro suceso B relacionado con los K sucesos anteriores, entonces se cumple que:
n

p ( A i )p( B/ Ai )=
i=1

p( Ai/ B)=

p( Ai)p( B/ Ai )

p( Ai/ B)=

p ( Ai )p( B/ Ai)
p( A 1)p (B / A 1)+ p( A 2)p (B / A 2)+ p( A 3)p (B / A 3)++ p ( A k )p( B/ Ak )

i=1, 2,3, , k

Ejemplo:
Para la elaboracin de sus productos, una empresa adquiere el 30 % , 50 % y 20
% de la materia prima a sus proveedores A , B y C respectivamente. Si la
empresa adquiere la materia prima al proveedor A, la probabilidad que la reciba
con retraso, es del 80 %, probabilidades que para los proveedores B y C, son
del 10 % y 40 % respectivamente.
Si la empresa solicita un pedido de materia prima y lo recibe con retraso, Cul
es la probabilidad que haya hecho el pedido a su proveedor C ?

S-ar putea să vă placă și