Sunteți pe pagina 1din 71

APUNTES SOBRE MÉTODOS ESTADISTICOS

Generalmente cuando se escucha la palabra Estadística inmediatamente se piensa en datos, cuadros,

gráficos, etc. En verdad no es una idea equivocada, sino más bien, una idea popular de ésta, pero no

es lo único y en la concepción de la Estadística Moderna tampoco el más importante.

Las primeras técnicas estadísticas consistían principalmente en la organización, presentación gráfica

y el cálculo de ciertas cantidades "sobresalientes de un grupo de datos. Esta parte de la disciplina es

lo que, en la terminología moderna, se conoce como Estadística Descriptiva.

La Estadística Descriptiva es la rama más antigua de la Estadística y tiene por objetivo, presentar

información de una manera sencilla y estética y que al mismo tiempo, sea aprehensible al ojo humano,

es decir, fácil de entender. Aunque su campo de acción se ha visto reducido, es indudable su utilidad.

Para que la Estadística Descriptiva cumpla su cometido utiliza tres métodos, Métodos Tabulares,

Métodos Gráficos y Métodos Numéricos.

Supóngase ahora, que se está interesado en saber cuál es el ingreso promedio de las personas que

tienen pensión en el mercado los Pozos, de Santa de la Sierra, Bolivia. Supóngase además, que este

sector ha crecido de tal forma que se hace imposible estudiarlas en su totalidad. Por tal razón se

deduce una muestra de esta población por cualquier mecanismo aleatorio y se realiza la toma de la

información deseada y se obtiene un dato promedio cualquiera, por ejemplo, Bs 550. A través del

método de razonamiento que conduce a una extensión de este resultado a la población de interés, se

podría concluir que las personas que tiene pensiones en dicho mercado, tiene un ingreso promedio de

Bs 550.

El mismo hecho de que se está estudiando una fracción de la población, indica que se tiene una

información incompleta y que es, lo comúnmente que pasa en la realidad; pero, ¿qué pasa si el azar

proporcionó las personas con pensiones que venden más o bien que venden menos?. Si se da el primer

caso se estaría sobreestimando y en el caso contrario subestimando el ingreso promedio de estas

personas. En este momento surge una duda sobre la información que en Estadística Moderna se la

conoce generalmente como Incertidumbre y que siempre estará presente en conclusiones que se

deriven por medio del método inductivo.


Ahora la pregunta que surge es la siguiente, ¿qué papel juega la Estadística en esto?. El papel de la

Estadística en este proceso es cuantificar la incertidumbre y la rama de la estadística que se

encarga de ello se le llama Estadística Inferencial que utiliza el método Probabilístico.

En conclusión ya sea porque la se dispone de información incompleta, o debido a la propia variabilidad

de la información (naturaleza), es muy común que se arribe a conclusiones a través del método

inductivo, en el cual las mismas son inciertas. El conjunto de técnicas que permite realizar

inducciones en las que el grado de incertidumbre es cuantificable, integran la rama de la Estadística

conocida como Inferencia Estadística o Estadística Inductiva o Inferencial.

POBLACIÓN, ATRIBUTOS Y VARIABLES

Se dice que los estadísticos extraen datos de las muestras y que esta información les sirve para

hacer inferencia sobre la población que la muestra representa. Es así que, los términos, muestra y

población se consideran relativos.

El concepto de población va a variar de acuerdo al campo de la ciencia donde se aplique. Desde un

punto de vista estadístico, población; es el conjunto de resultados potenciales de un experimento

aleatorio, es decir, todos los valores que puede tomar una característica (variable).

En palabras más sencillas se puede decir que población, es un conjunto de entes con características

propias que los diferencian de otras. Con este concepto se puede tener una población de árboles, de

sillas, de tizas, etc. Un aspecto importante a retomar es que desde el punto de vista estadístico una

población es importante cuando se requiere verificar (medir) una característica (variable) en ella.

Atributos

Supóngase el siguiente ejemplo. Se tiene en un aula de clase un grupo de 20 estudiantes y suponga

además, que el estudiante de la primera fila es alto, color de piel blanca, cabello castaño, ojos claros,

etc. Si a los 20 estudiantes se les considera como una población, se puede decir que los detalles

antes mencionados corresponden a características propias de un miembro de esa población, o sea,

son atribuciones propias del estudiante en particular.

Con el ejemplo antes citado, se puede tratar de deducir un concepto de Atributo, diciendo que es

una característica propia de cada elemento de una población.

Variable
Retomando el ejemplo anterior, supóngase ahora, que se les pregunta a los cinco primeros estudiante

su estatura los cuales responden de la siguiente manera:

1.76, 1.69, 1.83, 1.72, 1.77

De hecho estas alturas corresponde a atributos de los cinco primeros estudiante. Si se observan los

datos anteriores, se puede constatar que el atributo estatura cambia de un estudiante a otro. Con

esta idea se puede plantear un concepto de variable.

Variable es un atributo medible que cambia de un elemento a otro de la población, es decir, es toda

característica que cambia y que está sujeta a medida o cuenta.

Supóngase ahora, que los cincos primeros estudiantes poseen la misma altura, ejemplo, 1.73. Dado

que el atributo altura en este caso no cambia, no se puede considerar como una variable, pero sí, es

un atributo. De lo anterior se puede concluir, que una variable siempre será un atributo, pero un

atributo no siempre es una variable.

Las variables siempre se denotan por la letras mayúsculas del alfabeto y los valores que toman

(observaciones) con letras minúsculas.

ELEMENTOS DE LAS VARIABLES

Siempre que se desee constatar una variable en un elemento de la población de interés, ésta debe de

poseer cuatro elementos:

a.- Nombre

b.- Definición

c.- Conjunto de categorías o valores que puede tomar la variable

d.- Procedimiento que permita clasificarla

Nombre

Cuando un investigador toma los datos correspondiente a una variable, éste tiene que saber el

nombre de la variable, de lo contrario cómo va a tomar información de una variable si no sabe el

nombre de ésta.

Definición

Todo investigador tiene que definir la (s) variable (s) que va a estudiar. Este nombre es cómo se

concibe la variable en el campo de la ciencia correspondiente, es decir, cómo se define. Si el

concepto no existe, se debe construir el constructo por parte de investigador.


Por ejemplo, supóngase que un investigador está tomando el peso a un grupo de niños, El toma los

datos cuando los niños no han desayunado y sin ropa alguna. Este investigador tiene que reportar al

momento de dar a conocer la información cómo lo hizo porque quizás otro investigador lo puede

haber tomado con ropa y después de desayunar. Inclusive debe de especificar el equipo con el cual

verificó el valor de la variable en los elementos de la población estudiados dado que pueden variar en

precisión.

Conjunto de categorías o valores que puede tomar la variable

Esta se refiere a las categorías convencionalmente admitida por la sociedad. Por ejemplo; si en un

grupo de personas se mide la variable sexo, de hecho se refiere al sexo anatómico y no al

comportamiento sexual, por lo tanto las categorías que puede tomar son masculino ó femenino o bien

macho ó hembra.

Si la variable es edad, entonces según el estadío donde se mida puede ser días, semanas, meses,

años.

Procedimiento que permita clasificarla

Este elemento de las variables en muchos casos es muy complejo, pero se soluciona en parte si

existe una adecuada definición de la variable que el investigador desee medir. Si se retoma el

ejemplo anterior donde se quiere medir la variable sexo en un grupo de personas. En este caso la

variable se define como sexo anatómico de cada persona que componen al grupo. Ahora bien, el hecho

de que una persona diga que es de sexo masculino no implica que no sea homosexual, pero no es la

conducta sexual la que se está midiendo, sino el sexo anatómico. Por tal razón, aunque este elemento

de la variable es complejo, con una definición clara de lo que se desea medir se resuelve.

De acuerdo a los valores que puede tomar una variable, ésta se puede clasificar en:

Variables cualitativas: no se pueden medir numéricamente, representan características de las

variables (categorías, por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

Por su parte, las variables cuantitativas se pueden clasificar atendiendo a los valores que pueden

tomar en discretas y continuas:


Discretas: Son todas aquellas que toman valores que se pueden contar, es decir, que se pueden

enumerar (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc, pero, por

ejemplo, nunca podrá ser 3,45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un

vehículo puede ser 80.3 km/h, 94.57 km/h..., etc.

ESCALAS DE MEDICIÓN

Medir una variable significa constatar la observación en los elementos de la población que es objeto

de estudio, es decir, consiste en verificar que valor toma la variable en la unidad de análisis. Lo

anterior implica que para medir una variable, ésta tiene que ser observable en el mundo real,

manteniendo el principio fundamental de la construcción de una variable que consiste en que sus

categorías deben de ser totalmente inclusivas y mutuamente excluyentes.

En Estadística se definen cuatro niveles o escalas de medición las cuales son:

a.- Escala Nominal: En esta escala lo único que puede decirse de una observación es a cuál de un

cierto número de categorías pertenece.

En esta escala de medición la única relación que puede establecerse entre observaciones es la de

igualdad y por lo tanto de desigualdad. Dos observaciones son iguales si están en la misma categoría

(llamadas también clases) y diferente si no lo están. Como consecuencia de lo anterior, la única

estadística válida para este tipo de datos es la frecuencia de cada clase.

Ejemplo, supóngase que en grupo de personas se desea medir el estado de salud con respecto a una

enfermedad en particular. En este caso la constatación de la variable (medición) en los miembros de

la población debe de concluir en que están o no afectados por la enfermedad.

b.- Escala Ordinal: Las observaciones medidas en esta escala pueden ordenarse de menor a mayor,

y en consecuencia no sólo se admiten las relación de igualdad, sino además la de mayor que y menor

que. Muchos de los estudios realizados en las Ciencias Sociales producen observaciones que son

medidas bajo esta escala, por lo difícil que es medir actitudes en los seres humanos.

En esta escala además de calcularse frecuencias como en la escala nominal, se puede calcular una

medida de tendencia central llamada Mediana.


Un ejemplo clásico de esta escala es la jerarquización que existe en la iglesia y el ejército.

Coronel > Teniente > Subteniente > Sargento > Cabo > Soldado

c.- Escala de Intervalo: Con observaciones en esta escala no sólo se pueden ordenarse las

observaciones, sino que además puede definirse una unidad de distancia (puede ser arbitraria) entre

ellas. La principal diferencia de esta escala con la de Proporciones es que en la escala de Intervalo el

cero y la unidad de distancia son arbitrarios y, en particular, el cero no corresponde a una

característica física de las unidades de medidas. Un ejemplo clásico en esta escala es la medición de

la temperatura.

Dado que los requisitos indispensables para efectuar sumas y productos son que existan ceros y una

unidad de distancia, con las observaciones medidas bajo esta escala puede calcularse medidas de

tendencia central como la media y de dispersión como la varianza. Por tal razón esta escala es más

fuerte que la Nominal.

b.- Escala de Proporción o Razón: En esta escala las observaciones pueden ordenarse y existen un

cero y una unidad de distancia que son inherentes al sistema, es decir, que no son arbitrarios.

Ejemplos típicos de características medidas en esta escala el peso de un individuo, el rendimiento

por hectárea de una planta, etc. Esta es la escala de medición más fuerte que existe y por lo tanto

permite el cálculo de cualquier estadística.


ORGANIZACIÓN DE LA INFORMACIÓN

Resulta de mucha importancia en el campo de la investigación, utilizar técnicas que permitan apreciar

de una forma rápida y fácilmente aprehensible un tipo de información donde se resalten los aspectos

más importantes. Estas técnicas o métodos deberán poseer características o propiedades que

faciliten lo antes mencionado. Entre estas propiedades se pueden mencionar las siguientes:

1. Que proporcionen la máxima cantidad de información contenida en los datos en forma rápida

y fácil de visualizar.

2. Que posean sencillez operativa

3. Que permitan presentar los datos de una manera estética.

La Estadística Descriptiva, como se ha mencionado antes, tiene como propósito mostrar la

información de forma sencilla, es decir, entendible. Para ello hace uso de tres métodos los cuales

son: Métodos Tabulares y Gráficos y Métodos Numéricos. Entre los métodos tabulares están las

Tablas de Frecuencias o Tablas de Distribución de Frecuencias.

NOTACIÓN DE SUMATORIA. PROPIEDADES

Supóngase que la variable X, toma los valores de x1, x2, x3, ..., xn. Entonces, la suma de los valores xi

de la variable X sería: x1 + x2+ x3 +... xn.

Con el objeto de expresar esta suma de una manera más resumida, se hace uso de la letra griega

Sigma mayúscula ( ), la cual es el símbolo utilizado en matemáticas para indicar la suma, de tal

manera que:

i=1nXi; donde:
i=1 se lee como la suma de i=1 a i=n de x, lo cual indica que la variable x toma valores para i=1, 2, 3, ...,
n, o sea:

i=1nXi=x1+x2+…xn

“i” se llama índice de suma y es una variable que toma los valores 1, 2, 3, ..., n.

La expresión i=1 indica en este caso que 1 es el valor inicial de i (no siempre el valor inicial comienza

de 1).

La n arriba del signo, indica el último valor de i.

A xi se le llama sumando
Propiedades de la sumatoria

Sean x1, x2,..., xn y y1, y2,..., yn dos conjuntos de datos, y “b” y “c” dos constantes arbitrarias.

Entonces:

n n n n n
a. ∑ bxi = b∑xi b. ∑ (xi + yi) = ∑ xi + ∑yi
i=1 i=1 i=1 i=1 i=1

n n n
c. ∑ c = nc d. ∑ (b + cxi) = nb + c∑ xi
i=1 i=1 i=1

n
e. ∑ c = (n-m + 1)c
i=m

La demostración de cada una de estas propiedades se deja como práctica para el estudiante.
METODOS TABULARES

Tablas de Frecuencias Relativas y Absolutas

Como una antesala de lo que son tablas de frecuencias relativas y absolutas se menciona a

continuación las formas iniciales de presentación de información, sus ventajas y desventajas de tal

manera que el estudiante comprenda la lógica de cada uno y por qué se usa una en vez del otra.

Una de las primeras formas de presentación de información es el arreglo de los datos el cual es una

de las formas más sencillas de presentar datos. Pone los valores en orden ascendente o descendente.

Por ejemplo, a continuación se muestran las concentraciones de cloro en partes por millón (ppm) de

30 galones de agua tratada.

Concentraciones de cloro en ppm de 30 galones de agua tratada

15.6 16.2 15.8 15.8 15.8 16.3


16.0 15.7 16.0 16.2 16.1 16.8
16.8 16.4 15.2 15.9 15.9 15.9
16.0 15.4 15.7 15.9 16.0 16.3
16.3 16.4 16.6 15.6 15.6 16.9

Una forma sencilla de arreglar estos datos es presentarlos en orden ascendente o descendente. Si

se arreglan de manera ascendente quedarían de la siguiente forma:

15.2 15.7 15.9 16.0 16.2 16.4


15.4 15.7 15.9 16.0 16.3 16.6
15.6 15.8 15.9 16.0 16.3 16.8
15.6 15.8 15.9 16.1 16.3 16.8
15.6 15.8 16.0 16.2 16.4 16.9

Este arreglo de datos ofrece varias ventajas sobre los datos originales o sin arreglar:

• Se pueden localizar rápidamente los valores mínimos y máximos en los datos. En el ejemplo,

el valor mínimo es 15.2 y 16.9 el máximo.

• Los datos se pueden dividir en secciones (clases)

• Fácilmente se puede apreciar que valores se repiten más de una vez.


Un inconveniente de esta forma de presentación de información es que siempre se sigue manejando

toda la masa de información y por lo tanto es muy tedioso emplearla en bases datos muy grandes.

Esto quiere decir, que esta forma de presentación de información no tiene capacidad de síntesis, de

aquí que es preferible presentarlos en Cuadro de distribución de frecuencias.

Al número de veces que se repite una observación dentro de una colección de datos se le llama

Frecuencia Absoluta (fi). La suma de éstas tiene que ser igual al tamaño de la colección de datos

(∑fi = n), en este caso 18 + 12 = 30 (total de las observaciones). A la relación de cada frecuencia

absoluta con respecto al total, se le llama Frecuencia Relativa (fr = fi/∑fi), la suma de esta tiene

que ser igual a 1 o bien a 100 si se le expresa en porcentaje. Este tipo de arreglo es importante

cuando la colección de datos es pequeña.

Los datos anteriores arreglados en un cuadro de distribución de frecuencia se muestran a

continuación:

xi fi fr xi fi fr
15.2 1 3.33 16.1 1 3.33
15.4 1 3.33 16.2 2 6.67
15.6 3 10.00 16.3 3 10.00
15.7 2 6.67 16.4 2 6.67
15.8 3 10.00 16.6 1 3.33
15.9 4 13.33 16.8 2 6.67
16.0 4 13.33 16.9 1 3.33
Total 18 60.00 Total 12 40.00

Hay autores que consideran la siguiente forma de presentación de cuadros de frecuencia donde

incluyen elementos que son propios de las Tablas de Frecuencias Absolutas y Relativas. Esto se

muestra a continuación

Variable Frecuencias absolutas Frecuencias relativas


xi Simple(fi) Acumulada (fia) Simple (fr) Acumulada (fra)
X1 f1 f1 fr1 = f1 / ∑fi Fr1
X2 f2 f1 + f 2 fr2 = f2 / ∑fi fr1 + fr2
... ... ... ... ...
Xn-1 fn-1 f1 + f2 +…+ fn-1 fr-1 = fn-1 / ∑fi fr1 + fr2 +…+ fr-1
Xn fn ∑fi= n frn = fn / ∑fi 1 ó 100

Veamos un ejemplo:

Medimos la altura de los niños de una clase con instrumental de precisión y en condiciones adecuadas,

escogiendo a todos sus componentes, 30 sujetos, y obtenemos los siguientes resultados (m):

Alumno Estatura Alumno Estatura Alumno Estatura


1 1.25 11 1.23 21 1.21
2 1.28 12 1.26 22 1.29
3 1.27 13 1.30 23 1.26
4 1.21 14 1.21 24 1.22
5 1.22 15 1.28 25 1.28
6 1.29 16 1.30 26 1.27
7 1.30 17 1.22 27 1.26
8 1.24 18 1.25 28 1.23
9 1.27 19 1.20 29 1.22
10 1.29 20 1.28 30 1.21

Puesto que todas las tallas están comprendidas entre 1.20 y 1.30 m., podemos agruparlas por

centímetros formando 11 grupos indicando cuántos niños presentan cada uno de los valores. Si

presentamos esta información estructurada (agrupada) en un cuadro de frecuencias obtendríamos la

siguiente:
Cuadro de frecuencia

Frecuencias
Observación
fi fia fr (%) fra
1.20 1 1 3.33 3.33
1.21 4 5 13.33 16.66
1.22 4 9 13.33 30.00
1.23 2 11 6.67 36.66
1.24 1 12 3.33 40.00
1.25 2 14 6.67 46.66
1.26 3 17 10.00 56.66
1.27 3 20 10.00 66.66
1.28 4 24 13.33 80.00
1.29 3 27 10.00 90.00
1.30 3 30 10.00 100.00
Total 30 100

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces,

entonces conviene agruparlos por intervalos mayores. ya que de otra manera obtendríamos una tabla

de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis.

Supongamos que ahora medimos la estatura de los habitantes de una vivienda (también 30 personas)

y obtenemos los siguientes resultados (m):

Habitante Estatura Habitante Estatura Habitante Estatura


1 1.15 11 1.53 21 1.21
2 1.48 12 1.16 22 1.59
3 1.57 13 1.60 23 1.86
4 1.71 14 1.81 24 1.52
5 1.92 15 1.98 25 1.48
6 1.39 16 1.20 26 1.37
7 1.40 17 1.42 27 1.16
8 1.64 18 1.45 28 1.73
9 1.77 19 1.20 29 1.62
10 1.49 20 1.98 30 1.01

Los datos son menos homogéneos (más dispersos) que en el caso de los niños de un grupo escolar

(todos de la misma edad) y si presentáramos esta información en un cuadro de frecuencia

obtendríamos 30 líneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con
una frecuencia relativa del 3.3%. Esta tabla nos aportaría toda la información inicial, pero sería muy

difícil de manejar si en vez de 30 personas fueran 300. 3000 o más: en definitiva, de escaso valor

práctico. Lo que quiere decir lo anterior, es que si bien es cierto que los cuadros de frecuencias

tienen más capacidad de resumir la información, esto no siempre se logra ya que depende de las

características propias de la información.

En lugar de ello, podríamos agrupar los datos por intervalos llamados también Tablas de Frecuencias

Absolutas y Relativas, con lo que la información queda más resumida (se pierde por tanto algo de

información), pero es más manejable e informativa.

Una tabla de frecuencia absoluta y relativa no es más que la agrupación de una base de datos en

subgrupos llamados clases o intervalos de clases.

Cada intervalo de clase o clase posee dos elementos, Límite inferior y Límite superior. La semisuma

de ambos origina un elemento más en una tabla de frecuencia absoluta y relativa denominado Punto

medio de clase (PMC) o bien Marca de clase.

El primer tropiezo que se afronta es decidir cuántas grupos o clasesdeberán establecerse y si éstas

tendrán la misma anchura. Es recomendable en la práctica utilizar entre 5 y 20 clases inclusive hay

autores que recomiendan hasta 25 clase, y normalmente conviene construirla de modo que todas las

clases tengan la misma anchura. La anchura de clase recibe también el nombre de Intervalo de Clase

o bien Amplitud de clase.

Una manera de resolver este problema es utilizar la fórmula de Stirling (Sturge) K = 1 + 3.33*

log(n), donde k es el número de clases o intervalos que se deben construir. Para el caso en cuestión

sería:

k = 1 + 3.3*log(30) = 5.87. Como se puede recordar que número de intervalos viene a ser una variable

cuantitativa discreta, entonces tiene que tomar valores cerrados. De acuerdo a lo anterior y basado

en leyes matemáticas se redondea al inmediato superior, es decir, 6. Hay autores que sugieren

siempre esto.

Un segundo problema que se afronta se refiere a la determinación del Ancho del Intervalo de Clase.

Este problema se resuelve calculando primeramente la diferencia entre el mayor y el menor valor

numérico de los datos, llamado también Rango, Recorrido o Amplitud (A). En el caso del ejemplo es: A

= 1.98 - 1.01 = 0.97. Esto indica que la suma de las amplitudes de clase de los intervalos de clase

deberá cubrir al menos esta diferencia. Si 0.97 se divide entre 6, se obtiene un resultado de 0.16. Si

se multiplica la anchura de clase (Ac) determinada por el número de intervalos K = 6, (al resultado se
le llama Rango Ideal) se tiene el siguiente resultado: 0.16*6 = 0.96. Si se recuerda la amplitud de los

datos es de 0.97, por lo tanto esta anchura de clase (Ac) no es suficiente para cubrirla por tal

razón, algunos autores recomiendan redondearlo al inmediato superior que en este caso sería de

0.17. Repitiendo el proceso, se tiene que 0.17*6 = 1.02. Un aspecto importante de señalar es que si

bien es cierto que se pasa de 1.98 con 3 centésimas, cubre la amplitud de los datos. Por esto se dice

que Ac*k = al menos debe ser igual a la amplitud de los datos, es decir, no importa si se pasa del

valor máximo.

Un tercer aspecto que hay que resolver es por donde iniciar la construcción de los intervalos de

clases. Para el caso de variables cuantitativas continuas, se habla de una medida de desplazamiento

(MD) que es igual al Rango ideal (RI) menos la Amplitud de los datos (A), donde RI es igual Ac * k,

esto es:

MD = RI – A, entonces: MD = [(0.17*6) –0.97]/2 =0.025, o aproximadamente 0.03.

Este es el desplazamiento que debe tener el valor mínimo para iniciar la construcción de los

intervalos. Al construir el primer intervalo, al valor mínimo le restamos el desplazamiento es decir,

1.01 – 0.03 = 0.98, éste es el límite inferior del primer intervalo de clase y su límite superior será

0.98 + Ac, es decir, 0.98 + 0.17 = 115, Para el caso del segundo intervalo de clase, su límite inferior

es el límite superior del primer intervalo de clase o sea 115 y el límite superior será 1.15 + 0.17 = 1.32

y así sucesivamente hasta llegar al número de intervalos definidos. Esto es continuidad, ya que no

existe ruptura entre intervalos.

Entonces, para este tipo de variable (cuantitativa continua), los intervalos de clases son abiertos por

la izquierda y cerrados por la derecha.

Luego se determina los Puntos Medios de Clase o Marcas de Clase en la segunda columna de la tabla,

esto es: PMC = (Li + LS)/2.

Posteriormente en una tercera columna se determinan las frecuencias absolutas, que en este caso se

define como el número de observaciones que caben dentro del intervalo de clase. Para que quepa una

observación dentro de un intervalo de clase en este tipo de variable, éste tiene que ser mayor que el

límite inferior o menor ó igual que el límite superior.

La tabla antes mencionada quedaría de la siguiente forma:

Intervalos de Clase PMC fi fr fia fra


0.98 a 1.15 1.065 2 6.67 2 6.67
1.15 a 1.32 1.235 5 16.67 7 23.33
1.32 a 1.49 1.405 8 26.67 15 50.00
1.49 a 1.66 1.575 7 23.33 22 73.33
1.66 a 1.83 1.745 4 13.33 26 86.67
1.83 a 2.00 1.915 4 13.33 30 100
30 100

Para el caso de variables cuantitativas discretas, los intervalos de clases son cerrados por ambos
lados.
METODOS GRAFICOS

Dentro de las representaciones gráficas se pueden mencionar las siguientes:

• Diagrama de puntos

• Pictogramas

• Diagrama de barras sencillas, dobles, múltiples

• Diagrama de sectores torta o pastel (pie)

• Histogramas de frecuencias

• Polígono de frecuencias absolutas ó relativas

• Polígono de frecuencia acumulada por la izquierda (menor que) u ojiva

• Gráficos de línea, etc.

Para efecto de este texto se desarrollarán los principales como son el Diagrama de Puntos por

su relación con el Diagrama de dispersión, Histograma de frecuencia, Polígono de frecuencia,

Ojiva y Diagrama de sectores.

Diagrama de Puntos

Sirve para representar gráficamente cuadros de frecuencias en las cuales se consideran únicamente

una variable y una cantidad asociada a cada valor de la misma (frecuencias). Existen dos tipos de

diagramas de puntos cuya construcción se detalla enseguida.

La construcción de los diagramas de puntos se realiza de la siguiente manera:

• El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los valores

de la variable y en el eje vertical las cantidades asociadas a éstos (frecuencias). Finalmente,

para cada valor de la variable y cada cantidad asociada se dibuja puntos cuyas alturas

corresponde a la magnitud de dicha cantidad.

• Para construir el segundo tipo de diagrama de puntos se colocan en el eje horizontal los

valores de la variable y sobre cada valor se dibuja tantos puntos como veces aparecen éstos.

Para ejemplificar el primer caso se retomará las alturas de los 30 habitantes que han sido

mencionados anteriormente.
En este caso se puede observar que los valores de la variable altura se encuentran en el eje

horizontal y en el vertical, el número de habitantes, y el punto está compuesto por las coordenadas

(altura, Número de habitantes con esa altura).

Histograma

Se le llama Histograma a la gráfica de barras verticales sin espaciamiento entre ellas, construida

colocando en el eje vertical a las frecuencias absolutas ó relativas y el eje horizontal a los límites de

clase de una tabla de frecuencias. Lo anterior implica que si los intervalos de clases son iguales,

sobre cada clase se erigen rectángulos cuyas áreas son proporcionales a las frecuencias de clase. Las

etapas que se deben de cubrir en la construcción de un histograma son:

• Colocar en el eje horizontal los límites de clases

• Colocar en el eje vertical las frecuencias relativas o absolutas.

• Erigir rectángulos cuya base son las clases y su altura las frecuencias que corresponde a

cada clase

Para ejemplificar este método gráfico se tomará a la tabla de frecuencia absoluta y relativa y

las frecuencias absolutas asociada a cada clase.

En este caso, dado que se utilizó la frecuencia absoluta para construir el histograma entonces el

histograma toma el nombre de Histograma de Frecuencias Absolutas.

Polígono de Frecuencia

Un polígono de frecuencia es una gráfica de líneas rectas que unen los puntos obtenidos al colocar en

el eje horizontal a los valores medios (puntos medios) de clases y en el eje vertical a las frecuencias

absolutas o relativas. Esto equivale a unir los puntos medios de la cara superior de los rectángulos de

un histograma por medio de líneas rectas.

Para cerrar el polígono se adiciona una clase tanto inferior como superior para que el polígono cierre.
En este caso al igual que el histograma, el polígono retoma el nombre de la frecuencia que se ha

utilizado para construir.

Polígono de Frecuencia Acumulada por la Izquierda o Ojiva

Una Ojiva o Polígono de Frecuencia Acumulada es una gráfica construida con segmentos de líneas

rectas que unen los puntos obtenidos al colocar en el eje horizontal a los límites superiores de clase

y en el vertical a las frecuencias acumuladas absolutas o relativas.

Al inicio en el eje horizontal se coloca el límite inferior de la primera clase y se le asigna una

frecuencia acumulada de cero. Asimismo, por su naturaleza una ojiva es no decreciente.

Retomando como ejemplo la misma tabla de frecuencia absoluta y relativa, se tomarán las

frecuencias absolutas acumuladas por la izquierda o “menor que” de ésta.

35

30

25

20

15

10

0
0.98 1.15 1.32 1.49 1.66 1.83 2.00

P unto s M edio s de C las es

Diagrama de Sectores (Torta o pastel)

Este tipo de gráfico se utiliza para representar datos cualitativos y cuantitativos discretos. Su uso

más frecuente es con el propósito de comparar ya sea las categorías que toma una variable

cualitativa o los valores discretos de una variable cuantitativa respecto al total.

Para construir este gráfico se utiliza una circunferencia, la cual se divide en sectores de tal manera

que sus medidas angulares centrales y, por ende la superficie del sector circular sean proporcionales

a las magnitudes de los valores de la variable que se trata de representar.


Al total de las frecuencias (∑fi = n) le corresponde el círculo completo, es decir, los 360 0 de la

circunferencia y por regla de tres simple se determina el número de grados que le corresponde a

cada categoría o valor discreto en particular.


Ejemplo:
Los datos que se muestran a continuación corresponden a la distribución de los docentes de una

universidad en particular, respecto al lugar de realización de estudios de diplomados.


Lugar de realización del Diplomado n %
Extranjero 19 13.87
Universidad de Interés 87 63.5
Otras universidades bolivianas 31 22.63
Total 137 100

Tratando de representar estos datos en diagrama de sectores se tiene lo siguiente:

Número de grados para la categoría “Extranjero”.

(19 x 3600)
= = 49.9 = 50
137

De la manera que quedaría de la siguiente forma una vez que se hayan realizado las operaciones

correspondiente:

Lugar de realización del Diplomado n Grados


Extranjero 19 50
Universidad de Interés 87 229
Otras universidades bolivianas 31 81
Total 137 360

De forma gráfica se vería de la siguiente forma:

MEDIDAS DE TENDENCIA CENTRAL O POSICIÓN

Como se pudo observar en la unidad anterior los histogramas o distribuciones de frecuencias

presentan formas muy variadas, por lo que no es fácil de comparar dos conjuntos de datos mediante

una inspección somera de los histogramas. Por otra parte, una tabla de frecuencia con 15 a 20 clases

puede no ser una representación suficientemente concisa de los datos. Por estas razones y por su

importancia en posteriores usos es necesario contar con cantidades que describan sucintamente

(rápidamente) el conjunto de datos que se estudia. Son de interés cantidades que localicen el

"centro" de las observaciones (o más bien de su distribución de frecuencias) y la dispersión o

variabilidad de las mismas.


A las medidas que localizan el "centro" de los datos se les llama "Medidas de Tendencia Central" y

las que miden la variabilidad de las observaciones se les llama "Medidas de Dispersión".

Dentro de las medidas de Tendencia Central se pueden mencionar las siguientes:

Media o promedio

Media ponderada

Media Geométrica

Media Armónica

Media Cuadrática

Mediana

Moda

Por el grado de aplicabilidad serán desarrollada la siguientes medidas de tendencia central: media

aritmética, mediana y moda y, como un caso especial de la media aritmética, la media ponderada.

Media Aritmética

También llamada media. Def: La media aritmética de n observaciones de la variable X se denotará

por x, y se define como la suma de ellas dividida por "n". Esto es:
x= i=1nXin

Ejemplo:

Sean los siguientes datos x1=2, x2=12, x3=9, x4=10, x5=7. La media aritmética de estos datos es:

x= 2 + 12+9+10+75=8

Desde un punto de vista geométrico, la media aritmética corresponde al punto de equilibrio de los

datos.

La media aritmética es la medida descriptiva de tendencia central más usada. Tiene la ventaja de ser

fácil de calcular, además de poseer propiedades teóricas excelente desde el punto de vista de la

estadística inferencia. Su principal desventaja es que, por ser el punto de equilibrio de los datos es

muy sensible a la presencia de observaciones extremas. Por otro lado su cálculo se vuelve tedioso
cuando la base de datos es muy grande. Otra desventaja es que no se puede calcular en datos que

tienen intervalos de clases abiertos.

Cálculo de la Media Aritmética en Tablas de Frecuencias

En muchas ocasiones se nos presenta el problema de estimar la media a partir de una tabla de

frecuencias. Esto se da por dos razones:

• Ya se han presentado los datos en forma resumida y no se dispone de las observaciones

originales.

• Cuando se dispone de las observaciones originales, pero su número es tan grande que las

operaciones aritméticas necesarias para el cálculo de la media requieren de mucho trabajo.

Entonces el uso de una tabla de frecuencias simplifica considerablemente el trabajo.

Se debe de recordar que cuando se tiene una tabla de frecuencias con k clases se da lo

siguiente:

i=1kfi=n
En una clase se tienen fi observaciones (frecuencia absoluta), las cuales pueden tener cualquier valor

entre el límite superior e inferior de esa clase. Para calcular de una manera aproximada la media, se

supone que las observaciones se encuentran uniformemente distribuidas en el intervalo y, por lo

tanto, el valor medio de clase (Punto medio de clase o Marca de Clase) es un valor representativo de

esa clase.

Con esta suposición el cálculo de la suma de las observaciones se simplifica de la siguiente manera:

i=1kPMC*fi

Esta expresión representaría la suma aproximada de las observaciones; por lo tanto, la media

aritmética se estimaría de la siguiente manera:

x= i=1kPMC*fin
Todo lo anterior es posible siempre y cuando no se tengan clases abierta en la tabla.

Ejemplo:

Para ejemplificar la media aritmética para datos tabulados se retomará la tabla de frecuencias

absolutas y relativas que se ha expuesto anteriormente, la cual corresponde a la estatura de 30

personas. Se pide estimar la estatura promedio de estas personas.


Es importante ver que lo que se ha solicitado es una estimación de la estatura y no una

determinación ya que en datos lo único que se puede hacer es una estimación ya que la determinación

se la realiza en los datos originales.

Retomando la ecuación de estimación de la media aritmética se tiene lo siguiente:


Intervalos de Clase PMC fi PMC*fi
0.98 a 1.15 1.065 2 2.13
1.15 a 1.32 1.235 5 6.175
1.32 a 1.49 1.405 8 11.24
1.49 a 1.66 1.575 7 11.025
1.66 a 1.83 1.745 4 6.98
1.83 a 2.00 1.915 4 7.66
Total 45.21
Promedio 45.21/30 = 1.507

x= 45.2130=1.507m/persona

La estimación proporcionó un valor de 1.507 m/persona. La determinación del promedio en la base de

datos original, es de 1.513 m/persona. Siempre se observará una diferencia que es producida por el

hecho de que en una tabla de frecuencia lo que se realiza es una estimación y no una determinación.

Esta diferencia será cada vez menor si la medida de desplazamiento para construir la tabla sea

pequeña.

Propiedades de la Media Aritmética

La media aritmética tiene muchas propiedades sin embargo, solo se expondrá una por la relevancia

que tiene a nivel de inferencia y es la siguiente:

• La suma algebraica de las desviaciones de un conjunto de números respecto a su media

aritmética es cero, es decir: i=1nXi-x=0. Esta es la razón por la cual le media se la


interpreta como el punto de equilibrio de una colección de datos numérica y además, es por

ello que en Estadística se le conoce como “el primer momento”.

Mediana

Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de

valores son inferiores y otro 50% son superiores).

No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su

cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se

ha repetido).
La mediana (Me) de un conjunto de “n” números, ordenados de menor a mayor, es el número central

en el arreglo. Si n es un número non, sólo hay un valor central. Si n es un número par, hay dos valores

centrales, y la mediana debe tomarse como la media de estos dos valores. Ejemplo...

1.- Sean la siguiente colección de datos: 27, 3.4, 3.2, 3.3, 3.1

El primer paso para determinar la Mediana en datos sin tabular es ordenar los datos en orden

ascendente o descendente de tal forma que:

3.1, 3.2, 3.3, 3.4, 27. Dado que n es un número non o impar (n=5), entonces sólo hay un valor central

(3.3) y éste es el valor de la mediana.

Me = 3.3

2.- Calcular la mediana para los siguientes datos y ordenados:

151, 152, 153, 158, 162, 167, 167, 167, 168, 173

En este caso n es par (n=10), por lo que hay dos valores centrales, que son 162 y 167. Entonces

partiendo del concepto de Mediana, la Me es la media aritmética de estos dos valores ya que antes y

después de ella, no existe más del 50% de los datos.

Me = (162 + 167)/2 = 164.5. Entonces cuando este sea el caso la Me, se puede determinar de la

siguiente forma:

Me= xin/2+ xin2+ 12


Cuando los datos son simétricos entre la mediana y la media aritmética no hay mucha diferencia; sin

embargo, para datos no simétricos es mejor medida de tendencia central la mediana que la media.

Cálculo de la Mediana en datos tabulados

Cuando los datos están agrupados en clases, es decir, cuando existe una tabla de distribución de

frecuencias, para estimar la mediana se utiliza la siguiente ecuación:

Me=a+ b-a(0.5-c)d
Donde:

Me = Mediana

a = Límite inferior de la clase de la Mediana

b = Límite superior de la clase de la Mediana

c = Frecuencia relativa acumulada una clase antes de la clase de la Mediana

d = Frecuencia relativa de la clase de la Mediana


Como se puede observar todos los insumos requeridos para la determinación de la Me, están en la

misma tabla.

Como se ha verificado anteriormente, la mediana es aquella medida de tendencia central que antes y

después de ella no existe más del 50% de la información, es decir, parte en dos la base de datos. A

partir de esto es que se propuso partir la base de datos en cuatro partes y se le llamó cuartiles,

luego en 10 parte y se les llamó deciles y luego en 100 partes y se les llamó percentiles. A todo esto

se llaman Fractiles, los cuales no se desarrollan en el presente documento pero si se recomienda

revisar cualquiera de la obras citadas al final de este documento para verificar esta información.

Moda

La Moda (Mo) de un conjunto de datos es la observación o valor (si existe) que ocurre con mayor

frecuencia. Si es un valor único se dice que la distribución de frecuencias es unimodal. Si se tienen

dos o más valores con la misma frecuencia máxima se dice que la distribución es bimodal, trimodal,

etc. Ejemplo: sean los siguientes datos las calificaciones de un examen:

10, 7, 8, 7, 9, 8, 7, 9.

En este caso la calificación que más se repite es 7 ya tiene una frecuencia fi =3, por lo tanto la Mo

es 7.

Sean los siguientes datos:

10, 6, 7, 4, 13, 16, 18

Como se puede observar en estos datos todos tienen una frecuencia absoluta igual a 1, por lo tanto

no tiene moda este conjunto de datos. Las distribuciones de este tipo se les llaman uniformes.

Sean los datos: 4, 3, 4, 7, 2, 7, 5, 4, 7, 5, 9, 7, 4

Aquí se puede observar que los valores numéricos con mayor e igual frecuencia son los valores 4 y 7

por lo tanto la moda de estos datos es 4 y 7, o sea que una distribución bimodal.

Cuando los datos se encuentran organizados en Cuadros de frecuencia, la Mo es el valor que tiene la

mayor frecuencia absoluta. Ejemplo:

Los datos que se muestran a continuación, corresponden a la estatura de 30 personas que

conformaron una muestra. Según el cuadro de frecuencia donde se presenta esta información,

existen 3 valores que tienen la mayor frecuencia absoluta. Estos son 1.21, 1.22 y 1.28 con fi = 4; por

lo tanto existen 3 Modas. Éstas son: 1.21, 122 y 1.28 m, por lo tanto la distribución es trimodal.
Frecuencias
Observación
fi fia fr (%) Fra
1.20 1 1 3.33 3.33
1.21 4 5 13.33 16.66
1.22 4 9 13.33 30.00
1.23 2 11 6.67 36.66
1.24 1 12 3.33 40.00
1.25 2 14 6.67 46.66
1.26 3 17 10.00 56.66
1.27 3 20 10.00 66.66
1.28 4 24 13.33 80.00
1.29 3 27 10.00 90.00
1.30 3 30 10.00 100.00
Total 30 100

Cuando la información se encuentra organizada en una tabla de frecuencias absoluta y relativa, la Mo

se puede estimar a través de la siguiente ecuación:

Mo=Licm+Acm[ficm-ficpremficm-ficprem+(ficm-ficpostm)]
Donde:

Mo = Moda

Licm = Límite inferior de la clase modal

Acm = Amplitud de clase de la clase modal

ficm =Frecuencia absoluta de la clase modal

ficprem = Frecuencia absoluta de la clase postmodal

ficpostm = Frecuencia absoluta de la clase postmodal

Ejemplo:

Sea la siguiente tabla de frecuencia absoluta y relativa correspondiente a la variable estatura de 30

personas.

De hecho la variable estatura es una variable cuantitativa continua, además la tabla lo demuestra ya

que entre los intervalos no existe ruptura, es decir, que el límite superior de la primera clase es el

inferior de la siguiente clase. Es por ello que se dicen que son abiertos por la izquierda y cerrados

por la derecha.
Intervalos de Clase PMC fi
(0.98 a 1.15] 1.065 2
(1.15 a 1.32] 1.235 5
(1.32 a 1.49] 1.405 8
(1.49 a 1.66] 1.575 7
(1.66 a 1.83] 1.745 4
(1.83 a 2.00] 1.915 4

En este caso la clase modal sería aquella que tiene mayor frecuencia absoluta, esta es:

(1.32 a1.49] =8, entonces partiendo de la ecuación proporcionada anteriormente:

Mo=Licm+Acm[ficm-ficpremficm-ficprem+(ficm-ficpostm)]

Mo = 1.32 + 0.17 [(8 - 5)/((8 - 5) + (8 – 7)) = 1.4475


MEDIDAS DE DISPERSION

Estas son las medidas que miden como se dispersan los datos, generalmente alrededor de una medida

de tendencia central. Entre éstas se pueden mencionar las siguientes:

Rango o Amplitud

Desviación Media y Median

Varianza y Desviación Típica

Dispersión Relativa

Generalmente las más utilizadas son: Varianza, Desviación típica y Dispersión relativa o Coeficiente

de Variación y una que en los métodos tabulares ya se ha utilizado como es el Rango.

Rango

La Amplitud, Rango o Recorrido de un conjunto de datos es la diferencia entre las observaciones de

mayor y menor valor numérico en el mismo.

R = Valor máximo - Valor mínimo

Tiene la ventaja de ser fácil su determinación, pero no es una buena medida de dispersión ya que

solo toma en cuenta dos valores de toda la colección y no idea de cómo es la variabilidad dentro de

los datos.

Varianza

La varianza retoma un nombre de acuerdo a dónde se determina. Si la determinación es en una

población se la llama Varianza Poblacional (σ²) y si es en una muestra se le llama Varianza Muestral

(s²).

La Varianza Población o Variancia de una población finita de N elementos x1, x2, x3, ...xn; se define

como la media aritmética del cuadrado de las desviaciones de las observaciones respecto a su media

μ; y se determina a través de la siguiente ecuación para varianza poblacional:

σ²= i=1N(xi-μ)² N
En caso de que sea muestral y para datos no organizados en una tabla de frecuencia absoluta y

relativa, se determina de la siguiente forma:

S²= i=1n(xi-x)² n-1


Para datos tabulados, la varianza se determina de la siguiente manera:

S²= i=1kPMC²*fi- (i=1kPMC*fi)²nn-1

Existe una fórmula de trabajo mucho más rápido para determinar la varianza muestral para datos no

tabulados que resulta de desarrollar en trinomio cuadrado perfecto de la ecuación. Esta fórmula es:

S²= i=1kxi²- (i=1kxi)²nn-1

Ejemplo:

Sean los siguientes datos las estaturas de 30 estudiantes de un salón de clases


Alumno Estatura Alumno Estatura Alumno Estatura
1 1.25 11 1.23 21 1.21
2 1.28 12 1.26 22 1.29
3 1.27 13 1.30 23 1.26
4 1.21 14 1.21 24 1.22
5 1.22 15 1.28 25 1.28
6 1.29 16 1.30 26 1.27
7 1.30 17 1.22 27 1.26
8 1.24 18 1.25 28 1.23
9 1.27 19 1.20 29 1.22
10 1.29 20 1.28 30 1.21

S= i=1kxi²- (i=1kxi)²nn-1

∑xi² = (1.25² + 1.28² + 1.27² +… 1.21²) = 47.1558


∑xi = (1.25 + 1.28 + 1.27 +… 1.21) = 37.6
n = 30

(37.6)²
47.1558 -
S² = 30
30-1

S² = 0.00105 m²

Dado que se determina o se estima la varianza se eleva al cuadrado las unidades originales de

medición razón por la cual no se debe comparar con la media aritmética ya que ésta es medida en
unidades lineales. Por esta razón, es que se propone una nueva medida de dispersión llamada

Desviación Típica.

Desviación Típica

No es más que la raíz cuadrada positiva de la varianza. En este sentido se puede hablar entonces

desviación típica poblacional y muestral, entonces:

σ = √σ²

S = √S²

Para el caso del ejemplo anterior, S = √0.00105 = 0.0324 m

Este dato indica que los datos se dispersan en promedio 0.0324 m del promedio de la variable

Estatura.

Coeficiente de Variación

Todas las medidas de dispersión antes descritas son medidas de variación absoluta. Una medida de la

dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por el Coeficiente de

Variación.

Coeficiente de Variación (C.V): Es una medida de dispersión relativa de un conjunto de datos, que

se obtiene dividiendo la desviación estándar del conjunto datos entre su media aritmética.

C.V=sx
Cuando se multiplica por 100 se expresa en porcentaje indicando tanto por uno que se alejan los

datos de su media aritmética.

C.V=Sx*100
Ejemplificando con los datos anteriores se tendría:

C.V = (0.0324/1.253)*100 = 2.586%, indicando con ello que por cada valor de la media los datos se

dispersan en un 2.586% alrededor de ella.

Ejemplo.

Sean la siguiente tabla de frecuencia absoluta y relativa, las estaturas correspondientes a 30

estudiantes. La tabla es la siguiente


Intervalos de Clase PMC fi
(0.98 a 1.15] 1.065 2
(1.15 a 1.32] 1.235 5
(1.32 a 1.49] 1.405 8
(1.49 a 1.66] 1.575 7
(1.66 a 1.83] 1.745 4
(1.83 a 2.00] 1.915 4

Determine el Coeficiente de Variación de los datos.

Nótese que solo piden CV, entonces necesitamos dos insumos, la desviación típica y la media

aritmética de los mismos. Como se necesita S, entonces se necesita de S². Entonces realizando los

cálculos necesarios en la misma tabla se obtienen todos los insumos para la estimación del

Coeficiente de variación como se muestra a continuación. Note que lo que se hizo fue generar los

componentes de las ecuaciones a determinar:

Intervalos de Clase PMC fi PMC²fi PMCfi


(0.98 a 1.15] 1.065 2 2.2685 2.13
(1.15 a 1.32] 1.235 5 7.6261 6.175
(1.32 a 1.49] 1.405 8 15.792 11.24
(1.49 a 1.66] 1.575 7 17.364 11.03
(1.66 a 1.83] 1.745 4 12.18 6.98
(1.83 a 2.00] 1.915 4 14.669 7.66
Totales 30 69.9 45.21

S= i=1kxi²- (i=1kxi)²nn-1

(45.21)²
69.9 -
S² = 30
30-1

S² = 0.0609

S = 0.0780

x= i=1kPMC*fin

x= 45.21/30 = 1.507
C.V=Sx*100

C.V = (0.0078/1.507)*100 = 0.5176


DEFORMACION DE CURVAS UNIMODALES

Una curva unimodal se puede deformar de dos maneras, respecto a un eje horizontal o bien respecto
a un eje vertical.
Cuando se trata de una deformación horizontal se habla de Asimetría y cuando se habla de
deformación vertical se habla de Curtosis.

Asimetría

Asimetría es el grado de deformación horizontal que presente una curva unimodal respecto al eje
horizontal. De acuerdo a ello se puede tener lo siguiente:

Asimetría Positiva: Se dice que una distribución de frecuencia unimodal presenta asimetría positiva

o a la derecha, si tiene una ramificación más extendida hacia la derecha o hacia los valores grandes

de una variable. Esto indica que la variable tiende a tomar valores mayores que su promedio y la

relación que se establece entre las principales medidas de tendencia central es la siguiente:

x>Me>Mo
Gráfica

Asimetría Negativa: Una distribución unimodal tiene asimetría negativa o hacia la izquierda, si tiene

una ramificación más extendida hacia la izquierda indicando con ello que la variable tiende a tomar

valores inferiores a su promedio. En este caso, la relación que se establece entre las principales

medidas de tendencia central es la siguiente: x<Me<Mo


Curva Simétrica: En este caso la variable se deforma proporcionalmente con respecto al eje
horizontal y la relación que se establece entre las principales medidas de tendencia central es la
siguiente: x=Me=Mo

Coeficiente de Asimetría
La medida más usada para cuantificar la asimetría de la distribución de frecuencias de una
característica X, recibe el nombre de coeficiente de asimetría y tiene por ecuación:
n
Σ(xi – x )3
i=1 n
CAs =-------------- (para datos no tabulados)
s3
Aquí se puede observar que si existen observaciones muy grandes en relación a la media, el
coeficiente de asimetría tendrá un valor positivo. Si existen observaciones muy pequeñas (menor
que la media), el coeficiente de asimetría será negativo y, finalmente, si las observaciones están
simétricamente distribuidas alrededor de la media, el coeficiente de asimetría tendrá el valor de
cero.
Ejemplo.
Sea los siguientes datos:
6.2, 7.9, 8.1, 8.5, 8.5, 8.9, 9.1, 10.8
Determine el CAs.
_
x = 8.5
s = 1.29
s3 = 2.1388

xi (xi -x) (xi - x)³


6.2 -2.30 -12.167
7.9 -0.60 -0.216
8.1 -0.40 -0.064
8.5 0.00 0.000
8.5 0.00 0.000
8.9 0.40 0.064
9.1 0.60 0.216
10.8 2.30 12.167
Promedio 8.5 0
SD 1.288 2.1387604
S³ 2.1388
Cas 1E-16

0/8
CAs = ------- = 0.00; ∴ la distribución es simétrica
2.1388

En el caso de datos tabulados el coeficiente de asimetría se determina por:


n _
Σ(PMC - x)3 fi
i=1 n
CAs =-------------- (para datos tabulados)
s3
Ejemplo:
------------------------------------------------- _------------ _------
Intervalo PMC fi PMCfi (PMC- x)²fi (PMC - x)3fi
---------------------------------------------------------------------------
(20.5, 25.5] 23 3 69 282.200 -2737.003
(25.5, 30.5] 28 42 1176 927.306 -4357.227
(30.5, 35.5] 33 21 693 1.905 0.574
(35.5, 40.5] 38 7 266 196.719 1042.847
(40.5, 45.5] 43 3 129 318.344 3279.327
(45.5, 50.5] 48 2 96 468.253 7164.840
(50.5, 55.5] 53 2 106 824.277 16733.821
(55.5, 60.5] 58 2 116 1280.301 32393.163
(60.5, 65.5] 63 1 63 918.163 27821.432
--------------------------------------------------------------------
83 2714 5217.468 81341.774

k _
Σfi(xi - x)²
i=1
s² = ------------ = 5217.468/83.1 = 63.628
n-1

s3 = 507.542

n
Σfi(PMC – x )3/n
i=1 (81341.774)/83
CAs =-------------- = CAs = --------------- = 1.931
s3 507.542

∴: la Asimetría es Positiva

Medidas de Curtosis

Medidas de Curtosis o apuntamiento. Se entiende por Curtosis, la medida de deformación


vertical de una distribución de frecuencias, es decir, la medida de apuntamiento o achatamiento
de una distribución.
La Curtosis mide cuan puntiaguda es una distribución en general por referencia a la normal.
La forma de medir la Curtosis o apuntamiento puede ser en función de momentos o cuartiles.

Curtosis en función de Momentos:


En este caso el grado de apuntamiento esta dado por:
n
Σ (xi – x )4
i=1 n
K = ------------------; para datos no tabulados
i=1 s4

n _
Σ (PMC - x)4 fi
i=1-------------
n
K = -----------------------; para datos tabulados
s4

Al tomar como referencia a K (en función de momentos) es positiva y se define de esta forma
porque en una distribución normal, este coeficiente toma el valor de 3, es decir, se tiene que:

k > 3: La distribución es más apuntada que la normal y recibe el nombre de Leptocúrtica

k = 3: En este caso la distribución es moderadamente apuntada ty se llama Mesocúrtica


(o apuntamiento normal)

k < 3: Si k<3, la distribución es menos apuntada que la normal, o sea achatada y se


llama Platicúrtica
TEORIA DE PROBABILIDADES

Experimento Aleatorio

En Estadística, los conjuntos de interés son colecciones de observaciones obtenidas estudiando el

comportamiento de un fenómeno, ya sea en estado natural o bien bajo control. Al proceso mediante

el cual se obtiene observaciones se llama experimento. Los experimentos u operaciones reales o

hipotéticas pueden dividirse en dos clases:

• Experimento Determinístico

• Experimento no Determinístico

Un experimento es determinístico si su resultados están completamente determinados y puede

describirse por una fórmula matemática llamada también modelo determinístico (no son de interés

desde el punto de vista estadístico)

Ejemplo...

Supóngase que el experimento consiste en lanzar un objeto (piedra) al aire. De hecho ésta va a caer

porque posee un peso y por la fuerza de gravedad que ejerce la tierra. De hecho se puede saber

cuál es el tiempo que tardará en hacerlo. Este experimento se puede modelar por la ecuación de

caída libre de los cuerpos. En este caso de hecho se sabe cuál será el resultado que se obtendrá.

Otro ejemplo sería si se lanza una pelota al agua, ésta de hecho flotará, en caso de ser de hierro

pues no flotará.

Un experimento es no determinístico si los resultados del experimento no se pueden predecir con

exactitud antes de realizar el experimento.

Ejemplo...

Supóngase que un experimento consiste en la aplicación de un sedante a una persona que tiene dolor

de cabeza. Aquí los posibles resultados pueden ser {sanos, enfermos}. En este caso no se sabe a

ciencia cierta cuál de estos dos resultados sucederá.

Otro ejemplo sería el lanzamiento de un dado legal. Aquí los resultados posibles son: {1, 2, 3, 4, 5,6}.

Se sabe cuáles son los posibles resultados, pero no se sabe cual precisamente.

En estos ejemplos se puede identificar lo siguiente:


Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

.- Cada experimento se puede repetir indefinidamente sin cambiar esencialmente las condiciones.

.- Cada experimento es no determinístico.

.- Cada experimento tiene varios resultados posibles que pueden describirse con anterioridad con

precisión (resultados apriori). Entonces a un experimento que presentas las tres características

mencionadas anteriormente se llama experimentos aleatorio. En otras palabras, un Experimento

Aleatorio es aquél cuyos resultados no pueden predecirse antes de su realización, y por lo

tanto, están sujetos al azar.

Espacio Muestral y Sucesos Elementales

Como se ha observado anteriormente, un experimento aleatorio tiene varios resultados posibles y

que pueden ser escritos con precisión. Entonces: A todo los resultados posibles asociados a un

experimento aleatorio ε, se le llama Espacio Muestral y se denotará por M y a cada resultado de

un espacio muestral M se llamará suceso.

Ejemplo...

Extraer un artículo defectuoso de un lote que contiene artículos defectuosos "D" y no defectuosos

"N"

M = {D, N}

.- Lanzamiento de un dado legal

M = {1, 2, 3, 4, 5,6}

.- Lanzamiento de una moneda.... M = {C, S}

.- Designación de un delegado de un grupo de 50 personas

M = {A1,A2,....,A50} ... Ai = i-ésima persona

Los experimentos aleatorios pueden ser simples o compuestos. Experimentos aleatorios simples son

los que se han ejemplificado anteriormente.

Un experimento aleatorio compuesto consiste en dos o más experimentos simples que puede ocurrir

de forma sucesiva o bien de forma simultánea.


Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Considérese el caso de experimento aleatorio compuesto: aquellos en que los experimentos simples

están unidos por la partícula gramatical "o" en el sentido excluyente y aquellos donde los

experimentos simples están unidos por la partícula gramatical "y".

Experimentos compuestos unidos por la partícula "o" excluyente

Un experimento compuesto ε, se dice que es una o-combinación de los experimentos ε1 y ε2

sí, sólo sí, el experimento ε ocurre, cuando el experimento ε1 ó ε2 ocurren (pero no ambos) .

Esto quiere decir que ocurren de forma sucesiva pero no al mismo tiempo.

Ejemplo...

Considérese el experimento consistente en lanzar un dado o una moneda. Determine el espacio

muestral del experimento.

M1 = {1,2,3,4,5,6} ... lanzamiento del dado ε1

M2 = {C,S} ... lanzamiento de la moneda ε2. Por lo tanto, el espacio muestral asociado a ε, es la unión

de M1 y M2. Es decir:

M = M1 υ M2 = {1, 2, 3, 4, 5, 6, C, S}

Experimentos compuestos unido por la partícula "y"

Un experimento compuesto ∈ , se dice que es un y-combinación de los experimentos simples ∈ 1


y ∈ 2, sí y sólo sí, el experimento ∈ ocurre, cuando el experimento ∈ 1 y ∈ 2 ocurre. Lo
anterior trae como consecuencia que si el experimento compuesto ε es una y-combinación de los

experimentos ∈1 y ∈2, el espacio muestral M asociado a ∈, es el producto cartesiano de los


espacios muestrales M1 y M2 correspondiente a ∈1 y ∈2, es decir: M = M1 x M2. Ejemplo...
Se lanza una moneda tres veces. Determine el espacio muestral.

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Aquí se puede observar que el experimento ∈ ocurre, si los tres experimentos simples ocurren... ∈i
= 1,2,3; i= i-ésimo lanzamiento de la moneda. Esto es:

M1 = {C,S}

M2 = {C,S}

M3 = {C,S}

∈ consiste en realizar el experimento ε1, luego ε2 y luego ε3. Por lo tanto: M = M1 x M2 x M3


M = {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS} que resulta del producto cartesiano de los espacio

muestrales simples que conforman al experimento compuesto como se muestra a continuación:

M3
M1*M2
M2 C S
M1 C S CC CCC CCS
C CC CS CS CSC CSS
S SC SS SC SCC SCS
SS SSC SSS

Otro ejemplo podría ser el experimento aleatorio compuesto consistente en el lanzamiento de una

moneda y un dado al mismo tiempo.

M2
M1 1 2 3 4 5 6
C (C,1) (C,2) (C,3) (C,4) (C,5) (C,6)
S (S,1) (S,2) (S,3) (S,4) (S,5) (S,6)

En muchos casos un diagrama, conocido con el nombre de Diagrama del Árbol, es más sugerente para

la determinar el espacio muestral de un experimento aleatorio compuesto.

Ejemplo... Determine el espacio muestra M del experimento aleatorio compuesto consistente en el

lanzamiento de tres monedas al mismo tiempo

(2n) = 24 = 16

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

En este caso el espacio muestral se obtiene con los resultados que tiene cada rama del árbol, es

decir, M= {CCC, CCS, CSC, SCC, CSS, CSC, SSC, SSS}

Sucesos y Algebra de sucesos (α-Algebra de Borel)

Como se ha mencionado anteriormente, un suceso es un resultado de un experimento aleatorio. Si se

ha definido al espacio muestral como todos los posibles resultados de un experimento aleatorio, es

decir, se puede concebir al espacio muestral como un conjunto universo. Si se ve desde este punto

de vista, se puede hablar entonces de subconjunto y elementos de este conjunto universo llamado

espacio muestral. Se llama Evento a cualquier subconjunto del espacio muestral y se le denota por

A, B, C, D, E, F, etc. Así, si A es un evento, entonces A ⊂M, y se le llamará suceso a cada elemento de

un espacio muestral y se le designa por w, x, y, etc. Esto es si x es un suceso, entonces x ∈ M. Un

evento con un sólo elemento es un evento elemental.

Ejemplo: considérese como experimento aleatorio al lanzamiento de un dado y al evento A como la

ocurrencia de un número par. Determine el espacio muestral.

M = {1, 2, 3, 4, 5, 6}

A = {2, 4, 6}; entonces se dice que A ⊂ M

Dado que ya se ha identificado el espacio muestral como conjunto universal, los eventos como

subconjunto del espacio muestral, se identificará también el conjunto vacío (∅) de la teoría de

conjunto como el evento imposible, esto es, un evento que no se da o sea que no ocurre. Por ejemplo,

lanzar dos dados simultáneamente, y sea el evento A: "obtener suma de 14". De hecho esto nunca va

a suceder ∴ A = {∅}.

Sub-evento: Dados dos eventos, A y B se dice que A está contenido en B o que a es sub-evento de

B, si todo suceso favorable a A, es favorable a B. En otras palabras, si ocurre el evento A, ⇒ ocurre

el evento B. Esto es: A ⊂ B, si wi ∈ A ⇒ w ∈ B

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

A⊂ B
Igualdad de Eventos: Se dice que dos eventos A y B son iguales si, A⊂B y B⊂A. Esto es: A = B = A⊂

B y B⊂A.

Unión de Eventos: Dados dos eventos A y B, se llama unión de A con B y se denota por A∪B al

evento formado por los sucesos que pertenecen a A ó a B ó, a ambos, es decir:

A∪B = {wi∈M /wi∈A v wi∈B}.

A∪B A∪B

Intersección: Dados los eventos A y B, se llama intersección de A con B, al evento formado por

todos los sucesos favorables a A y a B. Es decir, ambos eventos A y B ocurren. Esto es:

A B = {w ∈ M / w ∈ A ∧ w ∈ B}.

A∩B

Complemento: Si A es un evento del espacio muestral M, se llama complemento de A, al evento

formado por todos los sucesos que no pertenecen a A. Es decir, no ocurre el evento A. Esto es:

Ac = M - A = {wi ∈ M / wi ∈ A}

Ac

Eventos Mutuamente Excluyente y colectivamente exhaustivos (complementarios)

Dos eventos A y B definidos en el mismo espacio muestral, se dice que son mutuamente excluyentes

si no pueden ocurrir juntos. Es decir la ocurrencia de uno excluye la ocurrencia del otro. Es decir,

que A B = ∅

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Enfoques de Probabilidades

Definir probabilidad estrictamente es un poco inadecuado. La formulación axiomática de la teoría de

probabilidades requiere niveles de abstracción y competencia matemática fuertes. Sin embargo, hay

autores que plantean enfoques a través de los cuales se puede abordar las probabilidades. Estos

enfoques son:

1. Enfoque o Probabilidad Clásica (llamada también de Laplace o Apriori)

2. Enfoque desde el punto de vista de frecuencia relativa (llamada también A posteriori).

3. Probabilidad subjetiva

Enfoque Clásico o A priori: Llamado también Este definición se basa en el supuesto de que todos

los resultados posibles de un experimento aleatorio son igualmente probable, es decir, cada suceso

de un espacio muestral M, tienen la misma posibilidad de ocurrir.

Según Laplace (1812) la probabilidad de un evento es la razón entre el número de casos

(sucesos) favorables y el número total de casos (sucesos) posibles, siempre que nada obligue a

creer que alguno de estos sucesos deban de tener preferencia a los demás, lo que hace que

todos sean iguales. Esto es:

PA=nAM
Observaciones:

1.- La probabilidad de un evento cualquiera A está comprendido entre 0 y 1. En efecto nA y n

son enteros positivos y 0 ≤ nA ≤ 1. Esto es:

0/n ≤ nA/n ≤ n/n ó 0 ≤ P[A] ≤ 1

2.- P [A] = 0, si A es un evento imposible A = ∅; ⇒ nA = 0, luego P[A] = 0/n = 0

3.- P [A] = 1, si A es el evento seguro (A = M), es decir A = M ⇒ nA = n ∴ P[A] = n/n = 1

4.- Puesto que todos los elementos de M = (w1, w2, ..., wn} son igualmente probables ⇒ P[{wi}] = 1/n; i

= 1, 2,3,..., n ⇒ P [M] = Σ P[wi] = 1

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Si A es un evento de M ⇒ P [A] = Σ P [{wi}] wiεA

Ejemplo..... Si se lanza una moneda tres veces. Calcular la probabilidad que ocurran:

a.- Dos caras

b.- Al menos dos caras

c.- A lo más dos caras

El espacio muestral de este experimento lo puede obtener a través de producto cartesiano o bien a

través del diagrama del árbol. Determinando el espacio muestral:

M = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

a.- A = {CCS, CSC, SCC} ⇒ P[A] = 3/8

b.- B = {CCC, CCS, CSC, SCC} ⇒ P[B] = 4/8 = 1/2

c.- C = {CCS, CSC, CSS, SCC, SCS, SSC, SSS} ⇒ P[C] = 7/8

Ejemplo

Considérese el lanzamiento de dos dados. Calcular la probabilidad de:

a.- Obtener suma 7

b.- Obtener suma 6

c.- Obtener suma mayor que 5

d.- Que el resultado del primer dado sea mayor que el resultado del segundo dado.

A = {(w1,w2) ∈ M / w1 + w2 = 7}

B = {(wi,w2) ∈ M / w1 + w2 = 6}

C = {(w1,w2) ∈ M / w1 + w2 > 5}

D = {w1,w2) ∈ M / w1 > w2}]

Determinando el espacio muestral a través del producto cartesiano de los dos espacios muestrales

simples de los experimentos que conforman este experimento compuesto se tendría lo siguiente:

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

M2
M1 1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

P[A] = 6/36 = 1/6 (nA) = 6

P[B] = 5/36 (nA) = 5

P[C] = 26/36 (nA) = 26

P[D] = 15/36 (nA) = 15

Probabilidad desde el punto de vista de Frecuencia Relativa (o A posteriori).

Supóngase la siguiente pregunta: ¿Cuál es la probabilidad de que la mitad o más de los estudiantes de

Esta2 obtengan notas aprobatorias?. En este caso y en muchos más, no sirve de nada enumerar todos

los resultados posibles. Como se puede observar esta pregunta no se puede responder utilizando la

definición clásica de probabilidades, dado que se necesita mayor información. Esto conlleva a la

interpretación de probabilidades en términos de vista de frecuencia relativa.

Si un experimento bien definido se repite n veces (n grande): sean nA < n el número de veces

que el evento A ocurren los n ensayos, entonces la frecuencia relativa de veces que ocurre el

evento A "nA/n", es la estimación de la probabilidad que el evento A ocurra, esto es:

P[A] = nA/n

Observación:

1.- La frecuencia relativa de un evento, está comprendida entre 0 y 1 ∴ 0 ≤ P[A] ≤ 1

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

2. nA/n = 1, sí y sólo sí, el evento A ocurre en las n repeticiones de experimento. En particular

nM/n = 1

Ejemplo.

Solución.....

a.- P[Mujer] = 55/375

b.- P[B] = 100/375

c.- P[C] = (70)/375

Definición Subjetiva de Probabilidad

Probabilidad desde el punto de vista subjetivo está relacionada con una presunción,

creencia o como algunos autores le llaman corazonada, por lo tanto, puede variar de una

persona a otra.

Dado un experimento determinado, la probabilidad de un evento A es el grado de creencia

asignado a la ocurrencia de este evento por un individuo particular, basado en toda la

evidencia a su disposición con las siguientes exigencias:

1.- P[A] = 0, representa la certeza que el evento A, no ocurrirá


Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

2.- P[A] = 1, representa la certeza que el evento A, sí ocurrirá

Principales Teoremas de Probabilidad:

1. O ≤ P[A] ≤ 1, para cada evento A en M.


2. P[M] = 1

3. P[AUB] = P[A] + P[B]; siempre y cuando los eventos A y B ocurran por separado o de

forma independiente.

4. P [AUB] = P[A] + P[B] – P[A∩B]; en este caso A y B no son eventos independientes,


es decir, que ocurren al mismo tiempo.

5. Si A = {φ}, entonces P[A] = 0


6. Eventos mutuamente excluyentes y colectivamente exhaustivos o complementarios.

Sea A y B, dos eventos en el espacio muestral, se dice que son mutuamente

excluyente si la ocurrencia de uno de ellos elimina la ocurrencia del otro y viceversa

y son complementarios si la suma de sus probabilidades, es decir la unión de ambos,

da como resultado la probabilidad del espacio muestral. Si dos eventos cumplen

estos dos requisitos se dicen que forman una partición del espacio muestral M.

7. Sea A es un evento en M, entonces P[A´] = 1 – P[A]

Probabilidad Condicional (Dependencia de Eventos)

A menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otro y es de

frecuente interés obtener la probabilidad de un evento, donde dicho evento está

condicionado a la ocurrencia de un subconjunto del espacio muestral (otro evento). Es decir,

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

que se dice que el evento B ha ocurrido y se quiere saber la probabilidad que ocurra el

evento A.

Sea A y B dos eventos en el espacio muestral M si P [B] ≠ 0, se define la probabilidad

condicional del evento A dado el evento B como:

PA/B=PA∩BPB; PB≠ 0
Es decir, la probabilidad condicional es una probabilidad calculada en un espacio muestral

reducido, B; pues a partir de la información se sabe con probabilidad 1 que el evento B ya

ocurrió. En la práctica se puede resolver este problema usando la definición, esto es

calculando la P [A∩B] y P [B] con respecto al espacio muestral original, o bien considerando

la probabilidad del evento A con respecto al espacio muestral reducido B, es decir, del

evento que condiciona.

Ejemplo...

Una empresa tiene 300 trabajadores de los cuales 100 son casados y 30 son divorciados. En

dicha empresa trabajan 200 hombres, 85 de los cuales son casados y 95 son solteros. Se

toma un trabajador al azar:

a. Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad que sea mujer?

b. Si el trabajador seleccionado es mujer, ¿cuál es la probabilidad que sea soltera?

c. ¿Cuál es la probabilidad que sea mujer o esté casada?

Solución

Lo primero que se tiene que hacer es extraer la información que proporciona el problema y

ver como se puede completar la siguiente. Por otro lado se debe de partir del hecho que la

información proporcionada se puede clasificar de acuerdo a dos criterios los cuales son: el

sexo de los trabajadores y el estado civil de los mismos. En el caso del ejemplo se dispone

de la siguiente información que se encuentra en el siguiente cuadro en forma cursiva. La

restante se puede completar utilizando el concepto de complemento de evento.


Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Estado Civil
Casado Soltero Divorciado
Sexo (C) (D) (E) Total
Femenino (A) 15 75 10 100
Masculino (B) 85 95 20 200
Total 100 170 30 300

Como se puede observar se está totalizando tanto por filas como por columnas, es decir, de

acuerdo a los dos criterios de clasificación de la información. A esto se le llama

probabilidades marginales y a la información del interior del cuadro se le llama probabilidad

conjunta de los dos eventos (criterios de clasificación). Resolviendo el problema se tiene:

a. Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad que sea mujer?.

En este caso el evento condicionante es que el trabajador sea soltero y el evento

dependiente es que sea mujer.

Los problemas de probabilidad de eventos dependientes se pueden resolver de dos manera:

respecto al espacio muestral original y respecto al espacio muestral restringido del evento

que condiciona. Para el primer caso:

PAD=P[A∩D]P[D]= 75/300170/300=75170
PA∩D= 75300
PD= 170300
Para el segundo caso, es decir, respecto al espacio muestral restringido del evento

condiciónate se tendría que ver cuántas veces se repite el evento trabajador de sexo

femenino y cuántas veces se repite el evento trabajador soltero. De acuerdo a esto se

tiene que:

PAD=P[A∩D]P[D] = 75170
Como se puede observar ambos resultados coinciden en el mismo resultado.

b. Si el trabajador seleccionado es mujer, ¿cuál es la probabilidad que sea soltera?

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Esto tiende a confundir pensando que es el mismo del inciso a., sin embargo el evento

condicionante es ahora que el trabajador sea Mujer. De acuerdo a esto se tiene:

PDA=P[D∩A]P[A] = 75100
c. ¿Cuál es la probabilidad que sea mujer o esté casada?
PA∪D=PA+ PB- P[A∩D]
PA∪D=100300+ 170300- 75300=95300

Independencia de Sucesos

En probabilidad condicional la ocurrencia de un evento condiciona la probabilidad de un

segundo evento. Sin embargo, hay muchos casos donde los eventos están totalmente sin

conexión, y la ocurrencia de uno de ellos no cambia la probabilidad de ocurrencia del otro,

en este caso se dice que son independientes.

Sean A y B dos eventos y sea P [B] ≠ 0., A y B son eventos independientes si:

a.- P[A/B] = P[A]

Como consecuencia, si A y B son independientes y ∴

P [A/B] = P[A∩B]/P[B] = P[A] ⇒ P[A∩B] = P[A]P[B] y viceversa

Dos eventos A y B son independientes si se cumple cualquiera de las siguientes

condiciones:

.- P[A/B] = P[A] .- P[B/A] = P[B] .- P[A∩B] = P[A].P[B]

Ejemplo...

Un impulso eléctrico debe de pasar del punto I al II para producir una señal. Para llegar al

punto II debe de pasar por dos componentes electrónicos (E1 y E2). La trayectoria del

impulso se interrumpe si falla cualquiera de los dos componentes. La probabilidad de que el

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

componente E1 no falle es 0.7 y la probabilidad que el componente E2 no falle es 0.8.

Además, la probabilidad de que al menos uno no falle es 0.94. ¿Cuál es la probabilidad de

que la señal se produzca?

A = Componente E1 no falle = P[A] = 0.7

B = Componente E2 no falle = P[B] = 0.8

P [AUB] = 0.94

Para que se produzca el impulso eléctrico, ninguno de los componentes (E1 y E2) deben de

fallar ∴ la probabilidad solicitada es P[A∩B].

P[AUB] = P[A] + P[B] - P[A∩B]

P [A∩B] = P[A] + P[B] - P[AUB]

= 0.7 + 0.8 - 0.94 = 0.56

P[A∩B] = P[A]P[B] = 0.7*0.8 = 0.56

Probabilidad Total

Sean A1, A2,..., Ak, eventos que forman una partición del espacio muestral y Sea B un

evento en el espacio muestral. Si P[A1], P[A2],..., P[Ak], P[B/A1], P[B/A2],..., P[B/Ak] son

probabilidades conocidas y se está interesado en la ocurrencia del evento B. Para obtener

esta probabilidad se hace uso del Teorema de Probabilidad Total que partiendo de las

premisas anteriores se enuncia de la siguiente manera:


PB= i=1kPAk*PBAk=PA1*PBA1+ PA2*PBA2+ …PAk*PBAk

Ejemplo:

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Un profesor tiene tres secretarias con diferentes niveles de competencia. Las secretarias

son S1, S2, S3. La secretaria S1 ha escrito el 20% de un trabajo, la secretaria S2 el 40%

y la secretaria S3 el 40%. Hay un error ortográfico que irrita en especial al profesor, y

éste ha calculado que S1 lo comete el 90% de las veces que tiene que escribir la palabra en

cuestión, que S2 lo comete el 40% de las veces, y S3 nunca.

¿Cuál es la probabilidad de que el profesor encuentre el error mencionado?

Obteniendo la información que proporciona el problema se tiene:

P [S1] = 0.20; P [S2] = 0.40; P [S3] = 0.40; P [ES1]=0.90; P [ES2]=0.40; P [ES3]=0; entonces

la probabilidad del error es:

P [E] = P [S1]* P [ES1] + P [S2]* P [ES2] + P [S3]* P [ES3]

P [E] = ((0.20*0.90) + (0.40*0.40) + (0.40*0)) = 0.34

Lo anterior se puede facilitar si se usa un árbol de probabilidades como se muestra a

continuación

P [E/S3]
[S1] == 0.20
[S2]
[S3]
[E/S1]
[E’/S1]
[E/S2]
[E’/S2] 0.40
===0.90
0.60
0
0.10
10.40

Supóngase ahora que el evento “B” ya ha ocurrido y se está interesado en saber a cuáles de

los eventos que forman la partición del espacio muestra se ha debido su ocurrencia. En este
Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

caso se hace uso del Teorema de Bayes que partiendo también de las premisas anteriores

se enuncia de la siguiente forma:


P AkB= P A*PBAki=1kPAk*PBAk
Como se puede observar, el denominador no es más que la probabilidad “B”, es decir, la

probabilidad total.

Ejemplo>

Si el profesor encuentra el error mencionado en una página del trabajo. ¿Cuál es la

probabilidad de que esa página la haya escrito secretaria S1?, ¿la secretaria S2?, ¿la

secretaria S3?
P S1E= P S1*PES1P [E]= (0.20*0.9)0.34=0.53

P S2E= P S2*PES2P [E]= (0.40*0.40)0.34=0.47


P S3E= P S3*PES3P [E]= (0.40*0.0)0.34=0

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

REGRESION Y CORRELACION LINEAL SIMPLE

Regresión Lineal Simple

En muchas áreas de la investigación científica, la variación en las mediciones de una variable

en estudio es causada preponderantemente por otras variables relacionadas cuyas

magnitudes cambian en el curso del experimento. La incorporación explícita de los datos de

estas variables que influyen en el análisis estadístico, permite conocer la naturaleza de las

relaciones y utilizar esta información para mejorar la descripción y las inferencias de las

variables de interés primario.

Al probar las relaciones entre variables es importante que el valor de la variable pueda ser

predicha de las observaciones de otra variable o aún controladas y optimizadas manipulando

los factores de influencia.

El análisis de regresión es un conjunto de métodos estadísticos, que tratan con la

formulación de modelos matemáticos que describen las relaciones entre variables y el uso

de estas relaciones modeladas con el propósito de predecir e inferir.

Supuestos del modelo de Regresión Lineal Simple

Al igual que en otros tipos de análisis estadísticos, el modelo de Regresión Lineal Simple se

basa en ciertos supuestos que a continuación se detallan.

Supuesto 1. "Y" es una variable aleatoria cuya distribución probabilística depende de

"X"

Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria con

cierta distribución probabilística con media μy/x y σ²y/x. Note que esta suposición solamente

implica que "Y" es una variable aleatoria que depende de "X", y no toma en cuenta la forma

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

lineal. Por otra parte, significa que la variable X se mide sin error y fijada por el

investigador.

Supuesto 2. Modelo de la línea recta

Esta suposición requiere que la ecuación para μ y/x sea una línea recta, es decir que μ y/x = ß0 +

ß1Xi y, por lo tanto, que la ecuación de dependencia sea Y = ß 0 + ß1Xi+ ε. Con esta restricción,

la línea que une a μy/x debe de ser una recta, por lo tanto se puede tener una de las

siguientes situaciones:

Puede ser que se tenga una relación positiva entre las variables X y Y, esto quiere decir que

a medida que aumenta X, Y también aumenta.

Otra situación que se puede dar es una relación inversa, es decir, que a medida que aumenta

X, Y disminuye.

En el último caso se recurre al hecho de que regresión también se entiende como la

tangente inversa del ángulo de inclinación de una recta. En los dos primeros casos las rectas

tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresión

lineal entre ambas variables.

Supuesto 3. Homogeneidad de varianza

Esta suposición es muy importante en el análisis de regresión. La varianza de la

distribuciones de "Y" son idénticas para todos los valores de "X". En otras palabras, se

supone que σ²y/x1 = σ²y/x2 = σ²y/xn = σ², donde σ² es la varianza común (desconocida) para

todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir, que

la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene constante.

Supuesto 4. Independencia

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Los valores de "Y" deberán ser estadísticamente independiente. Un ejemplo donde se viola

este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso

menor a una hora.

Supuesto 5. Normalidad

La distribución de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que la

variable aleatoria no observable ε es normal y su media es cero ya que "X" se toma como

variable no aleatoria susceptible a ser manipulada por el investigador.

Todos los supuestos anteriores se pueden resumir en los siguientes:

1. "Y" es una variable aleatoria cuya distribución probabilística depende del valor de "X".

2. La ecuación de regresión es una línea recta.

3. Homogeneidad de varianza.

4. Independencia de las observaciones lo que implica que los errores son independientes.

5. Normalidad.

En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Diagrama de Dispersión

Este diagrama tiene por objetivo dar una idea de la posible relación existente entre la

variable dependiente Y y la independiente X.

Para realizar un diagrama de dispersión se coloca en el eje de las abscisas los valores

correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la

variable dependiente Y. Luego se colocan puntos en la intersección de los valores de ambas

variables. Un ejemplo de lo anterior se muestra en seguida.

Los datos que se muestran a continuación corresponden a la producción en miles de millones

de dólares de 10 empresas y sus costos de producción de las mismas en miles de millones de

dólares.

Para construir un diagrama de dispersión lo primero que se tiene que hacer es determinar

quién es la variable dependiente y quién es la variable independiente, es decir, establecer la

relación entre dichas variables. Esta relación debe ser lo más natural posible.

En el caso del problema, es de suponerse que a medida que aumenta la producción también

se incrementarán los costos de producción por todo lo concerniente a ello (materia prima,

horas hombres, gastos de energía, etc.). Entonces definimos a X, variable independiente, a

la Producción y a Y, variable dependiente, a los costos de producción. De acuerdo a esto se

tiene lo siguiente:

Producción (X) Costo (Y)


(miles de millones de $us) (miles de millones $u)
10 3
18 5
12 4
16 5
22 8
36 12

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

30 10
32 14
26 12
12 3

El diagrama de dispersión quedaría de la siguiente forma:

Figura 2. Diagrama de Dispersión entre producción y costo de producción

De acuerdo a la información que proporciona el diagrama de dispersión se puede observar

que a medida que aumenta la producción de las industrias, aumentan los costos de

producción de las mismas, es decir, se concluir que existe una relación positiva entre estas

variables y además se puede ver que esta relación tiende a ser lineal.

Método de Mínimos Cuadrado

Como lo plantea el supuesto 2 del modelo de regresión lineal simple, "Modelo de la Línea

Recta", que de existir una relación entre X y Y, ésta debe ser una línea recta. Entonces a

partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de

obtener una ecuación que represente la relación entre dichas variables. El modelo del cual

se habla es de una ecuación punto pendiente como sigue: Yi= β0+ β1Xi

El problema de esta modelo es que sus componentes son parámetros y por lo tanto, son

estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener

estimadores de ß0 y ß1 para estimar adecuadamente la recta de regresión μy/xi. El

estimador de μy/xi se denota por: Y= β0+ β1Xi

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Para llegar a obtener estos estimadores se hace uso de la técnica propuesta por Carl Gauss

(1777-1855). Este método se basa en la idea de obtener estimadores para los componentes

del modelo que minimicen la suma de cuadrados de las distancias entre los valores

observados (Yi) y los estimados (Yi). Esto significa que se tiene que minimizar la suma de

cuadrados de las longitudes de los segmentos de las líneas verticales que unen los datos

observados con la recta estimada como se muestra en la Figura 3.

Figura 3. Esquematización de la técnica de mínimos cuadrados.

A la técnica antes mencionada se le denomina "Técnica de Mínimos Cuadrados". Usando

notación matemática, el método de mínimo cuadrados consiste en encontrar los

estimadores de ß0 y ß1.

Al aplicar la técnica de mínimos cuadrados se llegan a obtener las ecuaciones de trabajo de

ß0 y ß1^ (en este caso se ha omitido los procesos de derivación mediante el cual se llega a
obtener las fórmulas de trabajo). Estas ecuaciones son las siguientes:

β1= xy- xynx²- xi2n ;


β0= Y-β1X. Donde:
β1= Coeficiente de Regresión
β0= Intercepto de la recta de estimación
Ejemplo:

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Retomando los datos que se utilizaron para construir el diagrama de dispersión y aclarando

que “X” es Producción (miles de millones de $us) y “Y” Costos (miles de millones de $us) y

haciendo uso de las ecuaciones derivadas a través de la técnica de mínimos cuadrados se

tiene lo siguiente:

X Y XY X2 Y2
10 3 30 100 9
18 5 90 324 25
12 4 48 144 16
16 5 80 256 25
22 8 176 484 64
36 12 432 1296 144
30 10 300 900 100
32 14 448 1024 196
26 12 312 676 144
12 3 36 144 9
Totales 214 76 1952 5348 732
Promedio 21.4 7.6

β1= xy- xynx²- xi2n; β1= 1952-241*76105348-(214)210= 0.423738, Coeficiente de


regresión

β0= Y-β1X; β0= 7.6-(0.423738*21.4)= -1.46798; Intercepto, por lo tanto la ecuación de


estimación quedaría de la siguiente manera:

Y=0.423738Xi-1.46798; o bien se puede decir que:


Costos = 0.423738 (Producción) – 1.46798

Un aspecto que no se debe olvidar es que el propósito de la Regresión Lineal Simple es el

de predecir el comportamiento de una variable dependiente a través del conocimiento de

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

una variable independiente, es por ello que se debe estar seguro que la ecuación de

estimación sirve para este propósito (que existe regresión lineal simple). Por esta razón es

que la ecuación de estimada debe ser sometida a un proceso de validación.

Validación de la Ecuación de Estimación

Este proceso se puede realizar de dos maneras a saber:

• A través del Cálculo del Coeficiente de Determinación (R2)

• Por medio del Análisis de Varianza de la Regresión (ANARE)

Coeficiente de Determinación (R2) o Variabilidad (varianza explicada)

El Coeficiente de Determinación, R2, indica el porcentaje de la variabilidad de “Y” que

puede ser explicada o debida a “X”, es por ello que mientras más cerca esté del 100% es

mucho mejor. Esto es debido a que se trata de predecir el comportamiento de “Y” a través

del conocimiento de “X”, es por ello que es deseable que el mayor porcentaje de la

variabilidad de la variable dependiente sea debida a “X”, a tal punto que hay autores que

consideran que la ecuación es buena o sirve para predecir si R2 ≥ 70%.

El coeficiente de Determinación se calcula a través de la siguiente ecuación:


R²=xy- (xy)nx²-(x)²ny²-(y)²n²*100
Para el caso del ejemplo anterior el R2 es el siguiente:

R²=1952- (214*76)105348-(214)²10732-(76)²10²*100=89.36%

Esta dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X

(Producción), por lo tanto también se puede concluir que existe un 10.64% de variabilidad
Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

de Y (Costos) que no es debida a X (Producción), a esto se le conoce como variabilidad no

explicada. En este caso se puede concluir también que la ecuación estimada sirve para

predecir (existe regresión lineal simple.

Análisis de Varianza de la Regresión Lineal Simple (ANARE)

De forma general se entienden por análisis de varianza a la partición de la variabilidad total

en fuentes de variación conocidas que en el caso de regresión lineal son las siguientes:

• debida a la regresión

• debida a otras causas (error)

Para tratar de ser un poco más explícito, estas dos fuentes de variación se derivan del

modelo aditivo lineal de la regresión línea simple el cual es:

Yi= β0+ β1Xi+ εi. Esto tiene correspondencia con una tabla de varianza o salida de varianza
que para regresión lineal simple es la siguiente:

FV gl SC CM Fc Ft
Regresión SCRegresión SCRegresión1 CMRegresió (α, glreg, glerr)
1
nCMError
Error n-2 SCError SCErrorn-2
Total n-1 SCTotales

La primera columna encabezada por FV (Fuentes de variación) es donde se declara las

fuentes de variación en las que se está partiendo la variabilidad total. Nótese que en esta

tabla no se incluye el efecto de β0, ya que éste es una constante por lo tanto no es una

fuente de variación.

La segunda columna encabeza por “gl” (Grados de Libertad). De forma general grados de

libertad es “n-1”, para el caso de la fuente de variación debida a regresión siempre es 1 ya

que son dos los parámetros que se estiman, β0 y β1, por lo tanto, 2-1 = 1. Es por ello que

para el ANARE de regresión lineal simple, esta fuente de variación siempre tiene 1 grado

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por “n” se

entiendo al conjunto de pares de datos “X” “Y”.

La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de

las varianza a estimar cuyas ecuaciones de trabajo son las siguientes:


SCTotales=y2- yi2n
SCRegresión= β1xy-xyn
SCError=SCTotales-SCRegresión

La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones

propiamente dichas de las varianza de cada una de las fuentes de variación. Estas resultan

de dividir las sumas de cuadrados de éstas entre sus grados de libertad.

La quinta columna denominada como “Fc” se refiere a los “F” calculados que resultan de

dividir el cuadrado medio de regresión entre el cuadrado medio del error, es decir, de la

variabilidad no debida a la regresión. Es por ello que el error se considera como un término

de comparación entre la variabilidad debida a regresión y el mismo. Si el cuadrado medio

del error es mayor que el cuadrado medio de regresión, el resultado que se obtendrá será

pequeño y posiblemente menor que el valor de la siguiente columna “Ft” o “F” de tabla, valor

que se extrae de una tabla de “F” con un nivel de significancia, grados de libertad de

regresión y los grados de libertad del error.

Para entender mejor lo anterior se debe de partir del juego de hipótesis que se prueba en

un ANARE. Este es:

Ho: β1 = 0

Ha: β1 ≠ 0

La hipótesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hipótesis que se

somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

indica que no existe regresión lineal simple, y asume que la relación entre X y Y es una línea

recta sin pendiente, es por ello que es igual a cero.

Por hipótesis alternativa se entiende aquella que contradice a la hipótesis nula y que es

aceptada una vez que se rechaza la hipótesis nula. Es por ello que está como β1 ≠ 0 ya que

una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,

es decir, que existe regresión lineal simple.

Ahora bien, todo el ANARE se hace para realizar la prueba de hipótesis de que si existe o

no regresión lineal simple.

Se entiende como prueba de hipótesis al proceso a través del cual se prueba la

plausibilidad de una hipótesis.

Al realizar la prueba de hipótesis se debe llegar una decisión de aceptar o rechazar Ho.

¿Cuándo no se rechaza Ho?, cuando el Fc ≤ Ft y se rechaza cuando el Fc > Ft. A lo anterior

se le llama Regla de Decisión la cual es la siguiente:

No Rechazo de Ho si Fc Ft

Rechazo de Ho si Fc  Ft

Si la hipótesis nula no se rechaza significa que no existe regresión lineal simple, por lo

tanto la ecuación estimada no sirve para predecir, si se rechaza Ho, inmediatamente se

acepta la hipótesis alternativa la que indica que sí existe regresión lineal simple.

Un aspecto que todavía no se ha aclarado es “Nivel de Significancia, α, ” entendido como la

probabilidad de tomar una decisión equivocada (conocido también como Error Tipo I) es por

ello que los valores del α son pequeños ≤ 0.1.

Haciendo el ANARE a un α = 0.01 se tiene lo siguiente:

SCTotales=732- 76210 = 154.4


SCRegresión= 0.4237381952-214*7610=137.6897
SCError=154.4-137.6897=16.4310

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Vaciando esta información en la tabla de ANARE se tiene lo siguiente y obteniendo el valor

de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26

FV gl SC CM Fc Ft
Regresión 1 137.6897 137.6897 67.0389 11.26
Error 8 16.4310 2.053875
Total 9 154.4

De los resultados de la tabla se puede observar que el “Fc” es mayor que el “Ft” lo cual

indica que existe suficiente evidencia para rechazar la hipótesis nula, es decir, que existe

regresión lineal simple y por lo tanto se dice que la ecuación estimada sirve para predecir el

comportamiento de Costos (Y) a través del conocimiento de Producción (X).

Cuando se realiza un análisis de varianza de la regresión se debe emitir una conclusión que

podría ser la siguiente:

“De acuerdo al análisis de varianza realizado se concluye con un 99% de confiabilidad, (1 –

0.01)*100, que existe regresión lineal simple.”

Una vez que se ha comprobado que la ecuación estimada es buena (hay regresión lineal) el

siguiente paso sería interpretar los componentes de la recta de estimación.

Interpretación de los Componentes de la Ecuación de Estimación

Cuando se hacer una interpretación, ésta debe ser aplicada al problema en cuestión. En el

caso del ejemplo que se ha venido desarrollando sería el siguiente:

β1: Este es el coeficiente de regresión que indica la cantidad de cambios que experimenta
“Y” por un cambio en “X”. En este caso indica que por Un mil millones de dólares que se

incremente la producción, los costos se incrementarán en 0.423738 miles de millones

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

de dólares. Esto porque la pendiente encontrada fue positiva, si hubiera sido negativa,

se diría que disminuiría esa cantidad.

β0: No siempre tienen interpretación aplicada al problema, es decir, una interpretación


lógica, es por ello que comúnmente se le interpreta desde el punto de vista matemático

como el punto donde la recta de estimación corta al eje de las ordenadas cuando “X”

toma el valor de cero. En el caso del ejemplo, β0 =-1.46798, esto estaría indicando que

cuando la producción es cero, los costos son de -1.46798 miles de millones de dólares.

Como se ve esta interpretación carece de lógica lo cual hace que se interprete como se

ha mencionado anteriormente.

Existen casos donde si existe interpretación lógica como lo muestran el trabajo de

investigación realizado por Martínez (1995) donde ajustó pesos de becerros al nacimiento.

Dibujo de la Recta de Estimación

Cualquier recta se define por dos puntos y en el caso de la recta de regresión lineal simple,

ésta pasa por dos puntos obligados cuyas coordenadas son: (x , y) y (0, β0). La recta de

estimación debe dibujarse dentro del área de exploración, es decir, el área determinada

por el diagrama de dispersión que donde se tiene información de ambas variables.

Para el caso del ejemplo que se ha venido tratando la gráfica de la recta de estimación

sería como se muestra en el Figura 4.

Figura 4. Dibujo de la recta de estimación y en el diagrama de dispersión.

Regresión no Lineal

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

Este tipo de regresión no es objeto de desarrollo del presente documento ya que se

consideran para cursos superiores de estadística lo que se trata es dejar plasmado que una

relación entre dos variables no siempre es una línea recta, ésta puede ser logarítmica,

exponencial o bien cuadrática o cúbica. Uno de los criterios para definir el ajuste de

modelo es el R² y además el Cuadrado Medio del Error del análisis de varianza. En estos

casos el diagrama de dispersión es importante para determinar esas posibles relaciones.

Regresión Múltiple

No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser

que “Y” como variable dependiente se vea afectada por más de una variable independiente,

en este caso se habla de regresión lineal múltiple, aspecto que no se desarrolla en este

documento.

Correlación Lineal Simple

Así como existen técnicas que cuantifican los cambios de una variable dependiente por un

único cambio de la variable independiente, existen técnicas que cuantifican la asociación

lineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se exprese

como el coeficiente de correlación (r). Este coeficiente indica el sentido de la asociación

como también la magnitud de ésta, partiendo del hecho que el coeficiente de correlación

lineal simple toma valores en el rango de: r es 0≤ r ≤ 1. Entre más se acerca a 1 el valor de r

mayor es la asociación entre dichas variables.

De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos:

-1 ≤ r < -0.8 Asociación fuerte y negativa 0 ≤ r < 0.4 No hay asociación

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

-0.8 ≤ r < -0.4 Asociación débil y negativa 0.4 ≤ r < 0.8 Asociación débil y positiva
-0.4 ≤ r ≤ 0 No hay asociación 0.8 ≤ r ≤ 1 Asociación fuerte y positiva

El coeficiente de Correlación Lineal Simple se determina a través de la siguiente ecuación:

r=xy- (xy)nx²-(x)²ny²-(y)²n, que para el caso del ejemplo sería el siguiente:

r=1952- 214*76105348-(214)²10732-(76)²10= 0.9452

Este valor indica que existe una asociación fuerte y positiva entre estas variables, es decir,

entre la producción y los costos de esas empresas.

Diferencias entre Regresión Lineal Simple y Correlación Lineal Simple

Se pueden llegar a establecer las siguientes diferencias:

Regresión Lineal Simple Correlación Lineal Simple


Mide la cantidad de cambios en “Y” por un único Mide asociación lineal entre dos
cambio en “X”. variables
Existe una variable dependiente y otra Es indistinto x, y ó y, x
independiente
β1 puede tomar cualquier valor en la recta El coeficiente de correlación toma
numérica valores en el intervalo -1 ≤ r ≤ 1

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

BIBLIOGRAFIA CONSULTADA

BERENSON, M.L. y D.M. LEVINE. 1984. Estadística para Administración y Economía.


Conceptos y Aplicaciones. Edit. Interamericana. México, D.F.

CABALLERO, W. 1981. Introducción a la Estadística. Instituto Interamericano de Cooperación


para la Agricultura (IICA). San José, Costa Rica.

CALZADA, B.J. 1988. Estadística General con Énfasis en Muestreo. Edit. ____. Lima, Perú.

CHAO, L.L. 1993. Estadística para las Ciencias Administrativas. 3ra. Edic. Edit. McGraw-Hill.
Bogotá, Colombia.

HERNANDEZ, S.R.; C. FERNANDEZ COLLADO y P. BAPTISTA LUCIO. 1991.


Metodología de la Investigación. Edit. McGraw-Hill Interamericana de México, S.A. de
C.V. México.

INFANTE, G.S y G.P. ZARATE de LARA. 1990. Métodos Estadístico. Un enfoque


interdiciplinario. 2da. Edi. Edit. Trillas. México, D.F.

KERLINGER, F.N. 1975. Investigación del comportamiento: técnicas y metodología. Edit.


Nueva Editorial Interamericana. México.

LEVIN, I.R. 1988. Estadística para Administradores. 2da Edic. en español. Edit. Prentice-Hall
Hispanoamericana, S.A. México.

MARTINEZ-GARZA, A. 1988. Diseños Experimentales para la Investigación en la


Agricultura. Métodos y Elementos de Teoría. Edit. Trillas, México, D.F.

MARTINEZ-GARZA, A. 1994. Experimentación Agrícola. Métodos Estadísticos. Universidad


Autónoma Chapingo. México.

MARTINEZ, S.F. 1996. Diseños Experimentales: Una herramienta para el investigador. Santa
Cruz, Bolivia.
Por: Ing. M.Sc. Francisco Martínez Solaris
Mgs. En Educación Superior
Universidad Autónoma “Gabriel René Moreno”
Facultad de Ciencias Tecnológicas
Unidad de Postgrado de Tecnología
Maestría: “Sistemas Integrados de Gestión de Calidad, Medio Ambiente y Seguridad
Módulo: Métodos Estadísticos para la Toma de Decisiones Empresariales

MONTGOMERY, D.C. 1991. Diseño y Análisis de Experimentos. Edit. Grupo Editorial


Iberoamericana. México, D.F.

MOYA, C.R. 1992. Estadística Descriptiva. Conceptos y Aplicaciones. Edit. San Marcos. Lima,
Perú.

RENDON, S.G. 1992. Métodos Estadísticos (Muestreo, Diseños Experimentales, Estadística No


Paramétrica). Universidad Autónoma de Chapingo. Chapingo, México.

REYES, C.P. 1990. Diseño de Experimentos Aplicados. 3era. Edi. Edit. Trillas. México, D.F.

RODRIGUEZ del ANGEL, J.M. 1991. Métodos de Investigación Pecuaria. Edit. Trillas.
México, D.F.

SNEDECOR, W.G. and W.G. COCHRAN, 1976. Statistical Methods. 6ta. Edic. Edit. The
Iowa State University Press. Ames, Iowa. U.S.A.

SPIEGEL, R.M. 1995. Estadística. 2da. Edi. Edit. Mcwraw-Hill. México, D.F.

STEEL, D.R.G. y J.H. TORRIE. 1992. Bioestadística. Principios y Procedimientos. 2da. Edi.
Edit. McGraw-Hill. México, D.F.

Por: Ing. M.Sc. Francisco Martínez Solaris


Mgs. En Educación Superior

S-ar putea să vă placă și