Sunteți pe pagina 1din 67

ESTADSTICA I

MARLON MERCADO TRIANA


Ingeniero Industrial
UNIVERSIDAD SANTO TOMAS
Vicerrectora General De Universidad
Abierta y A Distancia
FACULTAD DE CIENCIAS Y
TECNOLOGIAS
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
La estadstica es un conjunto de tcnicas que, partiendo de
la observacin de fenmenos, permiten al investigador
obtener conclusiones tiles sobre ellos.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
La estadstica descriptiva, la cual se encarga de la
recoleccin, clasificacin y descripcin de datos muestrales
o poblacionales, para su interpretacin y anlisis, que es de
la que nos ocuparemos en este curso.

La estadstica matemtica o inferencial, que desarrolla


modelos tericos que se ajusten a una determinada
realidad con cierto grado de confianza.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
VARIABLES
Es muy probable que un especialista en Estadstica que realiza
una encuesta desee desarrollar un instrumento que le permita
hacer varias preguntas y manejar diversos fenmenos o
caractersticas. A estos fenmenos o caractersticas se les
denomina variables aleatorias.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
VARIABLES
Segn la forma en que se expresen las variables, se dividen en:
Variables Cualitativas: son aquellas que pueden expresarse slo en forma de
atributo.
Variables Cuantitativas, son aquellas variables que pueden expresarse en forma
numrica. Se dividen en discretas y continuas.
Variables Cuantitativas Discretas, son respuestas numricas que surgen
de un proceso de conteo, siendo siempre un nmero entero.
Variables Cuantitativas Continuas, son respuestas numricas que surgen
de un proceso de medicin, las cuales pueden tomar valores entre dos
nmeros enteros.
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede
siempre mantener las mismas condiciones predeterminadas o a voluntad del
investigador, deja que acten libremente.
Para el planeamiento de una investigacin, se siguen las siguientes etapas:.

Planteamiento del problema.


Fijacin de los objetivos.
Formulacin de la hiptesis.
Definicin de la unidad de observacin y de la unidad de medida.
Determinacin de la poblacin y de la muestra.
La recoleccin.
Crtica, clasificacin y ordenacin.
Tabulacin.
Presentacin.
Anlisis.
Publicacin.
Ing. Marlon Mercado T
Ing. Marlon Mercado T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
PLANTEAMIENTO DEL PROBLEMA
Se debe establecer una delimitacin clara, concreta e inteligible
sobre el o los fenmenos que se pretenden estudiar, para lo cual se
deben tener en cuenta, entre otras cosas, la revisin bibliogrfica del
tema, para ver su accesibilidad y consultar los resultados obtenidos
por investigaciones similares, someter nuestras proposiciones
bsicas a un anlisis lgico; es decir, se debe hacer una ubicacin
histrica y terica del problema.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
FIJACIN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos
presupuestar hasta dnde queremos llegar; en otras palabras,
debemos fijar cuales son nuestras metas y objetivos. Debe, adems,
establecerse diferenciacin entre lo de corto, mediano y largo plazo,
as como entre los objetivos generales y los especficos.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
FORMULACIN DE LAS HIPTESIS

Una hiptesis es ante todo, una explicacin provisional de los


hechos objeto de estudio, y su formulacin depende del
conocimiento que el investigador posea sobre la poblacin
investigada. Una hiptesis estadstica debe ser susceptible de
docimar, esto es, debe poderse probar para su aceptacin o
rechazo..
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con
el propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por ; a su hiptesis
contraria se le llama Hiptesis Alternativa .
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA
UNIDAD DE MEDIDA
La Unidad de Observacin, entendida como cada uno de los
elementos constituyentes de la poblacin estudiada, debe definirse
previamente, resaltando todas sus caractersticas; pues, al fin de
cuentas, es a ellas a las que se les har la medicin.
El criterio sobre la unidad de medicin debe ser previamente definido
y unificado por todo el equipo de investigacin. Si se trata de
medidas de longitud, volumen, peso, etc.
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de
individuos o de objetos que poseen una o varias caractersticas
comunes.
Muestra es un subconjunto de la poblacin a la cual se le efecta la
medicin con el fin de estudiar las propiedades del conjunto del cual
es obtenida.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
LA RECOLECCIN
Es descubrir dnde est la informacin y cmo y a qu "costo" se
puede conseguir; es determinar si la encuesta se debe aplicar por
telfono, por correo, o si se necesitan agentes directos que recojan
la informacin; establecer su nmero ptimo y preparar su
entrenamiento adecuado.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
CRITICA, CLASIFICACIN Y ORDENACIN
Para hacer la crtica de una informacin, es fundamental el
conocimiento de la poblacin por parte de quien depura para poder
detectar falsedades en las respuestas, incomprensin a las
preguntas, respuestas al margen, amn de todas las posibles causas
de nulidad de una pregunta o nulidad de todo un cuestionario.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms
variables, que ofrece claridad al lector sobre lo que se pretende
describir; una tabla debe tener por lo menos: Un titulo adecuado el
cual debe ser claro y conciso, la tabla con los correspondientes
subttulos internos y la cuantificacin de los diferentes tems de las
variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los crditos a la fuente
de la informacin.
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms
variables, que ofrece claridad al lector sobre lo que se pretende
describir; una tabla debe tener por lo menos: Un titulo adecuado el
cual debe ser claro y conciso, la tabla con los correspondientes
subttulos internos y la cuantificacin de los diferentes tems de las
variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los crditos a la fuente
de la informacin.
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
ETAPAS DEL MTODO ESTADSTICO
LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se
presenta en la forma adecuada. Los cuadros, tablas y grficos
facilitan el anlisis, pero se debe tener cuidado con las variables que
se van a presentar y la forma de hacerlo.
EL ANLISIS
Esta es la fase de la determinacin de los parmetros y estadsticos
muestrales para las estimaciones respecto a la poblacin, el ajuste
de modelos y las pruebas de las hiptesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Despus de recoger toda la informacin correspondiente a la
investigacin, es decir, al agotar todo el trabajo de campo, nuestro
escritorio se llena de un cmulo de datos y cifras desordenadas los
cuales, al ser tomados como observaciones individuales, dicen muy
poco sobre la poblacin estudiada; es, entonces, tarea del
investigador hacer hablar las cifras, comenzando por la
clasificacin y ordenacin, consignando la informacin en tablas
inteligibles que denominamos distribuciones de frecuencias.
EJEMPLO
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Supongamos que en la fbrica de confecciones La Hilacha, ha estallado un conflicto laboral y
sus cincuenta operarias solicitan un aumento en el salario integral diario sopena de paralizar la
fbrica.
El Gerente-propietario recoge la informacin respecto a la variable salario diario de sus 50
operarias y la relaciona en la tabla.
SALARIO DIARIO DE LAS OPERARIAS DE
LA FABRICA
56
50
52
54
55
56
57
51
50
54

Dato en miles de pesos


53
54
54
54
56
57
56
58
56
58
52
54
56
52
52
54
53
52
56
51
51
55
50
52
54
50
58
51
58
56

56
57
54
58
53
58
53
52
50
57

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y el
ordenamiento y agrupamiento de la tabla No. 2.

DISTRIBUCION DE FRECUENCIAS
DEL SALARIO DE LAS OPERARIAS
Miles $/dia

Conteo

50

51

52

53

54

55

Repeticion

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Con el fin de obtener una mejor tabla interpretativa, introduciremos la
siguiente simbologa:
n : El tamao de la muestra, es el nmero de observaciones.
Xi : La variable; es cada uno de los diferentes valores que se han
observado.
La variable xi, toma los x1, x2... xm valores.
fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de
veces que se repite la variable
fa: La frecuencia acumulada, se obtiene acumulando la frecuencia
absoluta.
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
fr: Frecuencia relativa; es el resultado de dividir c/u de las
frecuencias absolutas por el tamao de la muestra.
fra: Frecuencia relativa acumulada; se obtiene dividiendo la
frecuencia acumulada entre el
tamao de la muestra.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Veamos cada una de ellas con el ejemplo que venimos trabajando.
DISTRIBUCION DE FRECUENCIAS DEL SALARIO DIARIO DE 50
Salario

Frecuencia

por da

absoluta

Xi

OBRERAS DE LA FABRICA
frecuencia
Frecuencia
absoluta

acumulada
fa

Frecuencia relativa

relativa

acumulada

fr

fra

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS
Veamos cada una de ellas con el ejemplo que venimos trabajando.
DISTRIBUCION DE FRECUENCIAS DEL SALARIO DIARIO DE
50 OBRERAS DE LA FABRICA
Salario
por da

Frecuencia frecuencia
absoluta
absoluta

Frecuencia

Frecuencia

relativa

relativa

Xi
50

f
5

acumulada
fa
5

5/50

51

4/50

0,08

9/50

52

16

7/50

0,14

16/50 0,32

53

20

4/50

0,08

20/50

0,40

54

29

9/50

0,18

29/50

0,58

55

31

2/50

0,04

31/50

0,62

56

40

9/50

0,18

40/50

0,80

57

44

4/50

0,08

44/50

0,88

58

50

6/50

0,12

fr

acumulada
fra
5/50 0,10

0,10

50/50

0,18

1,00

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Usualmente los valores de los datos no permiten un agrupamiento
de ellos en una tabla de frecuencias simple, debido a que se
encuentran distribuidos a travs de todo el recorrido y el nmero de
veces que se repite cada observacin no es significativo en todos los
casos, y en la mayora de ellos su frecuencia es baja.
Se hace necesario el agrupamiento en intervalos o clases que haga
ms compacta, manejable y presentable la informacin.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Para tabular una variable continua o discreta (que tome un gran
nmero de datos distintos) se necesitan los siguientes elementos:
Rango o recorrido : Es la diferencia entre el valor mximo y valor
mnimo que toma la variable.
R = Xmax Xmin.
Nmero de intervalos o clases (m) : Es el nmero de grupos en
que es posible dividir los valores de la variable.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
El

nmero de clases no debe ser ni muy grande ni muy pequeo, un


nmero pequeo de clases puede ocultar la naturaleza general de
los datos y un nmero muy grande puede ser demasiado detallado
como para revelar alguna informacin til. Como regla general se
recomienda que el nmero de clases est entre cinco y veinte. Hay
una regla llamada Regla de Sturges que puede dar una
aproximacin razonable para el nmero de clases, ella es:

donde n es el nmero de datos de la muestra.


Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Amplitud del intervalo o amplitud de la clase (a) :

Lmites de un intervalo : Son los valores extremos de una clase. El


menor valor es considerado como el lmite inferior y el valor que se
obtiene sumando al lmite inferior la amplitud del intervalo es el lmite
inferior de la segunda clase.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Lmites reales de un intervalo : Se obtienen calculando el
promedio entre el lmite superior de una clase y el lmite inferior de la
clase siguiente.
Marca de clase : (Xi) Es el punto medio de un intervalo.
Frecuencia absoluta : fi indica el nmero de observaciones que
pertenece a un intervalo dado.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Frecuencia absoluta acumulada: Fi indica el nmero de datos de la
muestra menores o iguales al lmite real superior del intervalo i.
Frecuencia relativa acumulada: Hi indica la proporcin de datos de
la muestra menores o iguales al lmite real superior del intervalo
Ejemplo

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
Los siguientes datos corresponden a las notas obtenidas por 100
alumnos en un curso de Estadstica:

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS
1. Construya la correspondiente distribucin de frecuencia.
2. En qu clase se concentra el mayor nmero de notas?
3. Cul es la frecuencia absoluta del cuarto intervalo?. Interprete
el resultado .
4. Qu porcentaje de los alumnos tienen una nota inferior a 57?
Solucin
. Hallar R
. n = 100
. Hallar m
. Hallas a
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
Su objetivo es captar la informacin obtenida en los datos en forma
rpida por cualquier persona, as cada representacin debe llevar un
ttulo adecuado.
Las normas en la construccin de un grfico estadstico son
similares a los de grficos de funciones, las variables
independientes, se ubican en las abscisas y las dependientes en las
ordenadas.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Grfico circular: se usan para mostrar el comportamiento de las
frecuencias relativas, absolutas o porcentuales de las variables.
Dichas frecuencias son representadas por medio de sectores
circulares, proporcionales a las frecuencias.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Pictograma: es un grfico cuyo uso es similar al de sector
circular, pero la frecuencia es representada por medio de una
figura o dibujo que identifique a la variable en estudio. Este
grfico se utiliza para mostrar producciones en una serie
cronolgica.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Grfico lineal: Se utiliza para mostrar las frecuencias absolutas
o relativas de una variable discreta, son representadas mediante
lneas verticales proporcionales a dichas frecuencias.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Grfico de barra: Se utiliza para representar tablas de
frecuencia con atributos o con variables discretas y pocos
valores. Sobre un eje horizontal se construyen bases de
rectngulo del mismo ancho cada uno correspondiente a una
modalidad del atributo, sobre estas bases se levantan
rectngulos cuya altura es proporcional a la frecuencia absoluta
de la modalidad. El espacio entre ellas debe ser uniforme.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Histograma: Es el grfico adecuado cuando los datos estn
ordenados en tablas con intervalos, es decir, para datos de
variables continuas. Tambin el histograma es una conformacin
de rectngulos, pero uno al lado de otro cuya rea es
proporcional a la frecuencia de cada intervalo. Los extremos de la
base de cada rectngulo son los lmites reales del intervalo.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REPRESENTACIN GRFICA
TIPOS DE GRAFICOS
Polgono de frecuencia: Este grfico sirve para mostrar la
tendencia de la variable, se puede determinar a partir de un
histograma uniendo los puntos medios superiores de cada
rectngulo del histograma. Tambin, se determina el polgono
uniendo los puntos formado por la marca de clase con la
frecuencia absoluta del intervalo respectivo.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSION
En todo anlisis y/o interpretacin se pueden utilizar diversas
medidas descriptivas que representan las propiedades de tendencia
central, dispersin y forma para extraer y resumir las principales
caractersticas de los datos.
Medidas de tendencia central
La mayor parte de los conjuntos de datos muestran una tendencia a
agruparse alrededor de un punto "central" y por lo general es posible
elegir algn valor que describa todo un conjunto de datos. Un valor
tpico descriptivo como ese es una medida de tendencia central o
"posicin".
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Media aritmtica

La media aritmtica ( tambin denominada media ) es la medida de


tendencia central que se utiliza con mayor frecuencia. La media
aritmtica de un conjunto de valores se define como el cociente entre
la suma de los valores y el nmero de ellos. Su smbolo es si la
media aritmtica es de una muestra y si la media aritmtica es de
una poblacin.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Media aritmtica: datos no agrupados

Donde n es el tamao de la muestra

Donde N es el tamao de la poblacin


Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Media aritmtica: datos agrupados

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Mediana

La mediana es el valor que se encuentra en el centro de una


secuencia ordenada de datos. La mediana no se ve afectada por
observaciones extremas en un conjunto de datos. Por ello, cuando
se presenta alguna informacin extrema, resulta apropiado utilizar la
mediana, y no la media, para describir el conjunto de datos.
Su smbolo es

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Mediana
Mediana para datos no agrupados
Se deben ordenar los datos de forma creciente o decreciente. Para
muestras con un nmero par de observaciones, la mediana es el
dato que queda en el centro de dicha ordenacin y para muestras
con nmero impar de observaciones la mediana es el promedio de
los dos datos centrales.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Mediana
Mediana para datos agrupados

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Moda

La moda es el valor de un conjunto de datos que aparece con mayor


frecuencia. Se le obtiene fcilmente a partir de un arreglo ordenado.
A diferencia de la media aritmtica, la moda no se afecta ante la
ocurrencia de valores extremos. Sin embargo, slo se utiliza la moda
para propsitos descriptivos porque es ms variable, para distintas
muestras, que las dems medidas de tendencia central. Un conjunto
de datos puede tener ms de una moda o ninguna.
Su smbolo es
Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE TENDENCIA CENTRAL
Moda para datos agrupados:

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Una segunda propiedad que describe a un conjunto de datos es la
dispersin. Dispersin es el grado de variacin o diseminacin de los
datos. Dos conjuntos de datos pueden diferir tanto en tendencia
central como en dispersin o dos conjuntos de datos pueden tener
las mismas medidas de tendencia central, pero diferir mucho en
trminos de dispersin.
Las medidas de dispersin a estudiar son: rango, desviacin media,
varianza y desviacin estndar.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Rango
Indica el nmero de valores que toma la variable. El rango es la diferencia entre el
valor mximo y el valor mnimo de un conjunto de datos.

Si los datos estn agrupados en una tabla de frecuencias, el recorrido es la


diferencia entre el lmite real superior del ltimo intervalo y el lmite real inferior del
primer intervalo.

El rango mide "la dispersin total" del conjunto de datos


Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Varianza

La varianza se define como el promedio aritmtico de las diferencias


entre cada uno de los valores del conjunto de datos y la media
aritmtica del conjunto elevadas al cuadrado.
Su smbolo es si estamos trabajando con una muestra y si estamos
trabajando con una poblacin.
Varianza para datos no agrupados

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Varianza para datos agrupados

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Desviacin Tpica o Desviacin Estndar
Es la raz cuadrada positiva de la Varianza. Su smbolo es S si se
est trabajando con una muestra y es si se est trabajando con
una poblacin.
Desviacin estndar para datos no agrupados

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la
informacin en cuatro partes iguales, el primer cuartil deja el 25% de
la informacin por debajo de l, y el 75% por encima, el segundo
cuartil, al igual que la mediana, divide la informacin en dos partes
iguales, y por ltimo el tercer cuartil deja el 75% por debajo de s, y
el 25% por encima.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
Se necesita, entonces calcular tres cuartillas ya que la cuarta queda
automticamente determinada

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
DECILES
Similarmente, los deciles o decillas dividen la informacin en diez
partes iguales, en cantidades porcentuales de 10 en 10.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
MEDIDAS DE DISPERSIN
En general para calcular cualquier percentil:

n: Nmero de partes en que se divide la informacin


k: Orden del percentil k = 1,2,.....,r-1
Lmite inferior del intervalo que contiene el percentil
fa(i-1): Frecuencia acumulada hasta el intervalo anterior al que contiene el
percentil
fi: Frecuencia del intervalo que contiene el percentil
n: Nmero de observaciones
A: Amplitud de los intervalos

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
El anlisis de Regresin se utiliza para fines de prediccin. A menudo
existen relaciones entre 2 ms variables, por ejemplo, entre el
peso y la estatura de una persona, las horas de estudio y la
calificacin obtenida, etc. Suele ser deseable expresar tales
relaciones en forma matemtica determinando una ecuacin que
conecte a las variables.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Para hallar una ecuacin que relacione las variables:
1.
2.

Recoger datos que muestran valores correspondientes de las variables bajo


consideracin.
El prximo paso es marcar los puntos x,y en un sistema de coordenadas
rectangulares, el conjunto de puntos resultantes se denomina Diagrama de
dispersin.

Uno de los propsitos principales de la curva de ajuste es estimar una de las


variables (la variable dependiente) conocida otra (la variable independiente). El
proceso de estimacin se conoce como Regresin.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Para decidir que curva usar es til observar el diagrama de dispersin. Con el
diagrama de dispersin se puede tener una idea aproximada de la relacin entre las
variables. La relacin ms sencilla es la lineal.
A menudo se recurre a la intuicin personal para dibujar una curva que se ajuste a
un conjunto de datos. Este mtodo tiene la desventaja de que diferentes
observadores obtendrn distintas curvas y ecuaciones.

Para evitar juicios subjetivos al construir rectas, parbolas u otras


curvas aproximantes de ajuste de datos se utiliza el Mtodo de
Mnimos Cuadrados.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Ajuste Rectilneo (Mtodo de los Mnimos Cuadrados)

El anlisis de regresin lineal simple tiene por objeto encontrar la


lnea recta que mejor se ajuste a los datos, esto significa que se
desea encontrar la lnea recta para la cual las diferencias entre los
valores reales de y los valores estimados sean lo ms pequeas
posible.

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Ejemplo:
1) Determine la recta de mnimos cuadrados considerando:
a) y como la variable independiente
b) x como la variable dependiente para la siguiente tabla

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Solucion

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

ESTADSTICA I
REGRESIN LINEAL
Solucion

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

Ing.
Ing. Marlon
Marlon Mercado
Mercado T
T

S-ar putea să vă placă și