Documente Academic
Documente Profesional
Documente Cultură
fr
fi
f % fr 100
total
n=
1.00
100%
datos cuantitativos
Construccin distribucin de frecuencias
1.- Determinar #clases 1 3.322 logn redondear a entero
2.- Determinar W dato mayor - dato menor redondear segn la precisin
# clases
de los datos
4.- formar
las clases usando como li de la primera clase un nmero menor o
igual
que el dato menor.
2
mi
fa
mi fi
clase
fr
f
fi mi x
li
ls
grfica: barras
pastel
Grficas:
histograma: grafico de barras de
ancho proporcional al tamao de
clase y altura proporcional a la
frecuencia.
polgono de frecuencias:
grfico de lneas.
ojiva menor que: grfico de
lneas de la distribucin de
frecuencias acumuladas
60
50
40
30
20
10
45.5
total
n=
1.00
Auxiliares para determinar media aritmtica y varianza, datos agrupados
52.5
59.5
66.5
73.5
80.5
87.5
94.5
uniforme
normal o forma de
campana
sesgada hacia la
derecha o positivamente
asimtrica
IIB.- MEDIDAS ESTADSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersin de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor nico que nos indica el punto medio o tpico de los datos
que cabe esperar.
MEDIDA
DATOS SIMPLES
DATOS AGRUPADOS. (Distribuciones de frecuencias)
NO AGRUPADOS
EXCEL NO TIENE FUNCIONES PARA OBTENER
MEDIA ARITMTICA
Es el ms comnmente usado. Tambin llamado
promedio o simplemente media.
x = media muestral
media poblacional
Media de la muestra
x
x
m f
i
EXCEL: =PROMEDIO()
MEDIANA Md
1. Ordene los datos de manera ascendente
Es el valor intermedio cuando los valores de los 2. Calcule un ndice i
n
i
datos se ordenan en forma ascendente.
2
f i = frecuencia de clase
n = # elementos en el conjunto
n =# elementos en el conjunto
Media de la poblacin
Aproxime
su valor mediante el grfico de ojiva
i e i 1
EXCEL: =MEDIANA()
MODA Mo
Se determina por inspeccin (buscamos el valor
Es el valor de los datos que se presenta con ms que ms se presenta en el conjunto)
frecuencia. Cuando hay dos o ms modas en un
EXCEL: =MODA()
conjunto, los datos son llamados bimodales o
multi-modales. Tambin puede ser que no haya
moda.
MEDIDAS DE DISPERSION. Se usa el trmino dispersin para describir el grado en que una serie de valores vara respecto a su media. Los valores incluidos en un
conjunto de datos usualmente varan en magnitud; algunos valores son pequeos y algunos son grandes. La variacin de los valores es llamada Dispersin, y hay
varios criterios para medirla:
Una medida de dispersin es importante en dos modos:
1.
Puede ser usada para mostrar el grado de variacin entre los valores en los datos
2.
Puede ser usada para suplementar un promedio: si la dispersin es alta, el promedio no es significativo; si la dispersin es baja, el promedio se vuelve
altamente significativo.
RANGO
R=(l.r.s. ltima cla se)- (l.r.i. primera clase)
R valor mximo-valor mnimo
VARIANZA
medida de la dispersin que emplea todos los datos.
Promedio de las desviaciones respecto al promedio
elevadas al cuadrado. Se mide en el cuadrado de las
unidades originales.
s2= variancia muestral.
2= variancia poblacional.
varianza muestral
varianza muestral
n 1
fi m
n 1
EXCEL: =VAR()
varianza poblacional
varianza poblacional
EXCEL: =VARP()
desviacin estndar muestral
DESVIACIN ESTANDAR
2
Dispersin promedio de los datos alrededor de la
xi x
media aritmtica, se mide con las mismas unidades
2
s s
que las de los datos originales.
n 1
Es la raz cuadrada positiva de la varianza.
n 1 = grados de libertad.
EXCEL: =DESVEST()
desviacin estndar poblacional
fi m
s s
2
fi m
n 1
x i
fi m
EXCEL: =DESVESTP()
CUARTILES
Valores que dividen los datos en cuatro partes:
Q1= primer cuartil,
Q2= segundo cuartil,
Q3= tercer cuartil.
COEFICIENTE DE VARIACIN
Es una medida de dispersin relativa.
Para comparar la dispersin de variables que tienen
distintas desviaciones estndar y distintos promedios.
Q1 : i = 14 n
Localizacin Q2 : i = 24 n
Localizacin Q3 : i = 34 n
Localizacin
EXCEL: =CUARTIL(MATRIZ,CUARTIL)
desviacin estandar
C.V .
100
media aritmtica
C.V .
desviacin estandar
100
media aritmtica
Aproximadamente 68.27% de los elementos estn a menos de una desviacin estndar de la media.
Aproximadamente 95.45% de los elementos estn a menos de dos desviaciones estndar de la media.
Casi todos los elementos (99.73%) estn a menos de tres desviaciones estndar de la media.
Podemos medir con mayor precisin la proporcin de elementos que caen dentro de intervalos especficos si estos estn distribuidos normalmente, es decir, si la
grfica de la distribucin es simtrica con forma de campana, Md Mo
Distribucin normal estndar
donde z
xi x
;
s
pares ordenados
x
x, y
e y y residuo o error
y a bx
x, y
a y bx
xy n x y
=pendiente(conocido_y,conocido_x)
por
r
xy
Mediante excel:
=Pearson(matriz1,matriz2)
xy n x y
2
2
2
x n x
y n y
ecuacin de regresin.
Excel: coeficiente.r2(conocido_y,conocido_x)
REGRESIN MLTIPLE:
Estudia la relacin entre una variable dependiente , con dos o ms variables independientes .
Se utiliza:
p para denotar el nmero de variables independientes utilizadas en el anlisis
: variable dependiente
1 , 2 , , : variables independientes
Ecuacin de regresin mltiple estimada:
Men principal: Datos Anlisis de datos Regresin
aceptar.
y a b1 x1 b2 x2 ... b p x p
Seleccionamos los datos como solicita el cuadro de
Donde
dilogo: el rango de celdas que contiene los valores de Y,
el rango de celdas que contiene los valores de X,
a, b1 , b2 , b p
= tiempo codificado
pendiente : b
T y n T y ,
T n T
intersecci n y :
a Y b T
Y a bT
porcentaje de tendencia
Y
100
Y
Y y
100
Y
interpretacin: informa el % en qu valor real est por arriba o por abajo del
valor esperado.
Mediante excel:
Insertar el grfico de dispersin de los datos,
Clic derecho en uno de los puntos de datos observados
Modelo lineal,
(pestaa opciones) lnea de tendencia en el grfico,
presentar ecuacin en el grfico
pendiente
b: =pendiente(conocido_y,conocido_x)
interseccin y:
a: =intercepcin.eje(conocido_y,conocido_x)
Real
Promedio Mvil
Y a bT
y *S
V. PROBABILIDAD
Probabilidad de ocurrencia del evento A:
p A
0 certeza
# resultados favorables
# resultados posibles
1 certeza
no
ocurrencia
de
ocurrencia
Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se llama
punto muestral. Un subconjunto de uno o ms resultados del espacio muestral se llama evento.
TECNICAS DE CONTEO: Para determinar el nmero de formas en que ocurre un experimento o un evento, usando frmulas o procedimientos
sistemticos.
1. Diagrama de rbol: Dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados posibles..
n1 n 2 nk
2.
3.
Permutaciones: Una permutacin es cualquier arreglo u ordenacin de todos o una parte de n elementos
4.
n!
, rn
n r!
Combinaciones: Una combinacin es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los elementos
carece de importancia. El nmero de combinaciones es: nCr
n!
r!n r!
N Ei
n
Nmero de ensayos u observaciones
Es una evaluacin personal de la probabilidad
de que ocurra un evento
pE i
1.
0 pEi 1
2.-
pEi 1
3.-
Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros eventos o
clasificaciones.
pA
# resultados favorables
f
# resultados posibles
n
Probabilidad Condicional
: la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A,
pB A
Si A y B son independientes,
pA B
;
pA
pB A pB, o tambin pA B pA pB
Teorema de Bayes: En un experimento en dos etapas, si se sabe que en la segunda etapa se obtuvo el resultado B, cul es la probabilidad
Mtodo tabular:
Evento
Probabilidad previa
A1
A2
Total
Probabilidad condicional
Probabilidad conjunta
pB Ai
p Ai
Ai
p Ai B
p Ai 1
Probabilidad posterior
pAi B
p Ai B
p B
p A B p B
i
E x x f x ,
varianza: Var x 2
donde
f (x)
x f x
2
pxxitos n Cx p q
x
ensayos, cada uno de los cuales tiene dos resultados posibles, xito o
Parmetros: n p
n x
Media aritmtica:
n p
Desviacin estndar:
n pq
DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el nmero de veces que ocurre un fenmeno durante un intervalo dado
o en una regin especfica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias:
Parmetro:
Media aritmtica:
Desviacin estndar
x
f x
e
x!
=poisson(x,media)
poisson binomial
n p
f x
x e
x!
=poisson(x,media)
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
DISTRIBUCION NORMAL:
Muy importante distribucin continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teora de Estadstica
Inferencial.
Para definir una poblacin distribuida normalmente, se necesitan solo 2 parmetros: y .
Distribucin normal estndar:
El rea total bajo la curva es 1.00, por lo cual las reas bajo la curva y dentro de dos lmites corresponden a la probabilidad de
que la variable tenga valor dentro de sos lmites. La tabla muestra las reas bajo la curva normal a la izquierda de un valor Z,
donde (Z es la forma estandarizada o tipificada de la variable aleatoria x).
z
=distr.norm.estand(Z)
x z
=inv.norm.estand(probabilidad) =distr.norm.estand.inv(probabilidad)
para obtener Z dada el rea
APROXIMACIN DE LA DISTRIBUCIN
NORMAL A LA BINOMIAL. Las reas bajo la curva de la distribucin normal se utilizan para
n p
Desviacin estndar:
xcorr
n pq