Sunteți pe pagina 1din 7

FORMULARIO

II.- ESTADISTICA DESCRIPTIVA Y MEDIDAS ESTADSTICAS


IIA.- DISTRIBUCIONES DE FRECUENCIAS: Muestra el nmero (frecuencia) de elementos correspondientes a cada una de varias clases que no se traslapan.
Datos cualitativos
clase
o frecuencia
frecuencia relativa
frecuencia
categora
absoluta
porcentual
fi

fr

fi

f % fr 100

total
n=
1.00
100%

datos cuantitativos
Construccin distribucin de frecuencias
1.- Determinar #clases 1 3.322 logn redondear a entero
2.- Determinar W dato mayor - dato menor redondear segn la precisin
# clases
de los datos
4.- formar
las clases usando como li de la primera clase un nmero menor o

igual
que el dato menor.

2
mi
fa
mi fi
clase
fr
f

fi mi x

li

ls

grfica: barras

pastel

Grficas:
histograma: grafico de barras de
ancho proporcional al tamao de
clase y altura proporcional a la
frecuencia.

polgono de frecuencias:
grfico de lneas.
ojiva menor que: grfico de
lneas de la distribucin de
frecuencias acumuladas

60

50

40

30

20

10

45.5

total
n=
1.00
Auxiliares para determinar media aritmtica y varianza, datos agrupados

52.5

59.5

66.5

73.5

80.5

87.5

94.5

101.5 108.5 115.5

Algunas formas de distribucin:

uniforme

normal o forma de
campana

sesgada hacia la
derecha o positivamente
asimtrica

IIB.- MEDIDAS ESTADSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersin de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor nico que nos indica el punto medio o tpico de los datos
que cabe esperar.
MEDIDA
DATOS SIMPLES
DATOS AGRUPADOS. (Distribuciones de frecuencias)
NO AGRUPADOS
EXCEL NO TIENE FUNCIONES PARA OBTENER

MEDIA ARITMTICA
Es el ms comnmente usado. Tambin llamado
promedio o simplemente media.

x = media muestral

media poblacional

Media de la muestra

x
x

x i =valor de cada observacin

mi = punto medio de la clase


i

m f
i

EXCEL: =PROMEDIO()

MEDIANA Md
1. Ordene los datos de manera ascendente
Es el valor intermedio cuando los valores de los 2. Calcule un ndice i
n
i
datos se ordenan en forma ascendente.
2

se prefiere sobre la media cuando hay valores


extremos (muy altos o muy bajos) en el conjunto
de datos.

f i = frecuencia de clase

n = # elementos en el conjunto

n =# elementos en el conjunto
Media de la poblacin

MEDIDAS ESTADSTICAS CON DATOS


AGRUPADOS

Aproxime
su valor mediante el grfico de ojiva

3. a) si i no es entero: El valor entero inmediato


mayor que i indica la posicin de la mediana
b) Si i s es entero, la mediana es el promedio de
de los datos ubicados en los lugares
los valores

i e i 1
EXCEL: =MEDIANA()
MODA Mo
Se determina por inspeccin (buscamos el valor
Es el valor de los datos que se presenta con ms que ms se presenta en el conjunto)
frecuencia. Cuando hay dos o ms modas en un
EXCEL: =MODA()
conjunto, los datos son llamados bimodales o
multi-modales. Tambin puede ser que no haya
moda.

Cuando los datos estn agrupados, debemos suponer


que la moda se halla en la clase que tenga ms
elementos, llamada Clase Modal.

MEDIDAS DE DISPERSION. Se usa el trmino dispersin para describir el grado en que una serie de valores vara respecto a su media. Los valores incluidos en un
conjunto de datos usualmente varan en magnitud; algunos valores son pequeos y algunos son grandes. La variacin de los valores es llamada Dispersin, y hay
varios criterios para medirla:
Una medida de dispersin es importante en dos modos:
1.
Puede ser usada para mostrar el grado de variacin entre los valores en los datos
2.
Puede ser usada para suplementar un promedio: si la dispersin es alta, el promedio no es significativo; si la dispersin es baja, el promedio se vuelve
altamente significativo.
RANGO
R=(l.r.s. ltima cla se)- (l.r.i. primera clase)
R valor mximo-valor mnimo
VARIANZA
medida de la dispersin que emplea todos los datos.
Promedio de las desviaciones respecto al promedio
elevadas al cuadrado. Se mide en el cuadrado de las
unidades originales.
s2= variancia muestral.
2= variancia poblacional.

varianza muestral

varianza muestral

n 1

fi m

n 1

EXCEL: =VAR()
varianza poblacional

varianza poblacional

EXCEL: =VARP()
desviacin estndar muestral

DESVIACIN ESTANDAR
2
Dispersin promedio de los datos alrededor de la
xi x
media aritmtica, se mide con las mismas unidades
2

s s
que las de los datos originales.
n 1
Es la raz cuadrada positiva de la varianza.
n 1 = grados de libertad.
EXCEL: =DESVEST()
desviacin estndar poblacional

fi m

desviacin estndar muestral

s s
2

fi m

n 1

desviacin estndar poblacional

x i

fi m

EXCEL: =DESVESTP()

MEDIDAS DE POSICIN DE LOCALIZACIN.


Percentiles: limitan centsimas partes de los datos: P1 a P99.
Q1, Q2, Q3
Cuartiles: limitan cuartas partes de los datos:
Nota: la mediana corresponde a Q2, a P50.
PERCENTILES. El p-simo percentil es un valor tal que Clculo del p-simo percentil
por lo menos p porciento de las observaciones son 1. Ordene los datos de manera ascendente
menores o iguales que p y (100 p) porciento de las 2. Calcule un ndice i
p
i
n
observaciones son mayores o iguales que p.
100

Aproxime su valor mediante el grfico de ojiva

en donde p es el percentil de inters.


3. a) si i no es entero, se redondea. El valor entero
inmediato mayor que i indica la posicin del
percentil
p-simo
b) Si i s es entero, el p-simo percentil es el
promedio de los valores de los datos ubicados
en los lugares i e i 1
=PERCENTIL(MATRIZ,K)

CUARTILES
Valores que dividen los datos en cuatro partes:
Q1= primer cuartil,
Q2= segundo cuartil,
Q3= tercer cuartil.
COEFICIENTE DE VARIACIN
Es una medida de dispersin relativa.
Para comparar la dispersin de variables que tienen
distintas desviaciones estndar y distintos promedios.

Q1 : i = 14 n
Localizacin Q2 : i = 24 n
Localizacin Q3 : i = 34 n

Aproxime su valor mediante el grfico de ojiva

Localizacin

EXCEL: =CUARTIL(MATRIZ,CUARTIL)
desviacin estandar
C.V .
100

media aritmtica

C.V .

desviacin estandar
100
media aritmtica

Indica lo grande que es la desviacin


estndar en comparacin con la media.

APLICACIONES DE LA DESVIACIN ESTNDAR


La desviacin estndar nos permite determinar, con cierto grado de precisin, donde se sitan los valores de una distribucin en relacin con la media. Cuando los
valores de una serie de datos estn concentrados cerca de su media, la desviacin estndar es pequea.
REGLA EMPRICA:
Para datos con distribucin en forma de campana, se puede aplicar la regla emprica para determinar el porcentaje de elementos que debe estar dentro de
determinada cantidad de desviaciones estndar respecto al promedio.

Aproximadamente 68.27% de los elementos estn a menos de una desviacin estndar de la media.


Aproximadamente 95.45% de los elementos estn a menos de dos desviaciones estndar de la media.

Casi todos los elementos (99.73%) estn a menos de tres desviaciones estndar de la media.
Podemos medir con mayor precisin la proporcin de elementos que caen dentro de intervalos especficos si estos estn distribuidos normalmente, es decir, si la
grfica de la distribucin es simtrica con forma de campana, Md Mo
Distribucin normal estndar

donde z

xi x
;
s

se considera que cualquier elemento con valor z fuera del intervalo de


3 es un valor atpico.

III.- REGRESIN LINEAL Y CORRELACIN.


REGRESIN LINEAL SIMPLE:
Nos interesa saber si dos variables cuantitativas
Datos: un muestra de

pares ordenados

x
x, y

estn asociadas, qu tan fuertemente lo estn y como se asocian.

x valor observado de la variable predictora o independiente


y valor observado de la variable a predecir o dependiente
y valor de la variable dependiente, estimado mediante la ecuacin de la lnea de regresin,

e y y residuo o error

MTODO DE MNIMOS CUADRADOS PARA ESTIMAR LA LNEA DEL MEJOR AJUSTE

y a bx

Ecuacin de la lnea de regresin estimada:

La lnea de regresin siempre pasa por el par ordenado


a = interseccin de la recta con el eje vertical

Insertar el grfico de dispersin de los datos,


Clic derecho en uno de los puntos de datos observados
Modelo lineal,
(pestaa opciones) lnea de tendencia en el grfico,
presentar r2 en el grfico (r2 = coeficiente de
determinacin)
=intercepcin.eje(conocido_y,conocido_x)

x, y

a y bx

xy n x y

b = pendiente o inclinacin de la recta b


x n x

=pendiente(conocido_y,conocido_x)

Interpretacin de la pendiente: representa el cambio promedio del valor de

por

cada unidad que aumenta x


COEFICIENTE DE CORRELACIN DE PEARSON : Es una herramienta estadstica que
nos sirve para describir el grado de asociacin entre dos variables. Su valor vara
desde -1 hasta 1, el signo es el de la pendiente, su valor numrico informa la fuerza
de la relacin entre las variables, hasta una correlacin perfecta en r=-1 r=1.

r
xy

Mediante excel:

=Pearson(matriz1,matriz2)

xy n x y

2
2
2
x n x
y n y

COEFICIENTE DE DETERMINACIN: r : corresponde al cuadrado del coeficiente


de correlacin; multiplicado por 100,
Interpretacin:
nos informa qu porcentaje del valor de Y, est explicado por la

ecuacin de regresin.

Excel: coeficiente.r2(conocido_y,conocido_x)

REGRESIN MLTIPLE:
Estudia la relacin entre una variable dependiente , con dos o ms variables independientes .
Se utiliza:
p para denotar el nmero de variables independientes utilizadas en el anlisis
: variable dependiente
1 , 2 , , : variables independientes
Ecuacin de regresin mltiple estimada:
Men principal: Datos Anlisis de datos Regresin
aceptar.
y a b1 x1 b2 x2 ... b p x p
Seleccionamos los datos como solicita el cuadro de
Donde
dilogo: el rango de celdas que contiene los valores de Y,
el rango de celdas que contiene los valores de X,

a, b1 , b2 , b p

son los coeficientes de regresin

1 , x2 , , xp : son las variables independientes

es el valor estimado de la variable dependiente.


2

COEFICIENTE DE DETERMINACIN: r : multiplicado por 100, nos informa qu


porcentaje del valor de Y, est explicado por la ecuacin de regresin estimada.

seleccionamos la casilla correspondiente si se incluyeron


rtulos, clic en el botn radial de rango de salida y en el
campo de la derecha, seleccionamos una celda vaca de
la hoja de clculo y clic en aceptar.
El programa devuelve la siguiente informacin:
coeficiente de determinacin R2
R2 ajustado
Coeficientes de regresin: a, b1, b2,

IV.- SERIE DE TIEMPO Y PRONSTICOS.


Elementos:

= Valores observados de la variable independiente (tiempo)

Y = Valor observado de la variable dependiente (la variable de inters)

= Valor estimado de la variable dependiente

= tiempo codificado

n Nmero de datos de la serie de tiempo

TIPO DE CAMBIO O VARIACIN


1. Tendencia secular: La tendencia secular representa la direccin de la serie a
largo plazo, y es resultado de factores como cambios en la poblacin,
caractersticas demogrficas de la misma, la tecnologa
Ecuacin de la lnea de tendencia:

pendiente : b

T y n T y ,
T n T

intersecci n y :

a Y b T

Y a bT

2. Variacin cclica: es la componente de una serie de tiempo que tiende a oscilar


arriba y abajo de la lnea de tendencia secular en periodos mayores que un ao,
debido a que estos factores son relativamente impredecibles, no podemos
determinar ningn patrn especfico futuro de variacin.
Mtodo de residuos

porcentaje de tendencia

Y
100
Y

interpretacin: informa a qu % del valor esperado corresponde el valor real.

residuo cclico relativo

Y y
100
Y

interpretacin: informa el % en qu valor real est por arriba o por abajo del
valor esperado.

Y Valor real de la serie temporal

Y Valor de tendencia estimado a partir del mismo punto de la serie de tiempo.

3. Componente temporal o variacin estacional: Este tipo de variacin se define


como un movimiento repetitivo y predecible alrededor de la lnea de tendencia que
se da en un ao o en menos. Para datos por trimestres, por ejemplo:
1. calculamos el promedio mvil de cuatro trimestres dividiendo cada uno de
los totales de cuatro trimestres entre cuatro.
2. centramos el promedio mvil de cuatro trimestres. Los promedios mviles
caen a la mitad de los trimestres. Es mejor tenerlos asociados a cada
trimestre.
3. calculamos la razn del valor real con respecto al valor de promedio mvil
para cada trimestre de la serie temporal que tenga una entrada de promedio
temporal de cuatro trimestres, obteniendo el valor irregular estacional.

Mediante excel:
Insertar el grfico de dispersin de los datos,
Clic derecho en uno de los puntos de datos observados
Modelo lineal,
(pestaa opciones) lnea de tendencia en el grfico,
presentar ecuacin en el grfico
pendiente
b: =pendiente(conocido_y,conocido_x)
interseccin y:
a: =intercepcin.eje(conocido_y,conocido_x)

valor irregular estacional

Real
Promedio Mvil

4. Reunimos todos los valores irregulares estacionales, organizndolos por


trimestre.
5. Calcular la media para cada trimestre. Las variaciones cclica e irregular
tienden a ser eliminadas mediante este proceso, de modo que la media es un
ndice del componente estacional.
6. Ajuste de la media. La base de un ndice es 100. por consiguiente, los cuatro
ndices trimestrales S deben dar un total de 400 y su media debe ser 100.
4. Variacin irregular. En muchas situaciones, el valor de la variable puede ser
completamente impredecible, cambiando de manera aleatoria.
Desestacionalizar la serie de tiempo: Al dividir los datos reales Y entre el ndice
estacional, obtenemos la serie de tiempo desestacionalizada, que nos permitirn
calcular el componente de tendencia
Pronstico: sustituimos el tiempo codificado T correspondiente al periodo para el
que queremos pronosticar, en la ecuacin de tendencia
y el pronostico de tendencia.
Pronstico ajustado=

Y a bT

y *S

multiplicando el pronstico obtenido con la ecuacin de tendencia secular por el


correspondiente ndice estacional

V. PROBABILIDAD
Probabilidad de ocurrencia del evento A:

p A

0 certeza
# resultados favorables


# resultados posibles
1 certeza

no

ocurrencia

de

ocurrencia

Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se llama
punto muestral. Un subconjunto de uno o ms resultados del espacio muestral se llama evento.
TECNICAS DE CONTEO: Para determinar el nmero de formas en que ocurre un experimento o un evento, usando frmulas o procedimientos
sistemticos.
1. Diagrama de rbol: Dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados posibles..

n1 n 2 nk

2.

Tcnica de conteo de etapas mltiples:

3.

Permutaciones: Una permutacin es cualquier arreglo u ordenacin de todos o una parte de n elementos

4.

Permutaciones de r elementos tomados de n elementos elegibles: n Pr

n!
, rn
n r!

Combinaciones: Una combinacin es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los elementos
carece de importancia. El nmero de combinaciones es: nCr

n!
r!n r!

Mtodos ms comunes para asignar probabilidades:


Probabilidad clsica
Probabilidad emprica o de
frecuencia relativa
Probabilidad subjetiva o de juicio

N Ei

Nmero de resultados asociados con E i


Nmero de resultados posibles
nE i nmero de veces que ocurre el evento E i
pE i

n
Nmero de ensayos u observaciones
Es una evaluacin personal de la probabilidad
de que ocurra un evento

Todos los resultados del experimento son


probables
igualmente
Se analiza como ha ocurrido el experimento
en el pasado para calcular probabilidades

pE i

Reglas o requerimientos bsicos para la asignacin de probabilidades

1.

0 pEi 1

2.-

pEi 1

3.-

pE1 E2 pE1 pE2

Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros eventos o
clasificaciones.

pA

# resultados favorables
f

# resultados posibles
n

Ley aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A B ( ambos):

p A B p A pB , cuando A y B son mutuamente excluyentes.

p A B p A pB p A B , cuando A y B no son mutuamente excluyentes.


Ley multiplicativa: A y B se presenten al mismo tiempo o en sucesin.
Sean A y B dos eventos de S,
pA B pA pB, si A y B son independientes.

pAB pA pB A, si A y B no son independientes.

Probabilidad Condicional
: la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A,

pB A

Si A y B son independientes,

pA B
;
pA

pB A pB, o tambin pA B pA pB

Teorema de Bayes: En un experimento en dos etapas, si se sabe que en la segunda etapa se obtuvo el resultado B, cul es la probabilidad

posterior de que provenga del resultado Ai de la primera etapa

Mtodo tabular:
Evento

Probabilidad previa

A1
A2

Total

Probabilidad condicional

Probabilidad conjunta

pB Ai

p Ai

Ai

p Ai B

p Ai 1

Probabilidad posterior

pAi B

p Ai B
p B

p A B p B
i

VI. DISTRIBUCIONES DE PROBABILIDAD


Distribucin de probabilidad: describe como se espera que varen los resultados de un experimento, si este se llevara a cabo: La distribucin de
probabilidad de una variable aleatoria describe cmo se distribuyen las probabilidades de los diferentes valores de la variable aleatoria.
Variable aleatoria es aquella que asocia un valor numrico con cada resultado experimental posible. El valor numrico de la variable aleatoria
depende del resultado del experimento. Se puede clasificar como discreta o continua, dependiendo de los valores numricos que asume.
Para variable aleatoria discrita,
Valor esperado,

E x x f x ,

varianza: Var x 2

donde

f (x)

es la probabilidad de ocurrencia del evento

x f x
2

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos

fracaso, y los resultados de los ensayos son independientes.


Probabilidad de x xitos:

pxxitos n Cx p q
x

ensayos, cada uno de los cuales tiene dos resultados posibles, xito o
Parmetros: n p

n x

p= probabilidad de xito en cada ensayo


x= nmero de xitos en los n ensayos
n-x = nmero de fracasos en los n ensayos
=distr.binom(nm_exito,ensayos,prob_exito)

Media aritmtica:

n p

Desviacin estndar:

n pq

DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el nmero de veces que ocurre un fenmeno durante un intervalo dado
o en una regin especfica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias:
Parmetro:
Media aritmtica:
Desviacin estndar
x

f x

e
x!

=poisson(x,media)

APROXIMACIN DE POISSON A LA BINOMIAL: es adecuada cuando n20 , p0.05, consiste en

poisson binomial
n p

f x

entonces calculamos la probabilidad de X xitos:

x e
x!

=poisson(x,media)
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
DISTRIBUCION NORMAL:
Muy importante distribucin continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teora de Estadstica
Inferencial.
Para definir una poblacin distribuida normalmente, se necesitan solo 2 parmetros: y .
Distribucin normal estndar:

El rea total bajo la curva es 1.00, por lo cual las reas bajo la curva y dentro de dos lmites corresponden a la probabilidad de
que la variable tenga valor dentro de sos lmites. La tabla muestra las reas bajo la curva normal a la izquierda de un valor Z,
donde (Z es la forma estandarizada o tipificada de la variable aleatoria x).

z
=distr.norm.estand(Z)

x z

para obtener el rea bajo la curva, a la izquierda de Z

=inv.norm.estand(probabilidad) =distr.norm.estand.inv(probabilidad)
para obtener Z dada el rea
APROXIMACIN DE LA DISTRIBUCIN
NORMAL A LA BINOMIAL. Las reas bajo la curva de la distribucin normal se utilizan para

aproximar las probabilidades binomiales.


Es aceptable cuando n30 y p0.05, y tanto np5 como nq 5. Se realiza una correccin por continuidad, sumando o restando 0.5
al valor de la variable a estandarizar, segn corresponda.
Media aritmtica:

n p

Desviacin estndar:

xcorr

n pq

S-ar putea să vă placă și