Documente Academic
Documente Profesional
Documente Cultură
Objetivo
Estudiar las caractersticas y el comportamiento de cierto grupo de elementos
de un conjunto considerado como universo a partir de otros ms pequeos
llamados muestras para luego ser recopilados presentados, ordenados y
analizados para poder emitir conclusiones de lo que sucede en el presente o de
lo que puede ocurrir en el futuro.
Aplicacin
Clasificacin de la estadstica
La estadstica se clasifica en:
Estadstica descriptiva
Estadstica inferencial o inductiva
Estadstica descriptiva
Describe los datos numricos, es el puente entre la accin de recolectar los
datos numricos y la comprensin de los mismos cuando estn reunidos, esto
comprende: 1.organizar los grupos de datos u observaciones del modo ms
fcil que se puedan; 2. presentar los datos de forma que llamen la atencin; 3.
Reunir los datos mediante algunas medidas importantes.
Observacin directa
Es cuando el investigador obtiene los datos personalmente acudiendo al
lugar de estudio o de hecho.
Observacin indirecta
Cuando la observacin de esta se obtiene la informacin por medio de otra
persona que ha estado en contacto y que ha tenido los detalles necesarios
a travs de la fotografa radio, peridico u otros medios de video.
Debe ser comn en su presentacin para que guarden relacin con el
objeto de la investigacin.
Poblacin
Poblacin Finita
Es lo que se puede contar, es lo que se puede ser un nmero limitado
elementos.
de
Poblacin Infinita
Cuando sus elementos no son contables en su totalidad.
Unidad o Elemento
Puede ser una persona ,un objeto, institucin ,religin ,etc., que va a ser
sometido a estudio dependiendo de las caractersticas que ms interesan , la
unidad o elemento debe permitir ser medida o contada , que permita hacer
comparaciones ,las caractersticas que debe tener un elemento deben ser
comunes en su presentacin para que guarde relacin con el objeto de
investigacin.
Ejemplo
Determine el elemento y caractersticas de una poblacin de una
empresa comercial en lotes de unidades producidas en un perodo, en
cuentas por cobrar, nmero de empleados que laboran en la empresa.
Poblacin: empresa comercial
Elemento: 1.- lotes de unidades
2.- En cuentas por cobrar
3.- Empleados
Caracterstica: 1.- calidad, variedad, comerciabilidad.
2.- precios, crditos, facturas, tiempo de vencimiento
3.- edad, sexo, experiencia.
Variable
Una variable es una propiedad que puede fluctuar y cuya variacin es
susceptible de adoptar diferentes valores, los cuales pueden medirse u
observarse.
Variable Cuantitativa
Son las variables que toman como argumento, cantidades numricas,
son variables matemticas. Las variables cuantitativas adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones
en la escala de valores que puede tomar. No tienen divisin son nmeros
enteros
Variable continua: Es la variable que puede adquirir cualquier valor dentro de
un intervalo especificado de valores. Son fracciones.
Variable Cualitativa
Son el tipo de variables que indican distintas cualidades, caractersticas o
modalidad. Las variables cualitativas pueden ser dicotmicas cuando slo
pueden tomar dos valores posibles.
Variable cualitativa ordinal : La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el
intervalo entre mediciones sea uniforme.
Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden.
ni
3
6
7
3
1
20
Ni
3
9
16
19
20
hi
0,15
0,3
0,35
0,15
0,05
%
15
30
35
15
5
100
Hi
0,15
0,45
0,80
0,95
1
%
Poblacin: 20 familias
15
45
Elemento: familias
80
95 Variable: cuantitativa discreta
100
Muestra
Subconjunto de la poblacin, se toma una muestra con el objeto de tener datos
representativos para poder estudiarlos, analizarlos, etc.
Tipos de muestreo
-
Muestreo estratificado
Muestreo sistemtico
Datos univariados
Son caractersticas o variables que se consideran que interviene en la
observacin de una muestra, por ejemplo:
El sueldo de los empleados, el nmero de personas de una familia, la estatura
de una persona.
Constante
ni =
fi
N
F I=
Ni
N
SEGUNDA UNIDAD
MEDIA ARITMETICA
Dnde:
xi
x simple x = i=1
n
n
xi ni
x ponderada x = i=1
Xi
i =1
Ejemplo
las
calificaciones
de
los
estudiantes
fueron
15,16,18,20,17,13,19,14,18,20,17.cul es el promedio de calificaciones ?
=17
Los siguientes son datos que comprenden a las edades de 20 alumnos de una
academia pre universitaria los datos son:
16, 16, 16, 16, 16, 16, 16, 16, 17, 16, 16, 16, 19, 18, 18, 18, 16, 17, 17, 17
ni
13
3
3
1
20
hi
0.65
0.15
0.15
0.005
1.00
%
65
15
15
5
100
Ni
13
16
19
20
Hi
0.65
0.80
0.95
1.00
%
65
80
95
100
xi ni
x = i=1
x =
x =16,6
c) Interprete los datos de la tabla de frecuencia.
13 alumnos tienen 16 aos
3 alumnos tienen 17 aos
3 alumnos tienen 18 aos
1 alumno tiene 19 aos
d) Cuando las edades estn ordenadas cual es el valor intermedio.
16 16 16 16 16 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19
Me=
20
=10
2
Me=
16+16
=16
2
Mo=16
PROPIEDADES
Las propiedades ms destacadas de esta medida son:
1 La suma de las desviaciones de los calores de la variable respecto a su
media es cero (Z) por ejemplo:
En la serie
4,4,6,7,7,9,8,4
x =
+ 4+ 6+7+7+ 9+8+ 4
=5.25
8
x =
( n1 a1 ) + ( n2a2 )
n
Donde:
x1 n1
x =k + i=1
x1
x =k + i=1
n
no hay n
Por ejemplo
Cul es la calificacin promedio de 3 pruebas que han obtenido 12, 13 y
15 sabiendo que el profesor les adiciono 3 puntos al promedio
n=3
k=3
x =3+
12+ 13+15
3
x =16.33
4)la media aritmtica de la suma de dos o ms variables es igual a la
suma de las medias de las variables.
MEDIANA (Me)
Es otro parmetro de frecuencia central que se encuentra situado en un punto
medio.
Para calcular la mediana es necesario ordenar las observaciones ascendente o
descendentemente.
Existen dos pares o dos tipos de observaciones cuando son pares e impares
Cuando la observacin es impar la mediana es el dato central
Ejemplo
8,2,5,3,4,6,2,7,9,11,13,6,9,2,8,4,16,17,10
2,2,2,3,4,4,5,5,6,7,8,9,9,10,11,13,16,17
Me=
19+ 1
=10
2
Me=6
30,26,25,28,46,50,83,75,48,60
25,26,28,30,46,48,50,60,75,83
Me=
46+ 48
=47
2
MODA (Mo)
0 P ( A ) =1
P ( A )+ P ( B ) + P ( C ) ..+ P ( n )=1
La probabilidad de un suceso imposible es cero.
Probabilidad a priori no necesita experimento.
Probabilidad emprica necesita experimento
Experimento: Es un conjunto de pruebas o la realizacin de un proceso para
obtener resultados. Ejemplo, el lanzamiento de una moneda para observar el
lado que aparezca tendr dos posibles resultados. Examinar las unidades
producidas por una mquina para detectar el nmero de unidades defectuosas.
Lanzar un dado al hacer esto tendr 6 posibles resultados.
Prueba: Es la relacin o realizacin de un acto, el conjunto de prueba
conforma un experimento, los datos del experimento se pueden obtener por
una observacin directa o por experimento controlada en el laboratorio.
Evento: resultados posibles que se pueden tener de un experimento.
Tamao muestral: total de eventos que se tiene dentro de un experimento.
Conjunto: agrupacin de elementos definidos por sus caractersticas
Ejemplo.
En el siguiente ejercicio determine el tamao muestral, experimento, evento y
probabilidad.
El lanzamiento de una moneda.
Experimento: lanzamiento de una moneda
Evento: cara, sello.
Espacio muestral:{c,s}
Probabilidad:(1/2) (1/2)
Experimento : Lanzar dos monedas
Evento: cara, sello; sello, cara
3
2
2
3
caras
caras y 1 cruz
cruces y 1 cara
cruces
C=cara; X=cruz
P {2 caras y 1 cruz }=
3
8
P=
3
8
d) 3 cruces
1
1 1 3 3
P= PT = + + + =1
8
8 8 8 8
Por la frmula:
P ( x )=N C x Px q N x
P {3 caras }=3 C3
1
2
33
1
2
( )( )
1
2
1
8
1
2
32
( )( )
3
8
P {3 caras }=
1
8
P {3 cruces }=3 C0
1
2
1
2
1
2
31
( )( )
3
8
1
1
=
2
8
( )( )
P(A o B) = PA + PB P(A y B)
lanzamiento de un dado
P(A)= (2 x 4 x 6) + (3 x 6 ) (3 x 4 )
P(A)= 48 +18 -12
{2,4,6,} {3 ,6 }
Experimento:
Evento:1,2,3,4,5,6
Espacio Muestral:
P(A)= 54%
54%
Probabilidad :
.
Cmo se calcula la probabilidad?
La probabilidad se calcula hallando el cociente entre los casos favorables al
suceso y todos los casos posibles, es decir que la probabilidad de A, es igual al
nmero de casos favorables sobre el nmero de casos posibles.
P ( A )=
N de casos favorables
N de casos posibles
DISTRIBUCION DE PROBABILIDADES:
Muestra los resultados esperados al realizar el experimento son los valores
posibles de una variable con sus respectivas probabilidades .
SE CLASIFICAN EN:
Variables Aleatorias Discretas y estas a su vez en el modelo de Bernauth, en el
modelo binomial de Poisson , multinominal,hipergeometricay exponencial.
Variable Aleatoria: Cuando los valores que toman estn determinados por
factores en los que intervienen al azar
Variable Aleatoria Discreta: Es aquella que puede tomar un valor cierto
nmero de valores, que se puede contar, dentro de esta est la distribucin
binomial.
1.- Existe un nmero fijo o constante n de pruebas repetidas.
2.- Cada una de las n pruebas da lugar a un acontecimiento favorable o
desfavorable uno de los dos debe presentarse.
3.- La probabilidad de esta es aquel acontecimiento que consideramos
favorables debe ser la misma en cada una de las pruebas por lo tanto P es
constante ( P nmero de xitos y el nmero de fracasos )
4.- Las pruebas son independientes
5.- No interesa determinar el nmero de xitos en las n pruebas por lo tanto la
distribucin binomial se puede escribir
P ( x )=
( nx ) p q
x
nx
Dnde:
n es el nmero de ensayos
x es el nmero de xitos
p es la probabilidad de xitos en un solo ensayo
q es la probabilidad de fracaso
n
son las conbinaciones posibles
x
Variable Aleatoria Continua:
Es aquella que puede asumir cualquier valor dentro de un determinado
intervalo, es decir comprende un nmero infinito de valores posibles
La distribucin normal se aplica la distribucin Gaussiana, se aplica en la
siguiente formula:
1
y=
1
e 2 ( xa ) / y
2
Ejemplo:
c,c,c
a) P(x=2) =
1
2
c,c,s
c,s,c
c,s,s
=(
n x nx
p q
x
=3*(25)*(0.5)
= 37.5 %
s,c,c
s,c,s
s,s,c
s
B) (Px=1) + (Px=2)
4
8 +
2
8
= 62.5 %
s,s,s
sucesos =8
<0.1
n = 800
e = 2.71
k
k!
96
P(x=5) = e
k=5
( 96 )8
5!
P(x)= X
(Y Yf )2
es igual al
mnimo que quiere decir que la suma de los cuadrados de las desviaciones de
un conjunto de nmeros que es mnimo, cuando este ltimo es la media
aritmtica de las primeras en donde
y es igual a b
+Na , la
X Y =b X 2 +a X
Y = (bX + a)
La segunda ecuacin
YX =bX2+aX
A=
Y b X
N
2
2
X
B=
N
N X Y ( X . Y )
CORRELACIN.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
edad
peso
15
60
30
75
18
67
80
100
pesos
80
60
40
20
0
0
20
40
60
edades
En
R
N
i 1
i 1
i 1
donde:
n xi y i xi * y i
2
n 2
n x xi n y i
i 1 i 1
i 1
n
2
i
X
Y = variable independiente
= coeficiente de correlacin
2
y
i 1
=
nmero
ordenados
de
pares
= variable independiente
Ejemplo:
X2
Y2
Edad (x)
Peso (y)
X* Y
15
60
225
3600
900
30
75
900
5625
2250
18
67
324
4489
1206
42
80
1764
6400
3360
28
60
784
3600
1680
19
65
361
4225
1235
31
92
961
8464
2852
n
n
n
n xi yi xi * yi
i 1
i 1
i 1
n 2 n
n 2 n 2
n xi xi n yi yi
i 1
i 1 i 1
i 1
Se
debe aclarar que el coeficiente de correlacin slo puede variar de la siguiente
1 r 1
manera:
y que para entenderlo mejor se debe obtener el
coeficiente de determinacin que se obtiene con r cuadrada, ya que
este representa el porcentaje que se explica y mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, esta
muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)2= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
Primero tendremos que pensar que se genera una matriz, ya que, ahora
estamos juntando dos tablas de distribucin de frecuencias y por ello nuestros
clculos sern ms laboriosos, por lo que les recomiendo el uso de una hoja de
calculo o al menos una calculadora con regresin para datos agrupados.
De cualquier forma aqu tambien estamos evaluando numricamente si existe
relacin entre dos variables y lo haremos con la siguiente ecuacin.
k
i 1
i 1
n f xi y i fx xi * fy y i
j 1 i 1
2
2
l
k
k
n fx x fx xi n fy y i fy y i
i 1
i 1
i 1
i 1
l
2
i
En
donde
podemos
encontrar k como el
nmero de clases para la
variable "y" y l para el
nmero de clases de "x".
Tambin podemos observar que hay varios tipos de "f" es decir, la que se
encuentra sola (sin subndice) que nos habla de las frecuencias celdares (cada
una de las frecuencias que se encuentran en la interseccin entre una columna
y un rengln) y las "f" con subndices que representan las frecuencias de cada
una de las variables.
i 1
i 1
n f x i y i f x x i * fy y i
j 1 i 1
2
2
2
k
k
n f x x i f x x i n fy y i fy y i
i 1
i 1
i 1
i 1
l
0.695
demanda
150
1698
100 2045
1348
50
1268
0
1000
47
15
100
120
1500
2000
1. INTRODUCCIN
Si sabemos que existe una relacin entre una variable denominada
dependiente y otras denominadas independientes (como por ejemplo las
existentes entre: la experiencia profesional de los trabajadores y sus
respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y
la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la
dependiente asuma mltiples valores para una combinacin de valores de las
independientes.
La dependencia a la que hacemos referencia es relacional matemtica y no
necesariamente de causalidad. As, para un mismo nmero de unidades
producidas, pueden existir niveles de costo, que varan empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en
los cuales se obtiene una nueva relacin pero de un tipo especial denominado
funcin, en la cual la variable independiente se asocia con un indicador de
tendencia central de la variable dependiente. Cabe recordar que en trminos
generales, una funcin es un tipo de relacin en la cual para cada valor de la
variable independiente le corresponde uno y slo un valor de la variable
dependiente.
2. ASPECTOS TERICOS
REGRESIN SIMPLE Y CORRELACIN
Yt = 1+2 X t + u t
quinta unidad
ANLISIS DE VARIANZA
En estadstica, el anlisis de la varianza, es una coleccin de modelos
estadsticos y sus procedimientos asociados, en el cual la varianza est
particionada en ciertos componentes debidos a diferentes variables
explicativas. El anlisis de la varianza parte de los conceptos de regresin
lineal. Puede ser visto como una generalizacin del test de Student.
En el modelo probabilista, cada modalidad corresponde a una muestra. Para
h=1, , k
(h )
, denotamos por: ( 1(h) , , x nh )
que modelan los datos del h-simo grupo, que se suponen independientes y
N (h , )
x(h)
(h)
V intra=
h=1
nh (h)
V
n
x(h)
nh
V inter =
h=1
Demostracin: Desarrollemos:
No existe efecto del primer factor, es decir, diferencias entre niveles del primer
factor (MSA/MSE)
Mtodo
II
14
13
15
16
14
Mtodo III
13
12
11
14
11
A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por
el nmero de observaciones:
Metd. I
Suma
Sum2/
n
77
1185,8
Metd. II
72
1036,8
Metd.
III
61
744,2
Total
210
2966,
8
Sum2/n
2940
Metd. I
Metd. II
Metd. III
225
196
169
256
169
144
196
225
121
225
256
196
289
196
121
1191
1042
751
2984
A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:
SC(total) = 2984 - 2940 = 44
(x i x )2
n1
sw2 =
Calcular la media de las varianzas de las medias mustrales utilizando la
formula
s x 2 =
n s x
Razn de F
s
F Prueba= w2
s x
Ejemplo :
Los pesos en kg de 1.7 se ilustran en la siguiente tabla
Hiptesis nula =
Hiptesis alternativa =
k-1 ; 4-1=3
K(n-1) ; 4(6-1)
FTabla =3.10
(x i x )2
sw2 =
s 12 + s22 +s 32 .+ s k 2
Calcular La Estimacin Intermediante
k
Calcular la media de las varianzas de las medias mustrales utilizando la
formula
s x
Razn de F
F Prueba=
sw 2
s x2
EJERCICIO:
SC B
PASO 1: Calculo de
( X 1)
n1
SC B = [
(767)
9
(819)
9
PASO 2: Calculo de
SC W =
X 2 [
= 200428 - [
= 671,778
(767)
9
( X 2)
n2
( X 3)
n3
(734)
9
]-
]-
(2320)
27
( X )
N
= 408,074
SC w
( X 1)
n1
(819)
9
( X 2)
n2
(734)
9
( X 3)
n3
+.+
+.+
( XK )
nk
( XK )
nk
( X )
N
SC T =X -
= 200428 -
= 1079,852
SC T
PASO 3: Calculo de
SC T =
SC W
( 2320 )
27
SC B
1079,852 = 1079,852
gl B = K-1 = 3-1 = 2
glW = N k = 27 3 = 24
glT
= N-1 = 27 1 = 26
PASO 5: Calculo de SB
SC B
gl B
SB =
PASO 6: Calculo de
SC W
gl W
408,074
2
SW =
PASO 7: Calculo de
Fobt
SB
SW
SW
671,778
24
= 204,037
= 27,991
Fobt
204,037
27,991
= 7,29
gl numerador = 2
Fcrit= 3,40
Ho
CHI-CUADRADA
Como ya se ha visto varias veces, los resultados obtenidos de muestras no
siempre concuerdan exactamente con los resultados tericos esperados, segn
las reglas de probabilidad. Por ejemplo, aunque consideraciones tericas
conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces una
moneda bien hecha, es raro que se obtengan exactamente estos resultados.
Se considera el problema general.
Definicin de X2
Una medida de la discrepancia existente entre las frecuencias observadas y
esperadas es suministrada por el estadstico X2, dado por:
=k1m
En donde:
K = nmero de clasificaciones en el problema.
Cara
Frecuencia
Observada
25
17
15
23
24
16
Solucin:
Ensayo de Hiptesis:
Ho; Las frecuencias observadas y esperadas son significativamente
iguales
H1; Las frecuencias observadas y esperadas son diferentes (dado
cargado).
Cara
Total
Frecuencia
Observada
25
17
15
23
24
16
120
Frecuencia
esperada
20
20
20
20
20
20
Regla de decisin:
Si X2R
Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una
significacin de 0.05 que el dado est bien hecho.
Justificacin y decisin:
Como 0.470 es menor que 11.3 no se rechaza H o y se concluye con un
nivel de significacin de 0.01 que la teora de Mendel es correcta.
Como el valor de 0.470 est cercano a cero, se procede a hacer un
ensayo unilateral izquierdo:
Ensayo de Hiptesis:
Regla de decisin:
Si X2R