Documente Academic
Documente Profesional
Documente Cultură
1.- INTRODUCCIN.
1.a. DEFINICIN DE ESTADSTICA:
Rama de las matemticas que se encarga del estudio de series de datos
mediante su coleccin, organizacin, presentacin y anlisis de resultados,
tanto para la toma de decisiones como para la deduccin de concusiones
(Inferencia estadstica), permitiendo evaluar la incertidumbre de inferencias
inductivas, de acuerdo al estudio realizado.
La estadstica ayuda a todas las dems ciencias a generar modelos
matemticos generales donde se haya considerado el componente aleatorio.
-Coleccin de datos
-Organizacin de datos
-Anlisis de datos
-Presentacin de datos.
C
O
A
P
Clasificacin de la Estadstica
Estadstica INFERENCIAL
Casual
-No Probabilsticas o Finalistas
Intencional
Por Cuotas
TIPOS DE MUESTRAS:
Simple al Azar
-Probabilsticas
Sistemtica
Estratificada
Proporcional
No Proporcional
Por Conglomerados
igual.
MP-POR CONGLOMERADO: Se usa cuando el universo a
estudiar esta muy
Disperso geogrficamente y se usan conglomerados de
grupos formados.
>> fin material consultado fuera de clase<<
2.- DEFINICIN DE CONCEPTOS
2.a. Poblacin
Conjunto de seres vivos o de objetos que poseen alguna caracterstica en
comn que defina al grupo. (Los animales de una misma raza, Los estudiantes
de la FAZ)
*Es un conjunto de medidas o es el conjunto completo de individuos, objetos o
medidas que poseen alguna caracterstica comn observable.
EJEMPLO:
POBLACIN
PROBABILSTICA
MUESTRA
ESTRATIFICADA
MUESTRA
SISTEMTICA
**CARACTERSTICAS DE LA MUESTRA>
>Representativa (debe de ser sacada de grupos distintos o clases en que se
divide la poblacin investigada.
>Que tenga el tamao idneo (Que sea representativa/ el investigador
determian el tamao).
>Que intervenga el AZAR (Que todas las pruebas tengan la misma posibilidad
de ser sacardas).
ESCALA DE MEDICIN:
NOMINAL
ORDINAL
ESCALA DE MEDICIN
DE INTERVALOS
DE RAZONES
ESCALA NOMINAL:
Se utilizan como medidas de identidad. Los nmeros sirven de
indicativos para indicar objetos o clases Ejemplo: Las personas se
pueden clasificar acorde a su sexo, raza, color de piel, color de cabello,
su religin, etc.
ESCALA ORDINAL:
Es donde los nmeros reflejan la orden de objetos o la Jerarqua de
individuos u objetos. Estas medidas se disponen desde la ms alta a la
ms baja o viceversa. Las medidas ordinales revelan que persona u
objeto es de mayor o menor talla. O si es ms duro o suave.
ESCALA DE INTERVALOS:
CUALITATIVAS
VARIABLES CUALITATIVAS:
Es una caracterstica que se le mide a un elemento
expresar en CALIDAD O CUALIDAD.
y se tiene que
ORDINALES.
NOMINAL.
Variable Cualitativa DICOTMICA:
Son las variables con dos valores posibles ( Si NO).
Variable Cualitativa POLITMICA:
Son las variables con tres o ms valores posibles.
Variable Cualitativa ORDINALES:
Son las Variables que pueden tomar distintos valores
ordenados, siguiendo una escala establecida, que no es
necesario que el intervalo sea establecido.
Ejemplo: Status Soltero, Casado, Viudo, Divorciado.
Reprobado, aprobado, notable, excelente.
Leve, moderado o Grave.
Deporte: oro, plata , bronce.
Continuas y
CONTINUAS.
Variables Cuantitativas
DISCRETAS.
Variable Cuantitativa CONTINUA:
Es aquella sin interrupciones o separaciones, se contabiliza
con fracciones.
Se dan cuando los
valores numricos que forman la
variable en un intervalo cualquiera son infinitos.
*es una variable que puede tomar cualquier valor de una
escala(toma fracciones ).
Ejemplo: el peso de una persona, la altura de una persona,
el tiempo, la velocidad de un caballo.
Variable Cuantitativa DISCRETAS:
Tiene interrupcin o separacin en su intervalo o escala de
valores (NO TOMA VALORES FRACCIONARIOS).
Es la variable cuyos valores numricos se pueden contar o
son finitos en un intervalo cualquiera.
Ejemplo: El nmero de hijos que puede tener una pareja.(se
contabiliza enteros).
El nmero de personas que puede morir en un autobs que
lleva 45 personas.
Varianza
Medidas de dispersin
Coeficiente
de
11
Histogramas
(columna,barras, 3d)
Mtodo Grfico
Grficas de lneas
Figura de pastel
Figura de burbujas
no
agrupados)
(MUU).
Simbolo
Formula
X1+X2+X3+X4+X5+X6.......
X=
----------------------------N
X=
4+7+7+2+5+3
-------------------
25
X= -------- =
13
Formula
PROBLEMA EJEMPLO:
Un estudiante realiza 3 exmenes, el 1ro lo hizo en 01 hora, el 2do y el 3ro en hr, se
le atribuye ponderacin en 1,2,3, y las calificaciones respectivamente son 5,8, y 7
respectivamente.
Xi
ni
5
8
7
wi
1
1
1
3
xiwi
1
2
3
N=6
5
16
21
42
Xi = 5,8, y 7
2.-Ponderacin Wi=1,2,3 * este valor lo indica la descripcin del problema.
3.-Veces que se realizo la observacin ni=
1.-Observaciones
Xi
5
8
7
ni
1
1
1
3
wi
1
2
3
N=6
Xi *Wi
xiwi
(5*1)
(8*2)16
(7*3)21
(1+16+21)42
14
Xw=
Suma (5*1*1)+(8*1*2*1)+(7*3*1)
Suma (1+2+3)
Xw=
5+16+21
6
Xw= 42
6
Xw= 7
Suele usarse cuando los valores de una variable siguen una progresin
geomtrica, para promediar porcentajes, tazas, ndices.
Ejemplo:
Xi
ni
Log Xi
nilogX1
15
100
120
125
140
10
5
4
3
Suma n=22
2
2.0791
2.0969
2.1461
(2*10)=
(2.0791*5)=
(2.0969*4)=
(2.1461*3)=
Sumatoria
20
10.3955
8.3876
6.4383
45.2214
Xi=Nmero de observaciones
ni= Nmero de repeticiones
Smbolo
Formula
Sustituyendo la formula:
G= antilog 45.2214
22
G=antilog 2.0555
G= 113.63
Pasos:
1.-Anotar Xi
2.-Anotar ni
3.-Sacar el Log de xi
4.-Multiplicar ni *Log Xi
5.-sustituir formula
6.-Sacar anti logaritmo
Media Armnica: (para datos no agrupados)
Es la inversa de la media aritmtica, Se utiliza para promediar velocidades,
tiempos, rendimientos.
Ejemplo:
Xi
100
120
125
140
ni
ni/Xi
10
5
4
3
0.1
0.042
0.032
0.021
16
Sumatoria n=22
Sumatoria 0.196
Formula:
H=
n
Sumat
H=
ni + n2 + n3+ n4
Xi
X2 X3 X4
22
Sumat (0.01+0.042+0.032+0.021)
H= 112.82
DATOS AGRUPADOS
Cuando no es posible obtener la media aritmtica, porque los datos de las
observaciones se presentan agrupados en una tabla de frecuencias
desconociendo los valores individuales de la variable.
MEDIA ARITMTICA: (datos agrupados)
Smbolo
Se determina obteniendo la sumatoria del producto de la media de cada
intervalo de clase por su frecuencia, y el resultado se divide entre sumatoria de
las frecuencias.
17
Simbolo
Formula:
Xi fi
------------
= Media Aritmtica
Xi = Observaciones
n =Nmero total de observaciones
fi = Frecuencia.
= Sumatoria
Datos:
25,12,19,23,28,30,19,9,20,35,27,10,24,24,16,16,18,35,18,17,21,36,17,36,20,1
2,20,21,18,36,18,24,6,24,24,16,10,24,24,35,7,8,7,36,18,
Ejemplo :
Tons/ha
0 10
10 20
20 30
30 - 40
M*
f*m
fm
7
17
14
7
45
5
15
25
35
(7*5)
(17*15)
(14*25)
(7*35)
35
255
350
245
885
885
45
= 19.66
------------------------------------
Mo
18
Formula
Mo = L+(/+)W
M*
f*m
fm
7
17
14
7
45
5
15
25
35
(7*5)
(17*15)
(14*25)
(7*35)
35
255
350
245
885
Mo = L+(/+)W
Sustituyendo la formula:
La clase que tiene ms alta frecuencia es la de 10 20 ( 17 datos), y limite
inferior es 10, y 17 el limite superior.
Mo = 10+(/+)W
= Diferencia entre la frecuencia ms alta y la anterior ( 17 7) = 10
= Diferencia entre la frecuencia ms alta y la posterior (17 14) = 3
Mo = 10+(17-7/10+3)W
W= Intervalo de clase.( numero de valores distintos dentro de los lmites del 0
al 10 = 10
Mo
Mo
Mo
Mo
Mo
=
=
=
=
=
10+(17-7/10+3)10
10+(10/13)10
10+(0.76)10
10+7.6
17.6
19
Me Md
Formula:
Me=Mediana
Li=Limite
n=Nmero total de observaciones
Ni=Frecuencia absoluta ms alta.
ai= Valor de intervalo de clase.
Li= Limite inferior de la clase con ms alta frecuencia.
Li-1, Li
20,25
i
100
i
100
25,30
150
250
30,35
200
450
35,40
180
630
40,45
41
671
n 671
la siguiente frecuencia.
ni
Ni
20,25
100
100
25,30
150
250
30,35
200
450
35,40
180
630
40,45
41
671
n 671
Li-1, Li
20,25
i
100
i
100
25,30
150
250
30,35
200
450
35,40
180
630
40,45
41
671
n 671
21
Sustituyendo formula:
Mtodo Numrico
Med.
Dispersin absoluta
RANGO
DESVIACIN ESTNDAR*
VARIANZA *
COEFCIENTE DE VARIACIN
Formula
d= Xi X
Cinco nios de las edades 2,3,5,7,8 aos, que tienen os siguientes pesos
14,20,32,42,44 kgs
d=2-5
EJEMPLO
1 35
8
2 36
9
3 36
3
4 35
d= -3
d=7-5
d=2
(d)= Xi - X
3.83
23
8
5 33
6
6 34
1
Smbolo
Frmula
Datos
observados
1
2
3
4
5
6
Valor
Absoluto
d
358
3.83
3.83
369
14.85
14.85
363
8.83
8.83
358
3.83
3.83
336
-18.17
18.17
341
-13.17
13.17
62.66
Si algn valor sale negativo de la resta de (Xi X), se toman siempre
como valores positivos.
24
VARIANZA:
Es la suma de los cuadrados de los desvos (d).
Smbolo
N=
Frmula
Nmero de observaciones.
1
2
3
4
5
6
Datos
observados
358
369
363
358
336
341
3.83
14.85
8.83
3.83
-18.17
-13.17
Valor
Absoluto
3.83
14.85
8.83
3.83
18.17
13.17
62.66
Desvio
Cuadrados
14.66
219.92
77.96
14.66
330.14
173.44
830.78
Desviacin Estndar:
Es la raz cuadrada de la varianza
Smbolo
Formula
Sustituyendo valores
25
Smbolo
C.V.
Frmula
Sustituyendo
Deviacin Media:
Smbolo Dm
Formula Dm= f ( X1-X)
N
Varianza:
Simbolo
S = f
( X1-X)
N
Desviacin Estandard:
26
Simbolo
S
S=
Formula
Coeficiente de Variacin
Simbolo
C.V.
Formula
Para poder obtener el coeficiente de variacin hay que
trabajar primero la Varianza, seguida por Desviacin estndar y el desvio .
Datos
resistencia
observados
1
2
3
4
5
6
358
369
363
358
336
341
Valor Absoluto
3.83
14.85
8.83
3.83
-18.17
-13.17
3.83
14.85
8.83
3.83
18.17
13.17
62.66
Desvio
Cuadrados
14.66
219.92
77.96
14.66
330.14
173.44
830.78
X = 354.71
S= s
27
S=(830.78)
6
S=
138.47
S=
sustituyendo
CV
dando
ANLISIS GRAFICO
Es la 3ra etapa de la estadstica, que es la presentacin de datos.
ANLISIS BIVARIADO
Estudio que se centra en estudiar 2 variables.
28
Correlacin lneal
Es un anlisis estadstico y este puede ser positivo (+) o negativo (--).
La hay de dos tipos:
Puede ser simple (X,Y)
Puede ser multiple
Siempre hay que construir un diagrama de dispersin.
r=+1
Cuando la variables tienden a crecer ( Y aumenta).
r=-1
Cuando la variables tienden a disminuir ( Y dismuye).
Existen algunos casos como los siguientes:
29
Formula:
Ejemplo:
X
kilogramos
Y
produccin
XY
Y
30
N
4
6
10
14
18
20
72
2
6
14
22
30
34
108
8
36
140
308
540
680
1712
16
36
100
196
324
400
1072
4
36
196
484
900
1156
2776
Sustituyendo la formula
Un segundo ejemplo:
31
32
MODELOS DE DISTRIBUCIN DE
PROBABILIDADES
Distribucin normal
Se usa para variables continuas (peso, calificaciones, valores fracciones,
valores enteros).
Simbolo
Formula.
Z= Xi -
Z=Distribucin normal
Xi=
Ejemplo:
Se tienen 1000 rboles de durazno y la es de 27 Kgs, una desviacin
estndar de 4 kg sabiendo que es una produccin variable continua y por lo
tanto se distribuye normalmente, encuentre lo siguiente:
a)Cuantos arboles entre 13 y 15 kilogramos y su porcentaje
b)Cuantos arboles producen entre 20 y 30 kilogramos y su porcentaje
c)Cuantos arboles producen arriba de 35 kilogramos y su porcentaje
Xi
13 -- 15
27 es
33
20 -- 30
4
desv
poblacional
estand
> 35
Xi= Observaciones
=
27 (dato proporcionado)
Z= Xi -
Z= 13- 27
4
z= -3.5
Z= 15- 27
4
z= -3
Z= 20- 27
4
z= -1.75
Z= 30- 27
4
z= 0.75
Z= 35- 27
4
z= 2
35
Z= 13- 27
4
z= 0.4998
Z= 15- 27
4
z= -0.4987
Z= 20- 27
4
z= 0.4599
Z= 30- 27
4
z= 0.2734
Z= 35- 27
4
z= 0.4772
Siguiente paso:
0.4998 (Valor Z de la tabla correspondiente a limite de los 13
kilos) --3.5
-- 0.4987 (Valor Z de la tabla correspondiente a limite de los 15
kilos) 3.0
0.0011
Se multiplica por 1000 arboles ( Poblacin arboles) ,para sacar el porcentaje , que en
este caso el (0.0011*1000= da cantidad de arboles) (0.0011*100= % de la poblacin)
1.1 arboles los que estn produciendo entre 13 y 15 kilos
.11 % de la poblacin de de arboles que estn entre 13 y 15 kilogramos de produccin.
0.4599
kilos)-1.75
+ 0.2734
kilos) 0.75
0.7333
Se multiplica por 1000 arboles (Poblacin arboles) ,para sacar el porcentaje , que en
este caso el
(0.7333*1000= da la cantidad de arboles ) (0.7333 *100= % de la poblacin )
733.3 rboles los que estn produciendo entre 13 y 15 kilos
73.3 % de la poblacin de de arboles que estn entre 20 y 30 kilogramos de
produccin.
36
kilogramos de
Graficando en la curva.
Hasta el 22-03-2012
** ++
Prueba t t de student.
Este tipo de estadstico se usa para muestras menores de 30 observaciones, y
se comparan las poblaciones mediante pruebas de hiptesis.
Ho= Hiptesis nula: Es un supuesto que se enuncia con la intencin de ser
rechazada.
Ha= Hiptesis alterna: Es lo opuesto a la hiptesis nula, es importante por 2
razones (Define la direccin de la zona de rechazo, dependiendo del enunciado
la [ Ha se divide en Ha de una cola ][Ha de dos colas].
Hiptesis: Es una suposicin o supuesto a verificar en una poblacin.
La Ha (Hiptesis alterna) Define la direccin de la zona de rechazo ( ,
glibertad)
= nivel de significancia ( los ms usados 0.05, 0.01)
37
gl
Smbolo
Formula
= media poblacional
s = Desviacin estndar
n = Nmero total de observaciones
= 11.9
son las siguientes:
n=
10 observaciones
Ho= LR < 12 cm
*Ha=LR>= 12
cm
S=
= 12 (lamina riego)
38
Sustituyendo en la formula
Donde gl = 9
Buscar en la Tabla F Distribucin
39
Se grafica asi:
40
cm
Resumen ( Hiptesis):
Las Hiptesis pueden ser Negativas(-) Positivas(+)
1.- Ho = T1 < T2
Vs
Ha= T1>= T2
2.-Ho = T1 > T2
Vs
Ha = T1 =< T2
3.-Ho = T1 = T2
Vs
Ha = T1 = T2
ZONA DE RECHAZO:
Simbolo Z
Frmula
Ejemplo:
El gerente de la tienda quiere conocer quines de sus vendedores atienden a
mas de 15 clientes por semana, y selecciono a un grupo de 36 vendedores y us
una muestra de 17 prospectos, con una varianza de 9
= 17
n = 36
S= 3
= 15
s= 9
gl = (n -1) 35
Sustituyendo formulas:
t
42
SIMBOLO
Frmula
= + Xi
Ejemplo:
X(PO)
Y
(Rendimiento)
0
10
20
30
40
50
60
70
80
90
100
6.4
6.8
7.0
5.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
44
XY
1
2
3
4
5
6
7
8
9
10
11
SUMAS
0
10
20
30
40
50
60
70
80
90
100
550
6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85
0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500
0
68
140
225
296
385
486
588
656
774
890
4508
40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26
ECUACIONES ESTIMADORES:
45
46
= yee predicha
Usando los valores ahora conocidos
= 0.02345
= 6.5547
47
XY
1
2
3
4
5
6
7
8
9
10
11
SUMAS
0
10
20
30
40
50
60
70
80
90
100
550
6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85
0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500
0
68
140
225
296
385
486
588
656
774
890
4508
40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26
6.57
6.78
7.02
7.25
7.49
7.72
7.96
8.19
8.43
8.66
8.89
La grafica es la siguiente:
48
ANLISIS DE VARIANZA:
Tambin conocida como ANDEVA
Es una herramienta estadstica
Se prueban hiptesis
F.V.
Regresio
n
MODELO
G.L
.
S.C.
C.M.
F (c )
F(tablas)
ERROR
n-2
TOTALES
n-1
SCTotal
SCR
--
XY
1
2
3
4
5
6
7
8
9
10
11
SUMAS
0
10
20
30
40
50
60
70
80
90
100
550
6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85
0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500
0
68
140
225
296
385
486
588
656
774
890
4508
40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26
6.57
6.78
7.02
7.25
7.49
7.72
7.96
8.19
8.43
8.66
8.89
Sustituyendo MODELO
COEFICIENTE DE DETERMINACIN
Es una medida descriptiva del grado de asociacin entre las variables X,
Y, asi se calcula.
Simbolo
Formula
R=
SC REGRESION/SC TOTAL
50