Documente Academic
Documente Profesional
Documente Cultură
Trabajo De Investigación
CURSO: Estadística
CICLO: V
RESPONSABLE :
El presente trabajo se divide en dos partes, una de teoría y la otra es la aplicación del
curso.
PARTE TEORICA
Población y Muestra:
POBLACIÓN
Parámetros
Se denomina parámetro a una medida descriptiva que resume una característica definida
u a partir de losda-
en la población tal como la media ( ) o la varianza ( ) etc. Calculada
2
MUESTRA
Despues de definir la tarea o investigación estadística a realizar, se debe decidir entre in-
vestigar toda la población o sólo una parte de ella. El primer procedimiento es denomina-
do censo y el segundo se llama muestreo.
Definición.- Se denomina muestra a una parte de la población seleccionada de acuerdo
con un plan o una regla con el fin de obtener información acerca de la población de la cual
proviene.
La muestra debe ser seleccionada de manera que sea representativa de la población. Un
método de muestras representativas es al azar, esto es , cada elemento de la población tie-
ne la misma posibilidad de ser incluida en la muestra
Variable Estadística
Se denomina variable estadística a una característica definida en una población y que asu-
me por lo menos dos valores. Estos valores pueden ser de cualidad o de cantidad
Se Clasifican
A. De acuerdo a su Naturaleza
EJEMPLO:
Número de Ingenieros
Número de créditos
Variable Cuantitativa Discreta:
Número de Amigos
Número De Administrativos
Variable Cuantitativa
La Presión
La temperatura
El Tiempo
B. Según Su Medición
1. Variable Nominal: Se dice que los valores de una variable estadística está en el nivel de
Variable Cualitativa (1 y 2)
escala nominal si estos solo clasifican a las unidades estadísticas en iguales y diferentes.
2. Variable Ordinal: Se dice que los valores de una variable estadística están en el nivel de
escala ordinal si están en escala nominal y si además ordenan a las unidades estadísticas por
la característica definida que se observa.
Variable Cuantitativa (3 y 4)
3. Variable De Intervalo: Son aquellas variables que establecen categorías y la distancia
entre cada uno de los valores puede ser determinada con exactitud. No tienen un origen
común; no tienen un cero absoluto.
4. Variable De Razón: Son aquellas variables que establecen categorías de orden, distancia
y tienen un origen común, y sus valores se expresan como números reales.
PROPIEDADE S
Distribución De Frecuencias
f i
n
F1 f1
Simple (fi) F2 f1 f 2
Absoluta .........
Acumulada (Fi)
Fn f1 f 2 ........ f n
Frecuencia h i 1
H1 h1
Simple (hi) H 2 h1 h2
Relativas ........
Acumulada (Hi)
H n h1 h2 .......... hn
fi
hi
n
Simple (hi%) F
Porcentajes Hi i
Acumulado (Hi%) n
hi % 100 hi
Cuadros De Distribución De Frecuencias Para Variables Cualitativas
………
………
………
………
………
………
………
……
……
……
……
……
……
……
-Cuadro En Sí
-Fuente
CK fk Fk hk Hk hi% Hi%
Total n - 1 - 100
Gráfico De Barras:
Gráfico de Barras
6
5
4
3
2
1
0
Verde Celeste Verde Claro Amarillo
Gráfico De Sectores:
Gráfico De Sectores
14%
Verde
29% Celeste Si 360 hi
Verde Claro
36%
21% Amarillo
………
………
………
………
………
………
……
……
……
……
……
……
……
mK fk Fk hk Hk hi% Hi%
Total n - 1 - 100
Gráfico De Bastones:
Gráfico De Bastones
f i , hi , hi % 6
5
4
3
2
1
0
1 2 3 4 Yi
Gráfico de Escaleras
Fi , H i , H i % 35
30
25
20
15
10
5
0
1 2 3 4 5 Yi
Cuadros De Distribución De Frecuencias Para Variables Cuantitativas Continuas:
Cuando se trabaja con variables continuas se debe tener en cuenta los siguientes pasos
2. Número De Intervalos(m)
n Número De Datos
m 1 3.33 log( n)
3. Amplitud Intervalica(C)
R
C
m
Construcción De Intervalos:
…………
…………
…………
…………
…………
…………
…………
…………
…………
…………
…
Yi Marca De Clase
Yi ' 1 Yi '
Y '
Límite Inferior Yi
i 1 2
Yi ' Límite Superior
Histograma
f i , hi , hi %
16
14
12
10
8
6
4
2
0
296 346 396 446 496 546 596 646 696
f i , hi , hi % Poligono De Frecuencias
16
14
12
10
8
6
4
2
0
296 346 396 446 496 546 596 646 696
[Yi ' 1 , Yi '
Yi
Fi , H i , H i % Gráfico De La Ojiva
* Fi ,*H i ,*H i % 70
60
50
40
30
20
10
0
296 346 396 446 496 546 596 646
[Yi ' 1 , Yi '
Yi
Medidas De Tendencia Central
Son aquellos datos o valores que tienden a ocupar posiciones centrales o intermedias entre
el mayor y menor conjunto de datos, a partir de la cual se calculan los estadígrafos, brin-
dando alguna forma de investigación sobre el centro de la investigación, Los datos organi-
zados en una distribución de frecuencias destacan sus características más esenciales, como
marcas de clases, centro, forma de distribución (asimétrica, simétrica,) etc. Sin embargo,
los indicadores que describen a los datos en forma más precisa, deben calcularse. Estos
indicadores resumen los datos en medidas descriptivas que se refieren a la centralización o
posición, a la dispersión o variación, a la asimetría, y a la curtosis de los datos. Las medidas
de posición reflejan la tendencia central y la localización de los datos. Las medidas de ten-
dencia central, denominados también promedios, ubican el centro de los datos como la me-
dia aritmética, la media geométrica, la media armónica y la mediana. Las medidas de loca-
lización indican el lugar de los datos más frecuentes (Moda).
____
X
X i
n xi Valores Obserbados
n Número Total De Observaciones
1.2. Media Aritmética de Datos Agrupados yi Marca De Clase
f i Frecuencia Absoluta
____
X
y f
i i
yi hi
n
2. MEDIANA (Me)
La mediana o valor mediano de una serie de valores observados es el número Me que sepa-
ra a la serie de datos ordenados en forma creciente (o decreciente) en dos partes de igual
número de datos. La mediana es la medida promedio que depende del número de datos or-
denados y no de los valores de estos datos.
50% 50%
Me
2.1. Para datos No Agrupados: Se ordenan los datos en forma creciente o decreciente, se observa el
número de datos y se define si es par o impar.
Xn Xn
1
-Si es Par: Me 2 2
2
-Si es Impar: Me X n 1
2
n
Fi 1
Me Yi -' 1 C 2
fi
Se trabaja con datos menores a 20 esta puede ser: Unimodal (Una moda), Bimodal (2 Mo-
das), Multimodal (Mas de dos modas), Amodal (No existe Moda)
Los estadígrafos de dispersión miden la dispersión de los datos de la muestra. Tenemos las siguien-
tes Medidas:
R X máx X min
1. Rango
2. Varianza:
2.1Varianza Poblacional:
X u f X u
2 2
____ ____
2
x
i
, u X 2
x
i i
, u X
N N
f X u f X u
2
2 ____
____
, u X
2 i i
S 2
i i
, u X S
n 1
x
n 1
x
2 x2 S 2 S x2
5. Curtosis:
nn 1M 4 3M 2 M 4 n 1
K
n 1n 2n 3S 4
Covx, y
r
x y
1 r 1
1 ___ ___
Covx, y xy x y
n
Donde :
Covx, y Co var ianza de la var ianza x e y
x Desviación Es tan dar de la Variable " X "
y Desviación Es tan dar de la Variable "Y "
DIAGRAMAS DE DISPERSIÓN:
1 r 1
Regresión Lineal: Se llama análisis de regresión al análisis que trata de establecer la relación entre
las variables (relación funcional) de modo que podamos predecir el valor de una en base a otra.
Convencionalmente la variable o variables que son la base de la predicción se llama variable o va-
riables independientes y la variable que no se va a predecir se llama variable dependiente. Para cal-
cular tenemos la siguiente ecuación.
El parámetro "a" es el valor que toma la variable dependiente "y", cuando la variable inde-
pendiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.
La regresión lineal nos permite calcular el valor de estos dos parámetros, definiendo la rec-
ta que mejor se ajusta a esta nube de puntos
n xy x y
y a bx b __ __
n x x a y b x
2 2
Coeficiente de Correlación(r)
n xy x y
r r 0, Es una correlació n positiva
n x 2 x n y 2 y
2 2
r 0, Es una correlació n negativa
1 r 1 r 0, No hay correlació n
El coeficiente de Determinación: Esta denotado por el Cuadrado del coeficiente de correlación (r2)
PARTE APLICATIVA
POBLACIÓN
MUESTRA
Personalidad
Variable Cualitativa:
Vocación
Número de Ingenieros
Número de Camiones
Variable Cuantitativa Discreta:
Número de Tolvas
Número De Taladros
Variable Cuantitativa
Producción en TMF
Para Variables Cualitativas
La Empresa Minera Antamina Cuenta con Protocolo de Evaluación Psicológica el cual proporciona
un punto de discusión en relación al proceso de evaluación de contrato de personal en ese instante
se presentaron 20 personas las cuales demostraron tener distintas Virtudes: Tendencia a la introver-
sión, Cooperadores, alta tolerancia a la rutina, alta responsabilidad.
Introvertidos 4 0.20 20
Cooperadores 5 0.25 25
Total 20 1 100
fi
hi , n 20
n
f1 4
h1 0.20
n 20
f2 5
h2 0.25
n 20
f3 6
h3 0.30
n 20
f4 5
h4 0.25
n 20
h1 h2 h3 h4 1
hi % hi 100
h1 % h1 100 20%
h2 % h2 100 25%
h3 % h3 100 30%
h4 % h4 100 25%
h1 % h2 % h3 % h4 % 100%
Gráfica De Barras:
25% 20%
Introvertidos
Cooperadores
Alta tolerancia a la rutina
25%
Ata Responsabilidad
30%
En la Compañía Minera Antamina se mueve material roto por medio de máquinas ,la com-
pañía minera cuenta con una flota de 130 Camiones entre Komatsu y CAT de los cuales se
mantienen 120 en operación y 10 en stand By, además cuenta con 7 Palas Eléctricas entre
Bucyrus y P&H
fi hi % hi 100
hi , n 137
n h1 % h1 100 2.92%
f1 4 h2 % h2 100 2.19%
h1 0.029
n 137 h3 % h3 100 51.09%
f2 3
h2 0.022 h4 % h4 100 36.50%
n 137
f 3 70 h5 % h4 100 7.30%
h3 0.511
n 137
f 4 50 h1 % h2 % h3 % h4 % h5 % 100%
h4 0.365
n 137
f 5 10
h5 0.073
n 137
h1 h2 h3 h4 h5 1
Gráfico De Bastones
Tipo de Maquinas
80
70
Numero de Maquinas
60
50
40
30
20
10
0
1 2 3 4 5
Tipos De Maquinas
Tipo de Maquinas
160
Número Acumulado De Maquinas
140
120
100
80
60
40
20
0
0 1 2 3 4 5
Tipós De Maquina
El Valor Agregado bruto de la producción minera de Cu durante los últimos años se encuentra entre
60-90 TMF.
74 89 80 93 64 67 72 70
66 85 89 81 81 71 74 82
85 72 81 81 95 84 81 80
70 69 66 60 83 85 98 84
68 90 69 72 87 88
fi
hi , n 38
n hi % hi 100
f1 4
h1 0.105 h1 % h1 100 10.5%
n 38
h2 % h2 100 26.3%
f 2 10
h2 0.263 h3 % h3 100 10.5%
n 38
f3 4 h4 % h4 100 34.2%
h3 0.105 h5 % h4 100 13.2%
n 38
f 4 13 h6 % h4 100 5.3%
h4 0.342
n 38
h1 % h2 % h3 % h4 % h5 % 100%
f5 5
h5 0.132
n 38
f5 2
h6 0.053
n 38
h1 h2 h3 h4 h5 1
Gráfico Para Variables Cuantitativas Continúas
Poligono de Frecuencias
fi
14
12
10
8
6
4
2
0
63.5 70.5 77.5 84.5 91.5 98.5 Yi
fi
Gráfico del Histograma
14
12
10
8
6
4
2
0 Yi
63.5 70.5 77.5 84.5 91.5 98.5
Fi Ojiva(Menor que)
40
35
30
25
20
15
10
5
0
63.5 70.5 77.5 84.5 91.5 98.5 Yi
MEDIDAS DE TENDENCIA CENTRAL fi Yi Yi*fi
4 63.5 254
10 70.5 705
4 77.5 310
La Media: 13 84.5 1098.5
5 91.5 457.5
____
X
yi f i y i hi
3022
79.53
2 98.5 197
y
n 38
n 38 i f i 3022
La Mediana:
n
Fi 1
Me Yi '-1 C 2 74 7 17 14 79.25
fi 4
La Moda:
f i f i 1 13 4
M o Yi '-1 C 81 7 84.71
f i f i 1 f i f i 1 13 4 13 5
MEDIDAS DE DISPERSIÓN
1.Rango
R X máx X min 38
2. Varianza
f X u
2
95.18
2.57
2 i i
S
n 1
x
37
3. Desviación Estándar
S S x2
S 2.57
S 1.60
4. Coeficiente De Variación:
C.V . 100
u
1.60
C.V . 100 2.01%
79.53
5. Coeficiente de Asimetría:
____
3 X Me
3 79.53 79.25
Coeficiente de Pearson : As 0.53
S 1.60
6.Kurtosis
4
k
____
M
X i X
K 4 3 i 1 3 70.42
n n
S4 S4
El “Strip Ratio” de la Compañía Minera Antamina es de 2.36/1 (Es decir Hay 2.36 toneladas de
Material Estéril por Cada tonelada de Mineral), en cierta parte del yacimiento de pórfidos de cobre
se registraron los siguientes datos donde esta relación varía un poco:
Diagrama de Dispersión
40
30
20
10
0
0 5 10 15 20
2. Calcular:
El Coeficiente de Correlación
n xy x y
r
n x 2 x n y 2 y
2 2
r
6 1329.8 52 123.06
6 562 522 6 3147.31 123.062
El Coeficiente de Determinación ( r 2 )
La ecuación de Regresión
y a bx
n xy x y
__ __
b a y b x
n x x
2 2
y 0.05 2.36 x
3. ¿Cuál será la cantidad esperada de tonelada de estéril por 11 Tn de Mineral?
y 26.01
BIBLIOGRAFIA:
http://www.aulafacil.com/CursoEstadistica/ CursoEstadistica.htm
CONCLUSIONES: