Documente Academic
Documente Profesional
Documente Cultură
HISTORIA
Babilonia
Egipto
Hebreos
recopilar datos
Analizaban datos poblacin
al salir de Egipto
HISTORIA
China
Grecia
Roma
militares.
HISTORIA
Recuento de tierras pertenecientes
Edad media
Mtodo cientfico
Grandes
aportes
al
mtodo
cientfico, Leonardo Da Vinci,
Coprnico, Galileo, Descartes.
1662,
Capitn John
Gaunt
Laplace, Gauss
y Legendre
teora de errores y
mnimos cuadrados.
teora
de
DEFINICION
Tcnicas y procedimientos que permiten:
Recoger
Ordenar
Analizar
Presentar
De manera que a partir de ellos se puedan
inferir conclusiones.
POBLACION
Se utiliza para referirnos a un conjunto de
cosas, personas o situaciones, que tienen
alguna caracterstica comn que permite
agruparlos.
MUESTRA
Subconjunto de una determinada poblacin,
parte ms representativa.
EJERCICIO
Define si corresponde a poblacin o a muestra:
a)Las elecciones presidenciales.
b)Censo nacional.
c)El
salario de 20 empleados de una
multinacional.
d)Hacer una encuesta a 100 personas que
entraron a una tienda de las 896 que entraron a
dicha tienda en un da.
e)Hacer un estudio con todos los ancianos de un
Asilo.
VARIABLE
ESTADISTICA
Caracterstica de los
elementos de la poblacin que
se
investiga.
CUANTITATIVAS
CUALITATIVAS
Peso
Sexo
Edad
Sueldo
Estado civil
Color de ojos
Numero de hijos
Grado de instruccin
VENTAJAS DEL
MUESTREO
Ahorro de tiempo.
Reduccin de costos.
Posibilidad de una mayor
profundidad
exactitud de resultados.
Rapidez y operatividad de la informacin.
DESVENTAJAS DEL
MUESTREO
Dificultad de utilizacin de la tcnica
de
muestreo.
Una muestra mal seleccionada o sesgada
distorsiona los resultados.
Limitaciones propias del tipo de muestreo.
TIPOS DE MUESTREO
PROBABILISTICO
NO PROBABILISTICO
Muestreo aleatorio
Accidental.
simple.
Muestreo aleatorio
sistemtico.
Muestreo aleatorio
estratificado.
Muestreo aleatorio por
conglomerados.
Por cuotas.
Por conveniencia.
MUESTREO ALEATORIO
SIMPLE.
MUESTREO ALEATORIO
SISTEMTICO.
MUESTREO ALEATORIO
ESTRATIFICADO
MUESTREO ALEATORIO
POR CONGLOMERADOS
NO PROBABILISTICO
Escoge aquellos elementos
Accidental
Por conveniencia
Fijar cuotas, cada cuota
Por cuotas
consiste en un numero de
elementos
que
renen
ciertas condiciones.
DEFINICIONES
BASICAS
Media aritmtica = promedio
Varianza es una medida de dispersin.
Desviacin estndar es una medida
de
dispersin, es la raz cuadrada de la varianza,
es el promedio de la distancia de cada punto
con respecto a la media.
Marco muestral es el listado de los elementos
que pertenecen a la poblacin, de los cuales
se obtendr la muestra
FASES DE PROCESO DE
ESTADISTICA
TIPOS DE ESTADISTICA
ESTADSTICA
DESCRIPTIVA
Es
un
conjunto
de
procedimientos
que
tienen
por
objeto
presentar masas de datos
por medio de tablas,
grficos y/o medidas de
resumen. De acuerdo a lo
anterior, la estadstica
descriptiva es la primera
etapa a desarrollar en un
anlisis de informacin.
ESTADSTICA INFERENCIAL
Es
una
parte
de
laEstadsticaque
comprende los mtodos
y procedimientos para
deducir
propiedades
(hacer inferencias) de
una poblacin, a partir
de una pequea parte de
la misma (muestra).
VARIABLE
Son c/u de las caractersticas o cualidades que
ESTADISTICA
poseen los individuos de la poblacin.
TABLA DE
FRECUENCIAS
Una forma de presentar ordenadamente
un
grupo de observaciones, es a travs de tablas
de distribucin de frecuencias. La estructura
de estas tablas depende de la cantidad y tipo
de variables que se estn analizando, siendo
las ms simples las que se refieren a una
variable
EJEMPLO TABLA DE
Se tienen las notas de una prueba de matemtica
FRECUENCIA
enseanza media de un determinado colegio.
DISTRIBUCION DE
FRECUENCIAS
EJEMPLO
TABLA
DEFRECUENCIA
FRECUENCIA
FRECUENCIA
FRECUENCIA
FRECUENCIA
DATOS
xi
ni
ABSOLUTA
ACUMULUDA
Ni
1,2
1,4
1,6
1,8
2
2,2
2,4
2,6
2,8
3
3,2
3,4
3,6
3,8
4
4,2
4,4
4,6
4,8
5
5,2
5,4
5,6
5,8
6
6,2
6,4
6,6
6,8
7
1
2
3
8
18
14
19
22
25
26
27
31
35
38
45
46
48
52
58
60
56
54
51
50
46
44
40
32
31
18
1
3
6
14
32
46
65
87
112
138
165
196
231
269
314
360
408
460
518
578
634
688
739
789
835
879
919
951
982
1000
1000
ABSOLUTA
RELATIVA
fi
0,001
0,002
0,003
0,008
0,018
0,014
0,019
0,022
0,025
0,026
0,027
0,031
0,035
0,038
0,045
0,046
0,048
0,052
0,058
0,06
0,056
0,054
0,051
0,05
0,046
0,044
0,04
0,032
0,031
0,018
RELATIVA SUMATORIA
ACUMULADA
Fi
xi.n
0,001
0,003
0,006
0,014
0,032
0,046
0,065
0,087
0,112
0,138
0,165
0,196
0,231
0,269
0,314
0,36
0,408
0,46
0,518
0,578
0,634
0,688
0,739
0,789
0,835
0,879
0,919
0,951
0,982
1
1,2
2,8
4,8
14,4
36
30,8
45,6
57,2
70
78
86,4
105,4
126
144,4
180
193,2
211,2
239,2
278,4
300
291,2
291,6
285,6
290
276
272,8
256
211,2
210,8
126
4.716,20
xi.n
1,44
3,92
7,68
25,92
72,00
67,76
109,44
148,72
196,00
234,00
276,48
358,36
453,60
548,72
720,00
811,44
929,28
1.100,32
1.336,32
1.500,00
1.514,24
1.574,64
1.599,36
1.682,00
1.656,00
1.691,36
1.638,40
1.393,92
1.433,44
882,00
23.966,76
TIPOS DE GRAFICOS
El histograma:
Es
una
representacingrficade
unavariableen forma de barras, donde la
superficie de cada barra es proporcional a
lafrecuenciade los valores representados.
TIPOS DE GRAFICOS
El polgono de frecuencias:
TIPOS DE GRAFICOS
TIPOS
DE
GRAFICOS
Rojos
25
12,50%
Verde
36
18,00%
Azules
44
22,00%
Gris
85
42,50%
Blancos
10
5,00%
TOTAL
200
100,00%
MEDIDAS DE TENDENCIA
CENTRAL
Las medidas de tendencia central son valores
numricos que tienden a localizar la parte
central de un conjunto de datos.
Nos dan un centro de la distribucin de
frecuencias, es un valor que se puede tomar
como representativo de todos los datos. Hay
diferentes modos para definir el "centro" de
las observaciones en un conjunto de datos.
LA MEDIA ARITMTICA
Es la suma de los valores de todas las
observaciones divididas por el nmero total
de datos.
Donde
Xt : El valor de cada elemento de 1 hasta n
n : Cantidad total de datos
LA MEDIA ARITMTICA
Cuando se tiene una distribucin de
frecuencias el promedio se calcula por:
MEDIANA
Se define como el
MEDIANA
MODA
UNIMODAL
BIMODAL
MULTIMODAL
MEDIDAS DE
Las medidas de dispersin indican la mayor o
DISPERSIN
menor concentracin de los datos con
respecto a las medidas de centralizacin.
Mayor
dispersin
Menor
dispersin
DESVIACIN
ESTNDAR
Tambin llamada desviacin
tpica, es una
medida de dispersin usada en estadstica
que nos dice cunto tienden a alejarse los
valores puntuales del promedio en una
distribucin. Especficamente, la desviacin
estndar es "el promedio de la distancia de
cada punto respecto del promedio".
DESVIACIN
ESTNDAR Dado
La
frmula
para
calcular la desviacin
estndar es:
VARIANZA
La varianza (que es el cuadrado de la
desviacin estndar:2) se define as:
Es la media de las diferencias con la
mediaelevadas al cuadrado.
PROCEDIENDO PARA
ESTIMAR EL TAMAO DE
1. Identificar si se trata de una poblacin infinita
o finita.
MUESTRA
2. Se determina la desviacin estndar.
3. Se define el nivel de confianza Z, utilizando la
TIPO DE POBLACION
Poblacin finita
Cuando el nmero de
elementos que la forman
es finito, por ejemplo el
nmero de alumnos de
un centro de enseanza,
o grupo clase.
Poblacin infinita
Cuando el nmero de
elementos que la forman
es infinito, o tan grande
que pudiesen considerarse
infinitos.
Como
por
ejemplo si se realizarse un
estudio
sobre
los
productos que hay en el
mercado. Hay tantos y de
tantas calidades que esta
poblacin
podra
considerarse infinita.
Poblacin infinita
Ejemplo: A cuantas personas tendramos que
estudiar para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin
esperada = asumamos que puede ser prxima al
5%; si no tuvisemos ninguna idea de dicha
proporcin utilizaramos el valor p = 0,5 (50%) que
maximiza el tamao muestral:
donde:
Za 2 = 1.962 (ya que la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)
Poblacin finita
donde:
N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% =
0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
EJERCICIO
El dueo de un almacn quiere saber a que edad
especifica puede enfocar su estrategia para captar
mas clientes, toma la edad de 10 de sus clientes
quienes son representativos de la totalidad de sus
clientes y las edades son: 25, 30, 45, 50, 27, 32, 33,
35, 25, 37.
a)Se desea conocer la media aritmtica, mediana,
moda, varianza y desviacin estndar.
b)Adems se requiere una tabla de frecuencias, un
histograma y un grafico circular donde se presenten
las edades en intervalos de 10 aos, adems de los
datos solicitados en el punto anterior.
c)Al realizar los anteriores anlisis, que se concluye?.
TIPOS
DE
GRAFICOS
Diagrama de Pareto:
Es una grfica para organizar datos de forma que
estos queden en orden descendente, de izquierda a
derecha y separados por barras. Permite, pues,
asignar un orden de prioridades.
CAUSA FRECUENCIA
FRECUENCIA
RELATIVA
ACUMULADA
causa 1
causa 2
causa 3
causa 4
causa 5
causa 6
causa 7
causa 8
causa 9
250
200
180
140
46
41
40
38
31
23,97%
43,14%
60,40%
73,83%
78,24%
82,17%
86,00%
89,65%
92,62%
causa
10
27
95,21%
causa
11
25
97,60%
causa
12
25
100,00%