Documente Academic
Documente Profesional
Documente Cultură
Qu es la estadstica?
Objetivos
Que deberan saber al terminar esta clase:
Que queremos significar por estadstica Que entendemos por estadstica descriptiva e inferencial. Que es una poblacin y que una muestra.
Tema 1. Qu es la estadstica?
Estadstica es la ciencia de: Recolectar Describir Organizar Interpretar para transformarlos en informacin, para la toma mas eficiente de decisiones.
Definicin de Estadstica
La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Tipos de Estadstica
Estadstica Descriptiva: Mtodo de recolectar, organizar, resumir y presentar los datos en forma informativa. Ejemplo 1: Los datos del Censo de poblacin de 2001. Ejemplo 2: La cantidad de robos ocurridos el ltimo mes en el municipio. Ejemplo 3: La cantidad de pacientes atendidos en el Hospital municipal el ltimo ao.
Tipos de Estadstica
Estadstica inferencial: Mtodos usados para determinar algo acerca de la poblacin, basado en una muestra. Poblacin(1) es la coleccin, o conjunto, de individuos, objetos o eventos cuyas propiedades sern analizadas. Muestra es un subconjunto de la poblacin de inters.
(1) Algunos autores utilizan Universo como sinnimo
Poblacin y Muestra
Poblacin
Muestra
Conceptos de Estadstica
Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.
Muestra Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.
Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Parmetro y Estadstica
Parmetro: Valor numrico que resume todos los datos de una poblacin completa. Se utilizan letras griegas para simbolizar un parmetro como ser y . Ejemplos: La calificacin promedio del secundario en el momento de admisin de todos los estudiantes que han asistido alguna vez al SENA o la proporcin de estudiantes cuyo lugar de origen era distinto del partido del Guaviare.
Parmetro y Estadstica
Estadstica: Valor numrico que resume datos de una muestra. Se utilizan letras alfabeto espaol para simbolizarlas como xys. Ejemplo: La edad promedio registrada una encuesta de 150 consumidores cachama. los del ser en de
Variable estadstica
Variable: Caracterstica de inters sobre cada elemento individual de una poblacin o muestra. Dato: Valor de la variable asociada a un elemento de la poblacin o muestra. Este valor puede ser un nmero, una palabra o un smbolo.
Ejemplo: La familia Gonzlez tiene 4 miembros, sus ingresos mensuales son de $685, 2 son de sexo femenino y 2 masculino.
Variable (cont.)
Datos: Conjunto de valores recolectados para la variable de cada uno de los elementos que pertenecen a la poblacin o muestra.
Ejemplo1: El conjunto de 54 cantidad de miembros recolectados de 54 familias residentes en Escobar. Ejemplo2: El conjunto de las calificaciones de los 43 estudiantes de estadstica de la carrera de Sistemas
Tipos de Variables
Cualitativa o de Atributos Clasifica o describe un elemento de la poblacin. Los valores que puede asumir no constituyen un espacio mtrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, no son significativas.
Ejemplos: Sexo, Nacionalidad, Marcas de auto, Grado de Satisfaccin con la Universidad, etc..
Tipos de Variables(cont.)
Cuantitativa o Numrica Cuantifica un elemento de la poblacin. Los valores que puede asumir constituyen un espacio mtrico, por lo tanto las operaciones aritmticas, como sumar y obtener promedios, son significativas.
Ejemplos: Cantidad de Habitaciones, Nmero de hijos, Kilmetros recorridos, Tiempo de vuelo, Ingreso, etc..
Tipos de Variables(cont.)
Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas. Cuantitativas Discretas: solo pueden asumir ciertos valores y normalmente hay huecos entre ellos. Son conteos normalmente.
Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......) Ejemplo2: cantidad de hijos (1, 2, 3,4...)
Tipos de Variables(cont.)
Cuantitativas Continuas: puede asumir cualquier valor dentro del rango de medicin. Normalmente se miden magnitudes como ser longitud, superficie, volumen, peso, tiempo, dinero
Ejemplo 1: Peso al nacer. Ejemplo 2: Salario de un empleado Ejemplo 3: Tiempo de viaje en bus entre Villavicencio y San Jos.
Escalas de Medicin
Las variables cualitativas se miden en escala nominal o ordinal. Nominal: los elementos solo pueden ser clasificados en categoras pero no se da un orden o jerarqua
Ejemplo 1: Barrio de residencia de los alumnos . Ejemplo 2: Color de ojos Ejemplo 3: Simpatizante de un club de futbol
Escalas de Medicin
Ordinal: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores no se pueden realizar o no son significativas.
Ejemplo 1: Grado de satisfaccin en el uso de un servicio pblico . Ejemplo 2: Ocupacin
Escalas de Medicin
Las variables cuantitativas se miden en escala de intervalo o razn. Intervalo: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores se pueden realizar y son significativas. La diferencia entre dos valores consecutivos es de tamao constante y no existe el 0 absoluto.
Ejemplo: Temperatura en grados Celsius
Escalas de Medicin
Las variables cuantitativas se miden en escala de intervalo o razn. Razn: los elementos son clasificados en categoras que tienen un orden o jerarqua, la diferencia entre valores se pueden realizar y son significativas. Existe el 0 absoluto, es decir la ausencia de la variable medida.
Ejemplo 1: Tiempo de vuelo. Ejemplo 2: Ingresos familiares
Cualitativa o Atributo
Cuantitativa o Nmerica
Escala de medicin
Escala de medicin
Nominal Ordinal
Intervalo Razn
Discreta Continua
Tipos de frecuencias
Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.
Tipos de frecuencias
Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Frecuencia relativa acumulada La frecuencia relativa acumulada es el suma de las frecuencias relativas de todos los valores inferiores o iguales al valor considerado. Se puede expresar en tantos por ciento. Se representa por Ni.
Ejemplo 1. Distribucin de frecuencias para datos no agrupados Durante el mes de abril, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. Este tipo de tablas de frecuencias se utiliza con variables discretas.
xi 27 28 29 30
fi 1 2 6 7
Fi 1 3 9 16
31
32 33
8
3 3
24
27 30
0.258
0.097 0.097
0.774
0.871 0.968
34
1
31
31
0.032
1
xi 1 2 3 4 5 6
fi 4 4
Fi
ni 0.08
Ni
16 7 5 28 38
0.16 0.14
7
8
45
Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Se representa por Ci
fi 1 1 3
Fi 1 2 5
[15, 20)
[20, 25) [25, 30)
17.5
22.5 27.5
3
3 6
8
11 17
0.075=7,5%
0.075=7,5% 0.150=15%
0.200=20%
0.275=27,5% 0.425=42,5%
[30, 35)
[35, 40) [40, 45)
32.5
37.5 42.5
7
10 4
24
34 38
0.175=17,5%
0.250=25% 0.100=10%
0.600=60%
0.850=85% 0.950=95%
[45, 50)
47.5
2
40
40
0.050=5%
1=100%
1=100%
Diagrama de barras
DIAGRAMA DE BARRAS
GRUPO SANGUINEO
A B AB O TOTAL
fi 6 4 1 9 20
PORCENTA JE
NUMERO DE PERSONAS
9 8 7 6 6 5 4 3 2 1 0 1 4
30% A
20% B
5% AB
45% O
TIPO DE SANGRE
Polgonos de frecuencias
16
HORA
6
TEMPERATURA
7
TEMPERATURA
14 12 10 8 TEMPERATURA 6 4
9
12
12
14
15
18
11
12
2 0 0 5 10 15 HORA 20 25 30
21
24
10
8
Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 juegan al ftbol y el resto no practica ningn deporte.
Diagrama de sectores
PORCENTAJ ALUMNOS ANGULO E
DIAGRAMA DE SECTORES
ITEM
BALONCESTO
12
144
40%
20%
NATACION
36
10%
40%
FUTBOL
108
30%
30% 10%
SIN DEPORTE
72
20%
TOTAL
30
360
100%
Histograma
INTERVALO 50-60 60-70 70-80 80-90 90-100 100-110 Ci 55 65 75 85 95 105 fi 8 10 16 14 10 5 Fi 8 18 26 30 24 15 ni 12,3% 15,4% 24,6% 21,5% 15,4% 7,7% Ni 0,12 0,28
FRECUENCIA 16 14 12 10 8 6 4 2 0
HISTOGRAMA
110-120
TOTAL
115
2
65
3,1%
100%
1
INTERVALOS
Parmetros estadsticos
Definicin de parmetro estadstico Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica. Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica.
Medidas de centralizacin
Nos indican en torno a qu valor (centro) se distribuyen los datos. La medidas de centralizacin son: Media aritmtica: La media es el valor promedio de la distribucin. Mediana: La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda: La moda es el valor que ms se repite en una distribucin.
Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla: fi [60, 63) [63, 66) 5 18 42 27 8 100
Mediana
Definicin de mediana Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.
Ejemplo Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:
fi [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) 5 18 42 27 8 100 Fi 5 23 65 92 100
Ejercicio de media aritmtica En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media.
xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 15 25 35 45 55 fi 1 8 10 9 8 xi fi 15 200 350 405 440
[60,70)
[70, 80)
65
75
4
2 42
260
150 1 820
ACTIVIDAD DE APRENDIZAJE
Reunir 100 datos estadsticos y ordenarlos en una tabla de frecuencias agrupadas o no agrupados, calcule los siguientes puntos: Los datos los puede obtener midiendo el tiempo en segundos en recorrer una distancia de 20 metros caminando, corriendo, etc., el peso de 100 personas, la edad de 100 personas, lanzar una moneda 100 veces, lanzar un dado 100 veces, el numero productos vendidos en determinados meses etc. 1. Ordenarlos en una tabla de frecuencias. Realice un pequeo anlisis de los datos en forma descriptiva. 2. Graficas los datos, utilizando el grafico pertinente para los datos. 3. Identificar cual es la poblacin, muestra, dato y tipo de variable. 4. Calcule la media aritmtica, moda y la mediana.
Medidas de posicin
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. La medidas de posicin son: Cuartiles: Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles: Los deciles dividen la serie de datos en diez partes iguales. Percentiles: Los percentiles dividen la serie de datos en cien partes iguales.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.
Li es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase.
[50, 60)
[60, 70)
8
10
8
18
[70, 80)
[80, 90)
16
14
34
48
[90, 100)
[100, 110)
10
5
58
63
[110, 120)
2
65
65
Q3 = 80 + 48.75 48 . 10 = 90.53 14
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Li es el lmite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase el decil.. ai es la amplitud de la clase.
Fi
8 18 34 48 58 63 65
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
Li es el lmite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del percentil. ai es la amplitud de la clase.
[80, 90)
[90, 100) [100, 110) [110, 120)
14
10 5 2 65
48
58 63 65
Percentil 35
Percentil 60
EJERCICIOS
1. Calcular la media, la mediana y la moda de la siguiente serie de nmeros: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
xi 2 3 4 5 6 8 fi 2 2 5 6 2 3 Fi xi fi
Mo =
Me = =
20
Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: Los cuartiles 1 y 3. Los deciles 2 y 7. Los percentiles 32 y 85. La moda, la mediana y la media.
1. Se ha aplicado test a los empleados de una fbrica, obtenindose las siete tabla. Calcular la media, la mediana y la moda.
fi [38, 44) 7
[44, 50)
[50, 56) [56, 62) [62, 68) [68, 74) [74, 80)
8
15 25 18 9 6
Medidas de dispersin
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido: El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media: La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Varianza: La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media. Desviacin tpica o estndar: La desviacin tpica es la raz cuadrada de la varianza.
Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por
El clculo ordenado de la desviacin media muestra en el ejemplo. Para dicha distribucin, las puntuaciones se desvan, en promedio, 2,25 unidades de la media.
fi
3 5 7 4 2 21
xi f i
37.5 87.5 157.5 110 65 457.5
|x - x|
9.286 4.286 0.714 5.714 10.174
|x - x| fi
27.858 21.43 4.998 22.856 21.428 98.57
El clculo ordenado de la desviacin media muestra en el ejemplo. Para dicha distribucin, las puntuaciones se desvan, en promedio, 4.69 unidades de la media.
Ejercicios de varianza
Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18
Para dicha distribucin, las puntuaciones se desvan, en promedio, 15 unidades al cuadrado de la media.
[20, 30)
[30,40) [40, 50)
25
35 45
8
10 9
200
350 405
5000
12 250 18 225
[50, 60
[60,70) [70, 80)
55
65 75
8
4 2
440
260 150
24 200
16 900 11 250
42
1 820
88 050
Esto nos queire decir que si la media es 9 unidades, la puntuacion en promedio puede moverse hacia arriba o abajo: 9 +(-+3.87) = 12.87 o 5.13 unidades.
[10, 20)
[20, 30) [30,40) [40, 50) [50, 60) [60,70) [70, 80)
15
25 35 45 55 65 75
1
8 10 9 8 4 2
15
200 350 405 440 260 150
225
5000 12 250 18 225 24 200 16 900 11 250
42
1 820
88 050
GRACIAS