Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA
Recolección
Organización
Presentación
Análisis
Interpretación
Ramas de la Estadística:
Inferencial: Probabilidad
Muestreo
DEFINICIÓN.
MÉTODOS ESTADÍSTICOS.
Recolección Análisis
Organización Interpret
Presentación ación
RAMAS DE LA ESTADÍSTICA.
MUESTREO Y POBLACIÓN.
2) Tomar una cucharada de la sopa para ver si el resto de ella es de buen sabor
6) Las fábricas producen unas cuantas piezas de algún nuevo producto antes de pasar a
la producción a gran escala.
Ejemplo:
TIPOS DE MUESTREO.
Tipo. Característica.
TABLAS DE FRECUENCIA.
22,21,20,21,25,21,22,20,25,22 19,19,20,20,20,20,20,20,21,21
20,20,19,22,23,21,27,19,20,20 21,21,22,22,22,22,23,25,25,27.
Distribución de frecuencias:
X f F f% F%
19 2 2 0.10 0.10
20 6 8 0.30 0.40
21 4 12 0.20 0.60
22 4 16 0.20 0.80
23 1 17 0.05 0.85
25 2 19 0.10 0.95
27 1 20 0.05 1.00
x= 20 1.00
2. Rango Ls Li 27 19 8
Rango 8
3. Intervalo de clase i C 1.6
Num. G 5
HISTOGRAMA
FRECUENCIA
10
8 18.5-20.1
6
20.1-21.7
4
2 21.7-23.3
0 23.3-24.9
1 24.9-26.5
FRONTERA DE CLASE
PASTEL
18.5-20.1
20.1-21.7
21.7-23.3
23.3-24.9
24.9-26.5
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
BARRAS
FRECUENCIA
10
8
6
Serie1
4
2
0
19- 20.7- 22.4- 24.1- 25.8-
20.6 22.3 24.0 25.7 27.4
LIM ITE DE CLASE
OJIVA
ACUMULADA
FRECUENCIA
25
20
18.5-20.1
15
10 20.1-21.7
5 21.7-23.3
0 23.3-24.9
1 24.9-26.5
FRONTERA DE CLASE
Cartogramas = mapas
Dictogramas = Figuras, Dibujos
10,14,15,13,17,16,12,14,11,13,15,18,9,14,14,9,15,11,13,11,12,10,17,16,12,
11,16,12,14,15.
F F f% F%
X
9 2 2 0.066 0.066
10 2 4 0.066 0.132
11 4 8 0.133 0.265
12 4 12 0.133 0.398
13 3 15 0.10 0.498
14 5 20 0.166 0.664
15 4 24 0.133 0.797
16 3 27 0.10 0.897
2 29 0.066 0.963
1 30 0.033 0.996
0.996
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
2. Rango Ls Li 18 9 9
Rango 9
3. Intervalo de clase i C 15
.
Num. G 6
Propiedades.
La media es única.
Si se suma o se resta un elemento, la media también cambia
Si se le suma una constante a la muestra original, la
media se modifica de igual magnitud.
La suma algebraica de las variables con respecto a la media es = 0.
(X i X) 0
25
X 5
5
2 6 7 8 2 x 25
(2 5) (6 5) (7 5) (8 5) (2 5)
3 1 2 3 ( 3) 0
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
X 1 X 2 .... X n x
X
N N
399
X 13.3
30
b) Datos organizados:
a) Serie simple.
b) Datos agrupados.
1
M 0 L1 i
1 2
93
M 0 13 (15
. )
(9 3) (9 3)
6
13 . ) 13 0.75 13.75
(15
6 6
MEDIANA = Md.
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
a) Serie simple:
n 1 30 1 31
Md 155
.
2 2 2
b) Datos agrupados:
n 30
f 12
Md Li 2 . 2
(i ) 115 (15
. )
fm 3
115
. 15
. 13
MEDIA GEOMETRICA = G = GM
a) Serie simple:
G X 1 * X 2 *.....* X n
log X 1 log X 2 ... log X n 33.45
G 111
. Anti log 12.88 13
n 30
b) Datos agrupados:
MEDIA ARMONICA = Ho
a) Datos no organizados:
n n
Ho
1 1 1 1
X1
X2
.....
Xn
x
30
Ho
1 1 1 1 1 1 1 1 1 1
2 2 4 4 3 5 4 3 2
9 10 11 12 13 14 15 16 17 18
30
12.5 13
240
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
b) Datos agrupados
N N
Ho
f1 f f f
2 ..... n
Pm1 Pm2 Pmn
Pm
30
Ho
4 8 3 9 3 3
4.75 11.35 12.95 14.55 1615 . 17.75
30 30
13.04 13
0.41 0.70 0.23 0.621 0.18 0.17 2.30
Es el grado de error que existe entre los números con respecto a la media
aritmética.
1. DESVIACIÓN MEDIA
a) DATOS ORGANIZADOS
DM
f Pm X
n
4 9.75 13 811.35 13 312.95 13 9 14.55 13 316.15 13 317.75 13
DM
30
13 13.2 0.15 13.95 9.45 14.25 64
DM 2.13
30 30
2. VARIANZA O VARIANCIA
a) serie simple
2
Xi X
S 2
n 1
2 (9 13) 2 2 (10 13) 2 4 (11 13) 2 4 (12 13) 2 3(13 13) 2
5(14 13) 2 4 (15 13) 2 3(16 13) 2 2 (17 13) 2 (18 13) 2
S2
30 1 29
32 18 16 4 5 16 27 32 10 175
6.03
29 29
b) datos clasificados
f Pm X
2
S 2
n 1
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
DESVIACION ESTANDAR.
a) serie simple
X X
2
S
n 1
b) datos agrupados
f Pm X
2
S
n 1
S 6.33 2.50
TALLA (cm) 160 165 168 170 171 175 175 180 180 182
PESO (kg) 55 58 58 61 67 62 66 74 79 83
Ejemplo 2.- Se representa por X el número de hijos de 100 familias y por Y el número
de hijas:
nº hijas (Y) 0 1 2 3
nº hijos (X) ----------- -- -- -- --
0 ----------- 10 15 15 3
1 ---------- 10 12 7 2
2 ---------- 8 4 3 1
3 ---------- 3 2 1 0
4 ---------- 2 1 1 0
La lectura de esta tabla es sencilla. Por ejemplo: habría 7 familias que tendrían 1 hijo y 2
hijas y ninguna familia tendría 3 hijos y 3 hijas.
En realidad la tabla de doble entrada anterior se convertiría en una tabla simple si
escribiéramos los 100 pares de valores iguales o repetidos en una tabla simple.
TALLA (cm) 160 165 168 170 171 175 175 180 180 182
PESO (kg) 55 58 58 61 67 62 66 74 79 83
nº hijas (Y) 0 1 2 3
nº hijos (X) ----------- -- -- --
0 ----------- 10 15 15 3
1 ---------- 10 12 7 2
2 ---------- 8 4 3 1
3 ---------- 3 2 1 0
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
4 ---------- 2 1 1 0
La lectura de esta tabla es sencilla. Por ejemplo: habría 7 familias que tendrían 1 hijo y 2
hijas y ninguna familia tendría 3 hijos y 3 hijas.
En realidad la tabla de doble entrada anterior se convertiría en una tabla simple si
escribiéramos los 100 pares de valores iguales o repetidos en una tabla simple.
Los ejemplos con que vamos a trabajar este tema serán del primer tipo por razones de
limitación a la hora de visualizar más número de valores en las escenas. Esto no limita las
posibilidades de estudiar el tema y entender los conceptos básicos.
Uno de los objetivos de este tema es estudiar el tipo de dependencia que hay entre las dos
características o variables estudiadas para que fenómeno en cuestión. Por ejemplo:
" ¿ A mayor talla de una persona le corresponde mayor peso ? "
" ¿ Cuanto mayor es el número de hijos varones de una familia mayor es el número de
hijas? "
A estas cuestiones parece que se responde rápidamente que sí. Pero
¿Cómo se observa en la nube de puntos este hecho?
Se puede ver en el primera figura que correspondía al diagrama de talla - peso que la serie
de puntos presenta una tendencia "ascendente" . Se dice en este caso que existen entre las
dos variables una "dependencia directa" .
En caso en que la tendencia sea "descendente" se diría que estaríamos ante una "
dependencia inversa”
Naturalmente en caso en que no se pueda observar una tendencia clara estaríamos ante una
dependencia muy débil que no se puede observar mediante la nube de puntos y se verá
cómo estudiarla a continuación. Realiza los siguientes ejercicios:
1.- En la escena que correspondía a la variable con 6 pares de valores: ¿Qué se puede decir
de la dependencia para los valores que aparecen inicialmente?.
2.- Modifica dichos valores para que la dependencia sea directa y posteriormente inversa.
4. COVARIANZA Y SU INTERPRETACIÓN
x 2 4 6 8 10 12
y 8 7 7 6 6 4
5. RECTA DE REGRESIÓN
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
Supongamos que en una variable bidimensional queremos precisar la relación que existe
entre las dos variables que la forman. En concreto queremos expresar mediante una relación
cómo depende una de ellas (variable dependiente) de la otra (variable independiente).
Normalmente se elige como y la variable dependiente y como x la independiente.
Si esa relación se expresa mediante una función lineal del tipo y = ax + b, su gráfica
correspondería a una recta.
En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos de la nube
de puntos de la variable. Dicha recta se denomina: recta de regresión.
Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la
recta de regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la
talla aumenta el peso. Por tanto:
En la tabla de valores de la variable talla - peso, solamente nos dan los valores de un
determinado número de personas (10 en este caso): las personas de las que se conocen
dichos valores. Mediante la recta de regresión podríamos obtener de manera aproximada el
peso de una persona de la que conociéramos la talla, en una población semejante a aquella
de la que se ha obtenido la muestra.
Si observamos la gráfica anterior, podríamos suponer por ejemplo que una persona de 185
cm. pesaría algo más de 80 kg.
Ejemplo 4.- La recta de regresión de la variable y (talla) sobre x (peso) será la recta:
y = 1,0909x - 121,9
El valor del peso que suponíamos aproximado para una talla de 185 cm sería: Peso= 1.0909
• 185 - 121,9 = 79.9
Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas
con la recta de regresión no son exactas. En el apartado siguiente precisaremos la
"fiabilidad" de las mismas.
Por tanto la recta de regresión se puede utilizar para realizar predicciones para la variable y
a partir de valores conocidos de la variable x.
1.- Observa la tabla de valores siguiente y la escena donde dichos valores están
representados. En la escena a los pares de valores le llamamos (a,a1) ; (b,b1); etc.
x 2 4 6 8 10 12
y 8 7 7 6 6 4
5.- Cambia los valores iniciales de la tabla en la escena viendo cómo varía la recta de
regresión y calcúlala en los casos que se desee (por ejemplo un caso en que la pendiente de
la recta sea positiva).
6. COEFICIENTE DE CORRELACIÓN
Una vez observado que en una variable bidimensional existe una cierta dependencia entre
las dos características o variables que la forman (nube de puntos y covarianza), podemos
precisar el grado de dicha dependencia.
- Si los puntos de la nube estuvieran todos sobre la recta de regresión se diría que existe una
dependencia funcional. De su estudio se encargan las funciones.
- Si los puntos no están todos sobre la recta de regresión se dice que entre las
variables hay una cierta correlación lineal. Este es el caso que nos ocupa. Para
cuantificar el grado de dicha correlación se usa el:
1.- Observa que se pueden deducir las siguientes conclusiones relativas al coeficiente de
correlación (r):
2.- Calcular el coeficiente de correlación para la variable talla - peso y deducir del valor del
mismo el tipo de dependencia y la fiabilidad de las predicciones. (Sol: r = 0,90).
Usualmente cuando tienen los datos ya recopilados, se usa el software Excel para
tabularlos. Normalmente se digitan en columnas y se extraen promedios, sumas y
porcentajes de la forma más sencilla.
Usando Excel.
Sea la tabla siguiente un ejemplo de mediciones de edad, peso y estatura de jóvenes de una
carrera X de nuestra universidad.
El propósito es calcular el índice de Masa Corporal (IMC) y así clasificar las personas de
la muestra según el IMC de cada cual.
Universidad del Mar
Curso Formación de Profesores Guías de Tesis
Prof.: Luis Gutiérrez Dinamarca
Si no se está bien familiarizado con Excel, costará un poco realizar tablas de frecuencias y
gráficos estadísticos como el Histograma.
Es por esta razón que las planilla en Excel, se pueden exportar a una planilla en SPSS.
La forma de exportar una planilla Excel a SPSS (versión 15,0 en español… si alguien la
quiere, se la podemos grabar y enviar), se rige por el siguiente procedimiento:
1. Iniciar SPSS.
Oprimir “cancelar”
La ventaja de extraer todo tipo de parámetros radica en que el Software está en español.
Siempre aconsejo realizar una correlación Bivariada, aunque puede ser “parciales” o
“distancias”.
Las correlaciones serán los principales estadígrafos que probarán las hipótesis. De modo
que una buena interpretación de ellas es fundamental para una buena toma de decisiones.
Los gráficos y otros estadígrafos son fácilmente extraíbles desde el menú Analizar de SPSS.
Dejo al lector la posibilidad de “navegar” por este Software.