Síntesis de Estadística Descriptiva para Ciencias Sociales - Jesús María Nieto Gil

SÍNTESIS DE ESTADÍSTICA DESCRIPTIVA PARA LAS CIENCIAS
SOCIALES
FÓRMULAS, SÍMBOLOS Y OPERACIONES EN LA RESOLUCIÓN DE PROBLEMAS PASO

A PASO
Jesús María Nieto Gil

Doctor en Pedagogía e Inspector de Educación
INDICE
Pág.
INTRODUCCIÓN 11
CUADRO Nº 1: LAS CIENCIAS 12

EXPLICATIVAS Y EL MÉTODO
CIENTÍFICO
1. LOS DISTINTOS SABERES DE LA
12
CIVILIZACIÓN
2. CARACTERÍSTICAS DE LAS CIENCIAS
13
EXPLICATIVAS
3. EL MÉTODO CIENTÍFICO POSITIVO
14
4. DESARROLLADORES DEL MÉTODO
14
<HIPOTÉTICO-DEDUCTIVO>
5. LOS GRADOS DE PERFECCIÓN DE LAS
15
CIENCIAS EXPLICATIVAS
6. LAS CUATRO ETAPAS DEL MÉTODO
16
EXPERIMENTAL
7. PAPEL DE LA ESTADÍSTICA EN EL MÉTODO
17
EXPERIMENTAL
CUADRO Nº 2: NATURALEZA DE LA 19
CIENCIA ESTADÍSTICA
1. ETIMOLOGÍA DE ESTADÍSTICA. 19
2. DEFINICIÓN 19
3. CLASIFICACIÓN DE LA ESTADÍSTICA.
20
4. LA ESTADÍSTICA Y LAS CIENCIAS 22
HUMANAS
5. UNA PERSPECTIVA SINÓPTICA DE LA 22
ESTADÍSTICA DESCRIPTIVA
CUADRO Nº 3: TIPOS DE VARIABLES 24
Y ESCALAS DE MEDIDA
1. CARACTERÍSTICAS DE LOS OBJETOS: 24
CONSTANTES Y VARIABLES
2. LAS CONSTANTES 24
3. LAS VARIABLES 24
4. TIPOS DE VARIABLES 25
5. VARIABLES CUALITATIVAS 25
6. VARIABLES CUANTITATIVAS DISCRETAS Y 26

CONTINUAS
7. LA MEDIDA 26
Estadísticos e-Books & Papers

8. RELACIÓN ENTRE VARIABLES Y ESCALAS DE 27
MEDIDA
CUADRO Nº 4: VARIABLES 30
CUALITATIVAS Y LA ESCALA NOMINAL
1.
DESIGNACIÓN DE LAS MODALIDADES DE
30
CADA ATRIBUTO
2. EXCLUSIVIDAD Y EXHAUSTIVIDAD DE LAS 30
MODALIDADES DE UN ATRIBUTO
3. ¿QUÉ PUEDE HACER LA ESTADÍSTICA CON 31
LOS ATRIBUTOS?
4. POSIBLES OPERACIONES ARITMÉTICAS 33
5. PROPORCIONES Y PORCENTAJES 33
CUADRO Nº 5: VARIABLES 35
CUANTITATIVAS DISCRETAS Y
ESCALAS ORDINALES
1. VARIABLES CUANTITATIVAS DISCRETAS
35
2. ESCALA ORDINAL
37
Pág.
CUADRO Nº 6. VARIABLES 39
CUANTITATIVAS CONTINUAS Y LAS
ESCALA DE INTERVALO Y DE RAZÓN
1. VARIABLES CUANTITATIVAS CONTINUAS Y
39
LA ESCALA DE INTERVALO Y DE RAZÓN.
2. LAS ESCALAS DE RAZÓN 40
CUADRO Nº 7: CONCEPTOS BÁSICOS 42
EN ESTADÍSTICA
CUADRO Nº 8: SÍMBOLOS USADOS

44
EN ESTADÍSTICA DESCRIPTIVA
LETRAS LATINAS 44
LETRAS GRIEGAS UTILIZADAS EN LA 46

CUADRO Nº 9: ALGUNAS
47
PRECISIONES SOBRE EL USO DE LOS
SÍMBOLOS MATEMÁTICOS DE LAS
FÓRMULAS ESTADÍSTICAS
1. INTRODUCCIÓN 47
CUADRO Nº 10. REPESENTACIONES 51
GRÁFICAS DE LOS DATOS

1. LAS REPRESENTACIONES GRÁFICAS DE
51
LOS DATOS
2. LOS EJES CARTESIANOS 51
3. CARACTERÍSTICAS DE LOS DATOS QUE
51
PUEDEN REPRESENTARSE CON GRÁFICOS
4. TIPOS DE REPRESENTACIONES GRÁFICAS
52
5.EL HISTOGRAMA Y EL POLÍGONO DE 52
FRECUENCIAS
6. CONSTRUCCIÓN DE UN HISTOGRAMA O DE
UN <POLÍGONO DE FRECUENCIAS>
53
7. HISTOGRAMA Y POLÍGONO DE FRECUENCIAS 54
ACUMULADAS

8. SECTORES CIRCULARES PARA PRESENTAR 55
FRECUENCIAS
CUADRO Nº 11: TAREAS DE LA 56

1. EL TRATAMIENTO DE LOS DATOS
56
2. RECOGIDA Y ORDENACIÓN DE LOS DATOS 56
3. TABULACIÓN 57
4. EJEMPLO DE TABLA PARA MUESTRAS 58

CON MENOS DE 12 SUJETOS
5. EJEMPLO DE TABLA DE FRECUENCIAS PARA

MUESTRAS SUPERIORES A DOCE SUJETOS Y CON
PUNTUACIONES CUYOS VALORES NO ESTÁN
58
AGRUPADOS EN INTERVALOS.
6. EJEMPLO DE TABLA DE FRECUENCIAS PARA

DATOS CUYOS VALORES OBTENIBLES ESTÁN 59
AGRUPADOS EN INTERVALOS
CUADRO Nº 12: ÍNDICES

62
DESCRIPTIVOS DE UNA SOLA
VARIABLE EN UNA MUESTRA
1. ÍNDICES DESCRIPTIVOS DE UNA SOLA 62
VARIABLE
Pág.
2. TIPOS DE ÍNDICES DESCRIPTIVOS DE UNA 62

SOLA VARIABLE
3. INDICES DE TENDENCIA CENTRAL 63
4. INDICES DE VARIABILIDAD O DISPERSIÓN 63
5. LOS INDICES DE ASIMETRÍA Y APUNTAMIENTO 63
6. TABLA RESUMEN 64
CUADRO Nº 13: ÍNDICES DE

65
TENDENCIA CENTRAL/PROMEDIOS Y LA
<MODA>.
1. ÍNDICES DE TENDENCIA CENTRAL 65
2. LA MODA ENTRE LOS ÍNDICES DE TENDENCIA 66

CENTRAL
3. CÓMO IDENTIFICAR LA <MODA> DE UNA

DISTRIBUCIÓN DE FRECUENCIAS 66
4. VERSATILIDAD DE LA <MODA> 67
5. LIMITACIONES DE LA <MODA> 67
6. EJEMPLOS DE IDENTIFICAR LA <MODA> DE

DISTRIBUCIONES DE FRECUENCIAS 68
CUADRO Nº 14: LA MEDIANA 71
1. INTRODUCCIÓN 71
2. EL CÁLCULO DE LA MEDIANA (Md) 71
3. TIPOS DE CÁLCULOS DE LA MEDIANACON

PUNTUACIONES NO AGRUPADAS EN INTERVALOS 71
4. CÁLCULO DE LA MEDIANA EN ESTE 72

<CUADRO>.
5. EJEMPLO DE PROCEDIMIENTO PARA HALLAR

LA MEDIANA DE UNA SERIE FORMADA POR UN
NÚMERO IMPAR DE PUNTUACIONES Y SIN QUE LA
PUNTUACIÓN DEL RANGO CENTRAL COINCIDA CON
LAS PUNTUACIONES DE OTRO U OTROS RANGOS 72

CUADRO Nº 15: PROCEDIMIENTO DE
74
CÁLCULO DE LA MEDIANA DE UNA
SERIE PAR DE RANGOS
1. INTRODUCCIÓN 74
2. EJEMPLO DE CÁLCULO DE LA MEDIANA DE

UNA SERIE FORMADA POR UN NÚMERO PAR DE
PUNTUACIONES Y SIN QUE LAS DOS
PUNTUACIONES DE LOS DOS RANGOS CENTRALES
COINCIDAN CON LAS PUNTUACIONES DE OTRO U 74
OTROS RANGOS
CUADRO Nº 16: CÁLCULO DE LA

76
MEDIANA DE UNA SERIE CON
VALORES REPETIDOS EN EL RANGO O
RANGOS CENTRALES
1. EJEMPLO DE CÁLCULO DE LA MEDIANA
76
CUANDO ESTÁ REPETIDA LA PUNTUACIÓN DEL
RANGO CENTRAL

78
MEDIANA CON LAS PUNTUACIONES
AGRUPADAS EN INTERVALOS
1. EJEMPLO DE CÁLCULO DE LA <Md> CON LAS 78
PUNTUACIONES AGRUPADAS EN INTERVALOS
Pág.
CUADRO Nº 18: DETERMINAR LA

81
POSICIÓN DEL INDIVIDUO EN EL GRUPO
1. INTRODUCCIÓN 81
2. LOS PERCENTILES 81
3. LAS OPERACIONES CON PERCENTILES 82
4. HALLAR EL PERCENTIL 83
CORRESPONDIENTE A UNA PUNTUACIÓN
DADA
5. UN EJEMPLO DE CÁLCULO 83
6. HALLAR LA PUNTUACIÓN QUE LE

CORRESPONDE A UN DETERMINADO PERCENTIL 83
7. UN EJEMPLO DE CÁLCULO: 84
8. LOS CUARTILES 84
CUADRO Nº 19: LA MEDIA 85

ARITMÉTICA
1. INTRODUCCIÓN 85
2. DEFINICIÓN, SÍMBOLO, FÓRMULAS Y

SIMBOLOGIAS DE LA MEDIA ARITMÉTICA 85
3. CASOS EN EL CÁLCULO DE LA MEDIA 86

ARITMÉTICA:
4. CASO <a>: CÁLCULO DE LA MEDIA

ARITMÉTICA CON UN NÚMERO DE VALORES 86
MENOR DE 12, SIN Y CON FRECUENCIAS:
5. CASO : CÁLCULO DE LA MEDIA

ARITMÉTICA DE LAS PUNTUACIONES AGRUPADAS
POR SUS POSIBLES VALORES CON SUS
88
RESPECTIVAS FRECUENCIAS

91
MEDIA ARITMÉTICA CON LOS DATOS
1. INTRODUCCIÓN 91
2. PROCEDIMIENTOS PARA AGRUPAR VALORES 91

EN INTERVALOS
3. FÓRMULA Y SIMBOLOGIA 93
4. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO

DE LA MEDIA ARITMÉTICA CON LOS VALORES 93

GEOMÉTRICA
1. LAS OTRAS TRES MEDIAS
95
2. LA MEDIA GEOMÉTRICA 95
3. EJEMPLO DE CÁLCULO
96

CUADRÁTICA Y LA MEDIA ARMÓNICA
1. DEFINICIÓN, SÍMBOLO, FÓRMULAS Y
SIMBOLOGIA DE LA MEDIA CUADRÁTICA
97
2. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO 97

DE LA MEDIA ARMÓNICA
3. DEFINICIÓN, SÍMBOLO, FÓRMULA Y

SIMBIOLOGÍA DE LA MEDIA ARMÓNICA. 98

DE LA MEDIA ARMÓNICA.
Pág.
CUADRO Nº 23: LOS ÍNDICES DE 101

VARIABILIDAD/DISPERSIÓN
1. ¿POR QUÉ ES NECESARIO CALCULAR LOS
ÍNDICES DE VARIABILIDAD PARA DESCRIBIR LAS 101
PUNTUACIONES DE UNA MUESTRA?
2. RELACIÓN DE LOS ÍNDICES DE

VARIABILIDAD/DISPERSIÓN DE UNA DISTRIBUCIÓN 102
DE FRECUENCIAS.
3. ADECUACIÓN DEL ÍNDICE DE VARIABILIDAD

ELEGIDO CON EL TIPO DE DATOS 103
4. PUNTUACIONES DIRECTAS Y PUNTUACIONES 104

DIFERENCIALES
5. ADVERTENCIA SOBRE LOS SÍMBOLOS DE LA

<VARIANZA Y LA <DESVIACIÓN ESTÁNDAR O 105
TÍPICA>
6. CUADRO CON LAS RELACIONES ENTRE

VARIABLES, ESCALAS DE MEDIDA, INDICES DE 105
TENDENCIA CENTRAL E INDICES DE
VARIABILIDAD/DISPERSIÓN.
CUADRO Nº 24: AMPLITUD TOTAL Y

106
AMPLITUS SEMI-INTERCUARTIL
1. INTRODUCCIÓN
106
2. LA AMPLITUD TOTAL 106
3. EJEMPLOS DE CÁLCULO DE LA AMPLITUD 107
4. LA AMPLITUD SEMIINTERCUARTIL (Q)
108
5. UN EJEMPLO DEL PROCEDIMIENTO DE 108

CÁLCULO:
CUADRO Nº 25: LA DESVIACIÓN 110
MEDIA (DM)
1. DEFINICIÓN 110
2. RECORDAMOS LO QUE SON LAS 110

PUNTUACIONES DIFERENCIALES
3. TIPOS DE CASOS EN EL CÁLCULO DE LA

DESVIACIÓN MEDIA (DM):
4.CÁLCULO DE LA DESVIACIÓN MEDIA CUANDO

EL NÚMERO DE PUNTUACIONES ES INFERIOR A 111
DOCE

DE LA DESVIACIÓN MEDIA
6. PROCEDIMIENTO DE CÁLCULO DE LA
DESVIACIÓN MEDIA CUANDO EL NÚMERO DE
PUNTUACIONES ES IGUAL O SUPERIOR A DOCE (12)
113
CON SUS FRECUENCIAS
7. UN EJEMPLO DEL PROCEDIMIENTO DE

CÁLCULO DE LA DESVIACIÓN MEDIA CON LAS 114
FRECUENCIAS DE CADA VALOR

116
DESVIACIÓN MEDIA (DM) CON DATOS
1. INTRODUCCIÓN
116
2. FÓRMULAS Y SIMBOLOGÍA
116
CUADRO Nº 27: VARIANZA Y 119

DESVIACIÓN ESTANDAR
1. OPERAR CON PUNTUACIONES
119
DIFERENCIALES
2. LA DESVIACIÓN ESTANDAR ENTRE LOS 119
ÍNDICES DE VARIABILIDAD
3. RELACIONES ENTRE VARIANZA Y
120
DESVIACIÓN ESTÁNDAR
4. LA DESVIACION ESTÁNDAR EN TRES
120
<CUADROS>
Pág.
5. FÓRMULAS DE LA DESVIACIÓN ESTÁNDAR
121
(S):
6. CÁLCULO DE LA DESVIACIÓN ESTÁNDAR
(<S>) OPERANDO CON PUNTUACIONES 121
DIFERENCIALES:
7. CÁLCULO DE LA DESVIACIÓN ESTANDAR

OPERANDO SÓLO CON LAS PUNTUACIONES
DIRECTAS (<X>), SIN TENER QUE HALLAR LAS
123
PUNTUACIONES DIFERENCIALES (<x>)
8. UN EJEMPLO DE CÁLCULO DE <S> CON 124

PUNTUACIONES DIRECTAS
CUADRO Nº28. CÁLCULO DE LA

DESVIACIÓN ESTANDAR CON
126
PUNTUACIONES DIFERENCIALES Y CON
PUNTUACIONES DIRECTAS Y SUS
RESPECTIVAS FRECUENCIAS
1. CÁLCULO DE <S> OPERANDO CON 126
127
CÁLCULO
3. CÁLCULO DE LA <S> OPERANDO CON 128
PUNTUACIONES DIRECTAS
4. UN EJEMPLO DE CÁLCULO DE <S> OPERANDO 129

CON PUNTUACIONES DIRECTAS

132
DESVIACIÓN ESTANDAR CON LOS
VALORES AGRUPADOS EN
INTERVALOS
DESVIACIÓN ESTÁNDAR (S) CON VALORES
AGRUPADOS EN INTERVALOS UTILIZANDO
PUNTUACIONES DIFERENCIALES 132
2. UN EJEMPLO DE CÁLCULO
132
DESVACIÓN ESTÁNDAR CON VALORES
AGRUPADOS EN INTERVALOS UTILIZANDO
UNICAMENTE LAS PUNTUACIONES DIRECTAS,
SIN NECESIDAD DE CALCULAR LAS 135
135
CUADRO Nº 30: ÍNDICES DE 137

ASIMETRIA
1. ÍNDICE DE SIMETRÍA/ASIMETRÍA
137
2. FORMULAS Y SU SIMBOLOGÍA PARA
138
CALCULAR EL ÍNDICE DE ASIMETRÍA
3. DOS EJEMPLOS DEL PROCEDIMIENTO DE 139
CÁLCULO
4. INTERPRETACIÓN
140
CUADRO Nº 31: ÍNDICE DE 141

APUNTAMIENTO O CURTOSIS
1. APUNTAMIENTO O CURTOSIS
141
2. ÍNDICE DE APUNTAMIENTO O CURTOSIS
141
3. EJEMPLO DEL PROCEDIMENTO DE
142
CÁLCULO
4. INTERPRETACIÓN 143
CUADRO Nº 32: ESTADÍSTICA DE

144
DOS O MÁS VARIABLES EN LA MISMA
MUESTRA
1. INTRODUCCIÓN 144
Pág.
2. LA CORRELACIÓN ENTRE DOS VARIABLES 144
3. INTERPRETACIÓN DE LOS RESULTADOS DE

LOS COEFICIENTES DE CORRELACIÓN 145
4. CUADRO RESUMEN DE LOS COEFICIENTES 145

DE CORRELACIÓN
5. COEFICIENTES DE ASOCIACIÓN 145
6. CUADRO CON LA CLASIFICACIÓN DE LOS 146

COEFICIENTES DE ASOCIACIÓN
CUADRO Nº 33: COEFICIENTE DE

147
CORRELACIÓN LINEAL DE PEARSON
1. DEFINICIÓN:
147
2. REQUISITOS EXIGIDOS A LAS VARIABLES
CUANTITATIVAS CONTINUAS PARA PODER
CALCULAR JUSTIFICADAMENTE LA
CORRELACIÓN DE PEARSON 147
3. INTERRETACIÓN DEL COEFICIENTE DE
148
CORRELACIÓN LINEAL
4. DOS CASOS EN EL PROCEDIMIENTO DE
CÁLCULO DEL COEFICIENTE DE
CORRELACIÓN LINEAL 149
5. FÓRMULAS 150

CUADRO Nº34: CÁLCULO DEL
COEFICIENTE DE CORRELACIÓN 153
LINEAL UTILIZANDO PUNTUACIONES
DIRECTAS
1. CÁLCULO DE LA CORRELACIÓN LINEAL

UTILIZANDO PUNTUACIONES DIRECTAS 153
2. EJEMPLO DE CÁLCULO 153
CUADRO Nº 35: CÁLCULO DEL

156
COEFICIENTE DE CORRELACIÓN
LINEAL UTILIZANDO MEDIAS
ARITMÉTICAS
CUADRO Nº 36: REGRESIÓN LINEAL 159
1. REGRESIÓN LINEAL
159
2. RECTA DE REGRESIÓN
159
3. REGRESIÓN DE <Y> SOBRE <X>
160
4. EJEMPLO DE CÁLCULO DE LA RECTA DE
161
REGRESIÓN DE <Y> SOBRE <X>
5. REGRESIÓN DE <x> SOBRE <y> 162
6. EJEMPLO DE CÁLCULO 162
CUADRO Nº 37: LAS PUNTUACIONES 164

ESTÁNDAR <z
1. LOS TRES TIPOS DE PUNTUACIONES
164
2. INSUFICIENCIA DE LAS PUNTUACIONES

DIRECTAS Y DIFERENCIALES PARA COMPARAR LA
PUNTUACIÓN OBTENIDA POR UN INDIVIDUO EN
DOS MEDICIONES O CON LAS PUNTUACIONES
OBTENIDAS POR OTROS INDIVIDUOS 164
3. LAS PUNTUACIONES ESTÁNDAR <Z> 165
4. PROPIEDADES LAS PUNTUACIONES 165

ESTÁNDAR <z>
5. EJEMPLO DE CÁLCULO DE LAS 166

PUNTUACIONES ESTÁNDAR
6. PUNTUACIONES NORMALIZADAS <T> 168
Pág.
CUADRO Nº 38: LA CURVA NORMAL 169
1. DISTRIBUCIONES DE PROBABILIDADES Y
169
CURVAS
2. CARACTERÍSTICAS DE LA CURVA NORMAL 169
DE PROBABILIDADES
3. DESCRIPCIÓN DE LA TABLA DE LAS ÁREAS 169
DE LA CURVA NORMAL
4. TABLA DE LA DISTRIBUCIÓN DE
170
PROBABILIDAD NORMAL
5. ¿CÓMO ENCONTRAR EL AREA
(PROPORCIÓN O PORCENTAJE)
CORRESPONDIENTE A UNA <z> DADA 171
6. PUNTUACIONES <Z> POSITIVAS Y 172
PUNTUACIONES <Z> NEGATIVAS
CUADRO Nº 39: EJEMPLOS DE

173
PROBLEMAS DE PUNTUACIONES <z> Y
ÁREAS BAJO LA CURVA NORMAL
1. EJEMPLOS DE BUSQUEDA DEL
PORCENTAJE QUE CORRESPONDE A UNA
PUNTUACIÓN ESTÁNDAR (z) DADA 173
2. CÓMO HALLAR LA PUNTUACIÓN <z> QUE
CORRESPONDE A UN PORCENTAJE
CONCRETO 177

CUADRO Nº 40: COEFICIENTES DE
179
CORRELACIÓN MÚLTIPLE Y DE
CORRELACIÓN PARCIAL
1. LOS COEFICIENTES DE CORRELACIÓN
179
MÚLTIPLE Y PARCIAL
2. COEFICIENTE DE CORRELACIÓN MÚLTIPLE
179
3. DEFINICIÓN:
179
4. PROCEDIMIENTO DE CÁLCULO
180
5. COEFICIENTE DE CORRELACIÓN PARCIAL 181

184
CORRELACIÓN ORDINAL (r) DE
SPEARMAN
1. INTRODUCCIÓN:
184
2. EJEMPLO DE CÁLCULO DEL COEFICIENTE DE 185

CORRELACIÓN ORDINAL DE SPEARMAN <r>
3. UN EJEMPLO DE CÁLCULO DEL COEFICIENTE

DE CORRELACIÓN ORDINAL DE SPEARMAN <r> EN 187
EL QUE APARECEN <EMPATES>

191
CORRELACIÓN t (tau) DE KENDALL
ENTRE VARIABLES MEDIDAS EN
ESCALA ORDINAL
2.FÓRMULAS Y SIMBOLOGÍA 191
3. LA <INVERSIÓN> O LA <NO INVERSIÓN> 192

ENTRE RANGOS
4. UN EJEMPLO DEL CÁLCULO DEL COEFICIENTE 193

<t>

195
CORRELACIÓN <W> DE
CONCORDANCIA DE KENDALL
2. DEFINICIÓN 195
Pág.
3. EJEMPLO DE PROCEDIMIENTO DE CÁLCULO 196
CUADRO Nº 44: COEFICIENTE DE 199
CORRELACIÓN BISERIAL
1. COEFICIENTES DE CORRELACIÓN Y
ASOCIACIÓN DERIVADOS DEL COEFICIENTE DE
CORRELACIÓN LINEAL DE PEARSON 199
2. DEFINICIÓN DEL COEFICIENTE DE 199

CORRELACIÓN BISERIAL
3. REQUISITOS 199
4. FÓRMULAS Y SIMBOLOGÍA 200

206
CORRELACIÓN BISERIAL PUNTUAL
1. DEFINICIÓN
206
2. FÓRMULAS
206

212
ASOCIACIÓN ENTRE VARIABLES
CUALITATIVAS
1. TIPOLOGÍAS DE LOS COEFICIENTES DE
ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS
212
2. COEFICIENTE <Q> DE YULE DE ASOCIACIÓN
ENTRE VARIABLES CUALITATIVAS
DICOTÓMICAS O DICOTOMIZADAS 214
215
CÁLCULO DE <Q>:
4. COEFICIENTE DE COALIGACIÓN <w> (OMEGA 215
MINÚSCULA)

217
ASOCIACIÓN c2 (JI CUADRADO) CON
VARIABLES CUALITATIVAS
DICOTÓMICAS
1. DEFINICIÓN
217
2. LAS DOS FÓRMULAS DEL <JI CUADRADO> 217
3. UN PROBLEMA PARA EJEMPLIFICAR EL
219
PROCEDIMIENTO DE CÁLCULO
CUADRO Nº 48: EL COEFICIENTE c2

(JI CUADRADO) PARA VARIABLES 222
CUALITATIVAS POLICOTÓMICAS (1ª
PARTE: CÁLCULO DE LAS
FRECUENCIAS TEÓRICAS)
1. INTRODUCCIÓN
222
2. CÁLCULO DE LAS FRECUENCIAS TEÓRICAS 223

DE CADA CASILLA
3. TRANSCRIBIR LAS FRECUENCIAS EMPÍRICAS

A LA TABLA DE CONTINGENCIA 223
4. HALLAR LAS FRECUENCIAS MARGINALES 224
5. CÓMO OBTENER LAS FRECUENCIAS 224

TEÓRICAS DE CADA CASILLA

Pág.
CUADRO 49º: EL COEFICIENTE c2

(JI CUADRADO) PARA VARIABLES 226
CUALITATIVAS POLICOTÓMICAS (2ª
PARTE: CÁLCULO DEL COEFICIENTE
c2)
1. LAS TABLAS DE FRECUENCIAS EMPÍRIAS Y
DE LAS FRECUENCIAS TEÓRICAS
226
1. CALCULO DEL VALOR DE CADA SUMANDO 227

229
ASOCIACIÓN DERIVADOS DEL
COEFICIENTE <c2 >
1. RELACIÓN DE COEFICIENTES DE
ASOCIACIÓN DERIVADOS DEL COEFICIENTE
229
<c2> (JI CUADRADO)
2. COEFICIENTE DE CONTINGENCIA <C> 229
3. COEFICIENTE DE CONTINGENCIA MÁXIMO: 230
<Cmax>.
4. COEFICIENTE <C> CORREGIDO: 231
6. COEFICIENTE <V> DE CRAMERS 232
7. COEFICIENTE T2 DE TSCHUPROW 233
8. COEFICIENTE < f2 > (FI CUADRADO) 233
EPÍLOGO 235
EL USO DE LOS PROGRAMAS 235

INFORMÁTICOS DE ESTADÍSTICA
1. DISPOSITIVOS ELECTRÓNICOS Y
PROGRAMAS INFORMÁTICOS PARA LOS
ANÁLISIS ESTADÍSTICOS 235
2. EL PROGRAMA INFORMÁTICO <SPSS> 236
3. DESCRIPCIÓN DE LA VENTANA <NEW 237
DATA>

INTRODUCCIÓN
Amigo lector: Tienes ante tus ojos un libro dedicado a exponer los contenidos de la Estadística Descriptiva. Ha sido redactado con el único fin
de ayudarte a comprender los conceptos de la estadística descriptiva y a dominar los procedimientos de cálculo de todos los índices univariables
(tendencia central, variabilidad, asimetría y apuntamiento) y los índices bivariables (coeficientes de correlación y asociación) y multivariables
(coeficiente de correlación múltiple y de correlación parcial).
Los índices se presentan con la mayor claridad posible para facilitar la comprensión del concepto, de sus fórmulas, la identificación
de los símbolos matemáticos que las integran y, sobre todo, el desarrollo de todo el procedimiento de cálculo, aplicado a un problema, con
tablas adecuadas a cada índice, en las que se van recogiendo progresivamente los resultados de las operaciones aritméticas que prescribe la
fórmula, con una descripción minuciosa de cada paso, uno a uno, no dando por sentado conocimientos matemáticos, por muy básicos que sean,
sin <saltarse> pasos del proceso de cálculo.
Acompañan al texto las tablas de áreas bajo la curva normal a partir de la puntuación <z>, tablas de valores críticos de las correlaciones
biserial y biserial puntual y del coeficiente <c2> (ji cuadrado).
Para una mejor comprensión del papel instrumental de la Estadística en la investigación científica experimental, se ofrecen
consideraciones sobre los saberes humanos, las ciencias explicativas y las interpretativas, las fases del método hipotético-deductivo, las
variables y las escalas de medida.
Aunque todos los cálculos propuestos en este libro pueden ser realizados con una calculadora científica manual, dedicamos un epílogo
a una muy breve guía de uso del programa informático SPSS (Stastistic Program for Social Sciences) para aquellos casos con un gran número de
sujetos con sus puntuaciones, con la búsqueda combinada de varios índices y con complejos y repetitivos cálculos.

CUADRO Nº 1: LAS CIENCIAS EXPLICATIVAS Y EL MÉTODO CIENTÍFICO
1. LOS DISTINTOS SABERES DE LA CIVILIZACIÓN
Los saberes que constituyen el fundamento de la civilización humana pueden ser clasificados siguiendo distintas tipologías, la que aquí
presentamos no es la más exhaustiva y rigurosa, pero como marco que relaciona las ciencias sociales con la Estadística, la estimamos válida
para este propósito.
a. FILOSOFÍA: su objeto de estudio es el <todo como todo> (Ortega y Gasset). Sus disciplinas son la Ética, la Metafísica, la Teoría del
Conocimiento (Crítica), la Estética,…Su metodología es muy variada: especulación, fenomenología, análisis del lenguaje…
b. CIENCIAS
Distinguimos entre:
1) Ciencias formales (Matemáticas, Lógica y Epistemología). Su método es axiomático y deductivo.
2) Ciencias materiales:
1) Ciencias explicativas/experimentales (Física, Química, Biología, Astronomía, Fisiología, Neurología, Psicología… y ciencias
derivadas y afines). Su metodología, con variantes adaptadas a sus particulares objetos de estudio, es el conocido como
<Hipotético-Deductivo>, que con mayor precisión debería nombrársele como: <Observacional-Inductivo-Hipotético-Deductivo>,
nacido en las obras de Roger Bacon, Guillermo de Occam, Galileo Galilei, Sir Francis Bacon, Sir Isaac Newton, John Stuart Mill,
Henri Poincaré, Sir Karl Popper, etc.
2) Ciencias interpretativas: Historia, Teología, Etnografía, Derecho... Interpretan, buscan el significado y el sentido a textos orales,
escritos, gestuales, gráficos, musicales,…
3) Ciencias de los signos (Semiótica): Semiología, Morfología, Fonética, Fonología, Sintaxis, Semántica, Pragmática,…
4) Ciencias aplicadas y Tecnologías, derivadas preferentemente de las ciencias formales y explicativas:
d I) Sobre la salud y la actividad física: Anatomía, Histología, Farmacología, Terapéutica, Psiquiatría, Psicoterapia, Enfermería,
Estomatología, Pediatría, Podología…
d II) Sobre la educación. Psicopedagogía, Psicodidáctica, Organización escolar,…
d III) Sobre la producción de bienes agrícolas, industriales, mineros, de transporte y comerciales: Ingeniería en sus distintas
especialidades, Agronomía, Veterinaria, Cibernética, Informática, Robótica, Aviónica, Economía,…
d IV) De la comunicación social y relaciones jurídicas: Periodismo, Derecho, <Coaching>
Otras ciencias que en unos aspectos pertenecerían a las ciencias explicativas y en otros a las interpretativas, como podría ser, con
ciertas reservas, la Geografía, la Sociología,…
a. HUMANIDADES Y BELLAS ARTES: Promueven las relaciones humanas, interpersonales e intrapersonales, dentro de las sociedades y
los grupos humanos, respecto a los valores éticos, científicos, culturales, religiosos, estéticos, económicos,, políticos, deportivos,
musicales, de ocio…
2. CARACTERÍSTICAS DE LAS CIENCIAS EXPLICATIVAS
Sobre las ciencias explicativas, puras y aplicadas, como las ciencias de la conducta (Psicología, Psicopedagogía,…), podemos decir que
Intentan reducir la complejidad del cosmos, en sus distintas realidades, a regularidades comprensibles y comprobables intersubjetivamente.
También se las conoce como ciencias positivas, pues trabajan con <lo puesto> (<positum>) por la Naturaleza, lo dado (<datum>) por ella: los
<data> (los datos).
Las ciencias explicativas son saberes <nomotéticos> o sea son sistemas de leyes o proposiciones generales sobre fenómenos que se repiten,
frente al saber <idiosincrático> que estudia hechos únicos, como lo hace la Historiografía. La característica distintiva de las ciencias
explicativas/positivas es el uso exclusivo del método conocido como método <hipotético-deductivo>.
Las ciencias explicativas establecen las relaciones de identidad, igualdad, reciprocidad, causa-efecto... Sus conclusiones tienen que ser
verificables y la expresión de esas relaciones tiende a ser de naturaleza matemática.
3. EL MÉTODO CIENTÍFICO POSITIVO
Para poder comprender el papel que juega la Estadística en la aplicación del método científico, creemos conveniente presentar una
visión panorámica del método científico, concretamente en las ciencias explicativas y en las ciencias aplicadas o tecnologías que se derivan de
los hallazgos de aquellas. Siendo la Estadística una rama de las Matemáticas (por tanto una ciencia formal) viene a ayudar a describir e inferir
relaciones existentes entre objetos estudiados en las ciencias explicativas por medio de la aplicación del método experimental conocido como
<Hipotético-Deductivo>.

El método (inductivo)-hipotético-deductivo es propio del paradigma <verificacionista> que se aplica a datos cuantitativos.
4. DESARROLLADORES DEL MÉTODO <HIPOTÉTICO-DEDUCTIVO>
El método científico positivo/experimental es el método hipotético-deductivo, cuyos representantes más destacados son: Alhacén, Avicena,
Roger Bacon, Robert Grosseteste, William of Ockham, Galileo Galilei, René Descartes, Sir Francis Bacon, Sir Isaac Newton, Hans Christian Orsted,
John Stuart Mill, Charles Sanders Peirce, William Whewell, William Stanley Jevons, Henri Poincaré, Sir Karl Popper y otros muchos.

5. LOS GRADOS DE PERFECCIÓN DE LAS CIENCIAS EXPLICATIVAS
El grado de perfección de cada ciencia explicativa es, entre otros, el nivel alcanzado, dentro de los siguientes niveles de sus propósitos:
a. Descripción de fenómenos y de sus elementos.

b. Explicación de las relaciones entre los elementos intervinientes en el fenómeno estudiado.
c. Predicción de la aparición de un fenómeno a partir del conocimiento de las relaciones entre los elementos del fenómeno. Vemos estos
niveles:
DESCRIPCIÓN
En la simple descripción se presentan con palabras y números los resultados de las observaciones de las características (variables) que son
perceptibles en los objetos (cosas, animales y seres humanos, sus sociedades y organizaciones) tal como son captados por los sistemas
sensoriales directamente o a través de dispositivos que los amplían y/o los miden.
EXPLICACIÓN
El segundo nivel de perfección que la ciencia es su poder de explicación de los fenómenos que ha descrito tras la observación. Para la
explicación, son necesarias la formulación de hipótesis y la experimentación, la cuasi experimentación o la experimentación <ex post facto> o la
correlacional.
PREDICCIÓN
Si además de la descripción y la explicación, es posible predecir la evolución del fenómeno estudiado y los resultados finales de esta
evolución, nos encontraríamos en el nivel superior de la calidad del rigor en una ciencia. Así, por ejemplo, la astronomía es una ciencia que
describe, explica los porqués de los movimientos celestes, y es capaz de predecir los eclipses, las órbitas de los planetas y otros muchos
fenómenos propios de esta ciencia. En el nivel actual de desarrollo de las ciencias, la Física, la Química, la Astronomía y en menor medida la
Biología alcanzan el nivel superior: la predicción.
6. LAS CUATRO ETAPAS DEL MÉTODO EXPERIMENTAL
El método científico sigue un proceso de cuatro etapas:
1º Observación de los fenómenos e identificación de variables.

2º Inducción de probables relaciones entre variables.
3º Formular la hipótesis que es una conjetura sobre la relación existente entre dos variables y que debe ser aceptada o rechazada. Para ello
hay que concretar y definir la relación. Se distinguen dos variables en cada hipótesis: una variable independiente (X) y una variable dependiente
(Y). Se establece la hipótesis nula (no existe relación entre ambas variables) y la hipótesis alternativa (sí existe una relación entre las dos
variables). Si los resultados no apoyan la hipótesis alternativa, aceptamos la hipótesis nula. Cuando admitimos la hipótesis alternativa o la
hipótesis nula, debemos hacerlo con un determinado riesgo de error. La estadística podrá ayudarnos a tomar la decisión correcta.
4º Elegir el diseño más adecuado para rechazar la hipótesis nula. He aquí los cuatro diseños:
a. Un experimento
b. Un cuasi-experimento
c. Un experimento <ex post facto>.
d. Un experimento de correlación entre variables cuantitativas o de asociación entre variables cualitativas.
El orden de los cuatro tipos de diseños experimentales responde al rigor científico de cada uno de ellos: el mayor rigor lo ostenta el
diseño experimental y el menor, al diseño de correlación entre variables cuantitativas y el de asociación entre variables cualitativas.
En los dos primeros se manipula la variable independiente y en el tercero, se selecciona las variables independientes no manipulables. En
los tres primeros tipos se procura controlar las variables extrañas. A partir de los resultados obtenidos en el experimento, se acepta la
hipótesis o se rechaza, con un nivel de error.
5º Con las conclusiones deducidas de los resultados, el científico formula los modelos o teorías que acogerán y sistematizarán el conjunto de
las relaciones que no han sido rechazadas en los experimentos, siempre con la asunción de un grado de riesgo de error.
7. PAPEL DE LA ESTADÍSTICA EN EL MÉTODO EXPERIMENTAL
Las dos primeras fases del método experimental son la observación y medición de los fenómenos y la inducción. Ya Aristóteles señalo que
la inducción incompleta no es nunca concluyente. Pero la inducción completa (observaciones de todos los objetos existentes en una <clase>) es
de hecho imposible. Por tanto, es necesario recoger muchas observaciones y mediciones de las variables involucradas en el fenómeno
estudiado y comprobar que en todas ellas aparece la relación entre dos variables, una independiente y otra dependiente. Sintetizar esos datos es
tarea de la Estadística Descriptiva.
Cuanto mayor sea el número de casos observados (muestra) en los que se cumple la relación (causa efecto, condicional…)
observada entre ambos variables, habrá más probabilidad de que se cumpla en todos los casos (población o universo). El salto desde la muestra
o muestras a la población es cometido de la Estadística Inferencial. El ideal del método científico es llegar a una función matemática (exacta o
probabilística) de una relación entre, al menos, dos variables.
La Estadística es indispensable en el desarrollo de las cuatro fases del método experimental.

a. Sirve para describir los grados de presentación de las variables en muestras.
b. Sirve para inducir la relación.
c. Sirve para la formulación de hipótesis.
d. Sirve para el diseño del experimento, del cuasi experimento o del proceso <ex post facto>, que pondrá a prueba las hipótesis principal y
alternativas.
e. Sirve para inferir la validación o <falsación> (término y concepto acuñado por Sir Karl Popper: demostrar que una proposición es falsa)
de los resultados obtenidos en una prueba experimental.

CUADRO Nº 2: NATURALEZA DE LA CIENCIA ESTADÍSTICA
1. ETIMOLOGÍA DE ESTADÍSTICA.
El matemático alemán Gottfried Aschenwall fue el primero en utilizar el término <statistik> con el significado de <Ciencia del Estado> <Ciencia
de los datos (poblacionales) del Estado>. <Statistik> procede de la palabra alemana <statt> que puede traducirse por <estado>.
Para otros, procedería del término latino: <statiscus> (lo relativo al <status>). <status> es participio pasivo del verbo<stare>, <estar parado>,
(tener una posición>). Un precedente sería el <statisculum Collegium> (Consejo de Estado) de la época imperial romana.
2. DEFINICIÓN
La Estadística, como rama de las Matemáticas, es una ciencia formal, estrechamente relacionada con la Teoría de la probabilidad. Es una
ciencia transversal e instrumental/auxiliar, pues sirve para investigar en muchas ciencias, desde la Física a las ciencias sociales y conductuales.
Estudia las grandes leyes que rigen el comportamiento de las grandes masas de datos que dependen de causas poco o nada conocidas e
incontrolables dada su complejidad de interacciones, pero que presentan ciertas regularidades. Emplea modelos de reducción de la información
y de análisis de validación de los resultados en términos de representatividad.
Escotet,(1973) define la Estadística con estas palabras:
<La estadística es la técnica que computa y enumera los hechos y los individuos susceptibles de enumerarse o de medirse; coordinar y
clasificar los datos obtenidos con el fin de determinar sus causas, consecuencias y tendencias>.
3. CLASIFICACIÓN DE LA ESTADÍSTICA.
Según el criterio adoptado, la estadística puede ser clasificada de distintas maneras. Los criterios clasificatorios son:
1) La función
2) Número de variables implicadas.
3) Modelo probabilístico.
4) Tipo de variables y escalas de medida.
a. POR LA FUNCIÓN:
1) Estadística descriptiva: busca describir por medio de cuatro tipos de índices que resuman y representen los valores obtenidos
en la aplicación de instrumentos de medida a una o a dos variables en una muestra. La estadística descriptiva se refiere sólo a los
datos observados, y comprende su tabulación, representación gráfica y descripción, a fin de hacerlos más manejables, pudiendo
así comprenderlos e interpretarlos mejor (Bisterra).
2) Estadística inferencial: busca obtener valores <parámetros> (valores estimados de las poblaciones) a partir de <estadísticos>
(valores obtenidos en muestras). La estadística inferencial alcanza conclusiones probabilísticas sobre las características de una
población a partir de los índices propios de los análisis de la Estadística Descriptiva.
Sin la Estadística Descriptiva es imposible la Estadística Inferencial. Por tanto, la primera tarea de toda análisis estadístico es el análisis de los
datos, o sea describir, por medio de ciertos índices, los resultados obtenidos tras la aplicación de una escala de medida a una o más variables en
una muestra. Con estos índices, es posible manejar los datos y facilitar los análisis propios de la estadística inferencial, la que hace posible la
comprobación de hipótesis, infiriendo los valores estimados en la población a partir de los datos obtenidos en las muestras supuestamente
incluidas en la población.
b. POR EL NÚMERO DE VARIABLES MEDIDAS SIMULTÁNEAMENTE A UN MISMO GRUPO DE SUJETOS:
1) Estadística univariable
Se refiere a una sola variable. Incluye básicamente las medidas de tendencia central, de variabilidad, de simetría y apuntalamiento.
2) Estadística bivariable
La estadística bivariable se refiere a las relaciones entre dos o más variables en una misma muestra: los coeficientes de correlación y de
asociación.
3) Estadística multivariable
Estadística multivariada es aquella que analiza simultáneamente más de dos variables, como por ejemplo la regresión múltiple, el análisis
multivariante o de la varianza, el análisis factorial, el análisis discriminante y la correlación canónica entre otros.
c. POR EL TIPO DE MODELO PROBABILÍSTICO QUE SUBYACE EN LAS VARIABLES:
1) Estadística paramétrica es aquella que puede aplicarse a variables que cumplen los supuestos de:
1) Normalidad: su distribución se ajusta a la curva normal.

2) Homocedasticidad (igualdad en la dispersión).
3) Linealidad
2) Estadística no paramétrica: la que opera con variables que no cumplen las tres condiciones anteriores.

d. POR EL TIPO DE VARIABLES Y LAS ESCALAS DE MEDIDA ADECUADAS A CADA TIPO:
1) Estadística de variables cualitativas/atributos, medidas en escala nominal.

2) Estadística de variables cuantitativas discretas, medidas en escala ordinal, o de intervalo.
3) Estadística de variables cuantitativas continuas, medidas por escalas de intervalo o de razón.
4. LA ESTADÍSTICA Y LAS CIENCIAS HUMANAS
Las variables de las ciencias de la conducta, la psicología y la psicopedagogía entre otras, generalmente son variables cuantitativas medidas
con escalas de intervalo, suponiendo una unidad constante entre dos puntuaciones consecutivas. Damos por hecho, en realidad es una
suposición, que la variable <fluencia verbal>, cuando es medida por un test de fluencia verbal, tiene una unidad constante, que entre un par de
puntuaciones consecutivas hay la misma diferencia que entre otro par de valores correlativos.
5. UNA PERSPECTIVA SINÓPTICA DE LA ESTADÍSTICA DESCRIPTIVA
A continuación se ofrece una <visión panorámica>, no muy detallada, de los contenidos de la estadística descriptiva. En este momento tal
cúmulo de datos puede resultar abrumador, sin embargo también permite contemplar la posición de un análisis en el conjunto. Creemos que será
posible, si se desea, regresar a ella para situar cualquier <pieza> del <puzzle> de la Estadística en el lugar adecuado.

ESTADÍSTICA Nº DE VARIABLES TIPO DE ÍNDICES NOMBRE DE
LOS ÍNDICES
ESTADÍSTICA MUESTRAS DE MODA

DESCRIPTIVA UNA VARIABLE
MEDIANA
MEDIA
ARITMÉTICA
DE TENDENCIA MEDIA
CENTRAL GEOMÉTRICA
MEDIA
CUADRÁTICA
MEDIA
ARMÓNICA
AMPLITUD
RECORRIDO
DESVIACIÓN
MEDIA
DE VARIABILIDAD VARIANZA
O DISPERSIÓN
DESVIACION
ESTANDAR
COEDIFICIENTE
DE VARIACIÓN
DE ASIMETRÍA ÍNDICE DE
SIMETRÍA
DE
APUNTAMIENTO ÍNDICE DE
APUNTAMIENTO O
CURTOSIS
MUESTRAS COEFICIENTES DE COEFICIENTES

CORRELACIÓN DE CORRELACIÓN
DE DOS
ENTRE VARIABLES LINEAL DE
VARIABLES
CUANTITATIVAS PEARSON
CONTIUAS EN
ESCALA DE
INTERVALO O DE
RAZÓN.
COEFICIENTE S COEFICIENTE
DE CORRELACIÓN <r> (RRO)DE
ENTRE VARIABLES CORRELACIÓN
CUANTITATIVAS ORDINAL SPEARMAN
DISCRETAS, EN COEFICIENTE RRO
ESCALA ORDINAL
COEFICIENTE
< t > (tau) de
KENDALL
REGRESIÓN
LINEAL REGRESIÓN
LINEAL
COEFICIENTE DE COEFICIENTE <h>

CORRELACIÓN NO
LINEAL
CORRELACIÓN Coeficiente
ENTRE VARIABLE biserial puntual
NOMINAL Y
VARIABLS
CUANTITATIVA
CONTINUA O
DISCRETA
CORRELACIÓN Coeficiente biserial

ENTRE VARIABLES
CUANTITATIVAS
CONTINUAS UNA DE
ELLAS
DICOTOMIZADA
COEFICIENTES DE Coeficiente <f>

ASOCIACIÓN ENTRE
VARIABLES Coeficiente <c2>
CUALITATIVAS coeficiente <C>

Coeficiente <T> de
Tchuprow
Coeficiente <V> de
Cramer
Coeficiente <Q> de
Yule
Coeficiente <w>
Coeficiente
tetracórico
MÁS DE DOS CORRELACIÓN

VARIABLES PARCIAL
CUANTITATIVAS
CONTINUAS
CORRELACIÓN
MÚLTIPLE

CUADRO Nº 3: TIPOS DE VARIABLES Y ESCALAS DE MEDIDA
1. CARACTERÍSTICAS DE LOS OBJETOS: CONSTANTES Y VARIABLES
Todas las características/propiedades perceptibles por los sentidos en los objetos (color, tamaño, fuerza, velocidad, …), con o sin
instrumentos de aumento, son de dos tipos:
a. Constantes
b. Variables.
2. LAS CONSTANTES
Unas características de los objetos, no presentan grados, ni modalidades/categorías, sino que, en todos los casos muestran un valor
constante presentan un valor constante. Estas constantes son propias de las matemáticas y de la física. Ejemplo de estas constantes son:
a. La relación entre el diámetro y la longitud de la circunferencia

 (3.1416…).
b. La, constante de gravitación (G=6.6725).
c. La constante de Faraday (F=96485.30.).
d. La constante de Plank (h=6.626).
e. La velocidad de la luz (c=300 000 km./seg),…
3. LAS VARIABLES
Por el contrario, las variables son aquellas características/propiedades de los objetos que son perceptibles por los sentidos, con o sin
instrumentos de aumento, y que pueden presentarse en más de una modalidad o grado. Ejemplos de ellas son:
a. La masa de un cuerpo.
b. El número de hijos.
c. La cantidad de palabras retenidas tras medio minuto.
d. El estado civil de las personas.
e. El número de pulsaciones cardíacas por minuto.
f. El volumen de la cavidad craneal.
Como puede verse, estas variables son de muy distintos tipos. Vamos a clasificarlas.
4. TIPOS DE VARIABLES
Las variables pueden ser clasificadas en:
1) Variables cualitativas:
Dicotómicas (sólo dos modalidades)
Policotómicas (más de dos modalidades)
II) variables cuantitativas:
a) Variables cuantitativas discretas.
b) Variables cuantitativas continuas.
5. VARIABLES CUALITATIVAS
Las variables cualitativas también reciben el nombre de: atributos. Son siempre nombres substantivos, no números.
Cualquier variable cualitativa puede presentarse, en dos o más modalidades o categorías excluyentes y, en conjunto, exhaustivas. No admiten
grados, no hay mayor o menor, no hay puntuaciones, sólo nombres. Pueden ser agrupados los objetos que tienen la misma modalidad de la
misma variable.
Ejemplos de variables cualitativas son:

1) Variables cualitativas dicotómicas:
a. El sexo anatómico: <varón< y <hembra> (

b. Ser propietario de un BMW: <SÍ> y <NO>.
2) Variables cualitativas policotómicas:
a. Estado civil: <soltero>, <casado>, <viudo>,<separado legalmente>, <separado de derecho> y <pareja de hecho>.
b. Tipo sanguíneo: <0>, <A>, y <AB>
c. Color del cabello: <negro>, <castaño>, <rubio> y <pelirrojo>
6. VARIABLES CUANTITATIVAS DISCRETAS Y CONTINUAS
Las variables cuantitativas son características que poseen los objetos y que se presentan con grados y necesariamente tienen que
expresarse con números. Las variables cuantitativas son de dos tipos: discretas y continuas.
1) Las variables cuantitativas discretas son aquellas variables cuantitativas que únicamente admiten valores numéricos enteros.

Los valores de las variables cuantitativas discretas, como las variables cualitativas, son resultados de <contar>, no de <medir> en
sentido vulgar.
Ejemplos de variables cuantitativas discretas son:

a. Número de hermanos de una familia.
b. Número de alumnos del aula.
2) Las variables cuantitativas continuas son aquellas variables cuantitativas que admiten valores intermedios entre dos valores
numéricos enteros.
Ejemplos e variables cuantitativas continuas son:
a. La estatura.
b. La velocidad.
c. Tiempo de reacción.
7. LA MEDIDA
Medir es la asignación de signos numéricos a objetos o aspectos/propiedades/características de objetos por medio de ciertas reglas de
asignación de números conocidas como escalas.
El sistema formal de los signos numéricos consiste en un conjunto de definiciones y postulados, de los que se derivan los teoremas y las
conclusiones del campo del álgebra.
El sistema empírico al que se van asignar lo signos numéricos es, en nuestro campo, la conducta humana y las conductas de aprendizaje
especialmente. Las reglas para poder establecer las correspondencias entre sistema formal de los signos numéricos, o sea de la matemática, y el
correspondiente sistema empírico (la conducta humana), depende, por una parte de las reglas siguientes: la de igualdad, la de orden, la de
igualdad de diferencias y la de igualdad de razones. En la medida en que estas operaciones matemáticas pueden realizarse con los objetos
empíricos, la conducta humana, se podrán aplicar esos números.
8. RELACIÓN ENTRE VARIABLES Y ESCALAS DE MEDIDA
Según sea la naturaleza de la variable (cualitativa, cuantitativa discreta o cuantitativa continua), las escalas posibles son cuatro:
a. ESCALA NOMINAL
b. ESCALA ORDINAL
c. ESCALA DE INTERVALOS
d. ESCALA DE RAZÓN.
Existe una relación, no biunívoca, entre las variables y las escalas de medida. Según sea el tipo de variable, así serán los tipos de escala de
medida que puede utilizarse para medir la variable.
a. LA ESCALA NOMINAL
La escala nominal se aplica a las variables cualitativas/atributos, si bien los distintos grados de las variables cuantitativas continuas podrían
ser convencionalmente agrupados como si fueran modalidades de una variable cualitativa.
LA ESCALA ORDINAL
Las escalas ordinales se aplican a variables cualitativas, a variables cuantitativas discretas y, de algún modo transformando las cuantitativas
continuas. Atribuyen valores numéricos ordinales (rangos) a los distintos valores de las puntuaciones en una serie creciente o decreciente de
valores.
b. LA ESCALA DE INTERVALO
Las escalas de intervalo atribuyen valores numéricos cardinales, sitúan a cada sujeto en un continuo de valores numéricos correlativos, entre
los cuales es posible intercalar infinitos números fraccionarios, si bien con unidades constantes, o sea, mantienen la igualdad de diferencias
entre pares de valores correlativos.
Las variables cuantitativas continuas pueden ser medidas con una escala de intervalo, pero solamente algunas de ellas, también con una
escala de razón.
c. LA ESCALA DE RAZÓN:
Las escalas de razón son también escalas de intervalo, si bien añaden la propiedad de poder establecer razones entre parejas de
puntuaciones. La causa reside en que las variables que pueden ser medidas con escala de razón tienen ausencia total de la variable. Variables
susceptibles de ser medidas con escala de razón suelen ser variables propias de la Física, tales como: masa, edad, longitud, escala <Kelvin> de
temperatura, velocidad…
Si un sujeto mide 160 cm y el otro mide 80 cm, podremos decir justificadamente que el primero de ellos tiene una estatura doble que la
estatura del segundo. Sin embargo, si en lugar de medir la estatura, midiéramos la temperatura con la escala Celsius nunca podríamos afirmar
que un objeto con 80 grados tiene doble cantidad de calor que un cuerpo con 40 grados.

TIPOS DE TIPOS DE ESCALAS
VARIABLES
Nominal Ordinal Intervalo
Cualitativas Si No No
Cuantitativas Si Si No Resumiendo en la siguiente tabla las relaciones entre variables y escalas de

discretas medida:
Cuantitativas No No (*) Si
continuas
(*): Se pierde precisión pero nada impide ordenar en una serie de rangos
datos cuantitativos continuos.

CUADRO Nº 4: VARIABLES CUALITATIVAS Y LA ESCALA NOMINAL
1. DESIGNACIÓN DE LAS MODALIDADES DE CADA ATRIBUTO
Las escalas nominales se aplican a las variables cualitativas/atributos. Como los atributos se presentan en dos o más modalidades o
categorías, las escalas nominales siguen la siguiente regla: asignar un solo nombre, cifra o signo distinto a cada una de las
categorías/modalidades que presenta el atributo. Lo habitual es asignar a cada modalidad un nombre o un adjetivo calificativo.
También puede utilizarse cifras para designar a cada modalidad, si bien las cifras, en este caso, no poseen valor cuantitativo, sino que
funcionan como simples signos arbitrarios. Por ejemplo, en el atributo <sexo anatómico>, las modalidades posibles son: <varón> y <mujer>,
podemos designarlas con cifras, por ejemplo, asignar un <1> a <mujer> y un <2>a <varón> o al contrario. Con esta convención, mientras se
mantuviera la relación biunívoca (cifra/número y categoría/modalidad). Como son simples signos carentes de valor numérico, no es posible
realizar operaciones aritméticas con ellos.
2. EXCLUSIVIDAD Y EXHAUSTIVIDAD DE LAS MODALIDADES DE UN ATRIBUTO

Estas categorías o modalidades están sujetas a las leyes de la exclusividad y de la exhaustividad:
Por la primera, un sujeto no puede ser situado simultáneamente en dos modalidades distintas de un mismo atributo. Dicho de otro modo: cada
sujeto únicamente puede ser situado en una sola categoría/modalidad y en ninguna otra.
Por la segunda ley, al menos, una modalidad debería acoger a cualquier sujeto susceptible de portar el atributo, que pudiera ser incluido en
una u otra de las modalidades o categorías de dicho atributo. No siempre es fácil dividir un atributo en un número exhaustivo de categorías.
Pongamos un ejemplo: en una ciudad viven muchos inmigrantes procedentes de varias naciones. De algunas nacionalidades abundan muchos
ciudadanos, pero otras nacionalidades están representadas por una o dos personas. Así podríamos dividir el atributo <extranjeros que viven en
esa ciudad>, en las siguientes modalidades: <marroquíes>, <rumanos>, <ecuatorianos>, <colombianos>, <bolivianos> y <otros>. Nos podían
preguntar por qué hay una categoría llamada <otros>. La explicación es muy sencilla: viven en dicha ciudad un argentino, un mexicano, dos
franceses y un británico. Es más sencillo manejar seis modalidades o categorías que nueve: las cinco primeras y las cuatro últimas; englobando
estas cuatro en la modalidad <otros>, tal vez se pierde precisión, pero se gana en claridad y brevedad si, como suponemos, queremos dar una
idea general de la distribución de la inmigración en la ciudad. Supongamos que son 60 los marroquíes, 55 los rumanos, 30 los ecuatorianos, 27
los colombianos, 19 los bolivianos, y los otros son sólo 10 inmigrantes de cuatro nacionalidades distintas, de poco peso en el conjunto de
inmigrantes residentes en la ciudad.
3. ¿QUÉ PUEDE HACER LA ESTADÍSTICA CON LOS ATRIBUTOS?

Solamente:
a. IDENTIFICACIÓN Y PERTENENCIA
Toda variable cualitativa, o sea, un atributo, debe presentar dos o más modalidades y que estas modalidades sean identificables en cada
sujeto que porta el atributo.
b. IGUALDAD O DESIGUALDAD
Tras esta identificación, se pueda establecer la igualdad o desigualdad entre la modalidad que el sujeto presenta en una variable
cualitativa/atributo, y la modalidad que otro sujeto presenta en esa misma variable cualitativa/atributo. En acción se pueda establecer la igualdad
o desigualdad entre la modalidad que el sujeto presenta en una característica cualitativa/atributo, y la modalidad que otro sujeto presenta en esa
misma característica, variable cualitativa/atributo.
Los símbolos matemáticos serían: <<≠>
c. FORMACIÓN DE SUBGRUPOS
Cuando se ha concluido la identificación de las modalidades que los distintos sujetos del grupo presentan en una concreta variable cualitativa,
puede o no formarse subgrupos. No se formará ningún subgrupo si todos los sujetos coinciden en poseer la misma modalidad. Si, por el
contrario, hay sujetos que presentan distintas modalidades de la misma variable cualitativa, se podrán formar dos o más subgrupos, tantos como
modalidades con algún sujeto.
d. CONTAR LOS SUJETOS QUE PRESENTAN LA MISMA MODALIDAD DE UN MISMO ATRIBUTO
Simplemente contando el número de sujetos que presenta cada una de las modalidades de la misma variable cualitativa/atributo, se cuentan
los sujetos.
e. COMPARAR EL NÚMERO DE SUJETOS DE CADA SUBGRUPO CON LOS DE LOS DEMÁS
Es posible comparar los números obtenidos por cada subgrupo. La suma de los sujetos que presenta cada subgrupo es igual al número de
sujetos que forman el grupo
f. ORDENAR LOS SUBGRUPOS POR EL NÚMERO DE SUJETOS DE CADA UNO
Ordenar de mayor a menor o de menor a mayor los subgrupos según el números de sujetos de cada modalidad. Cabe ordenar los subgrupos
de mayor a menor o viceversa.

g. RELACIONES ENTRE EL NÚMERO DE SUJETOS DE CADA SUBGRUPO, CON EL NÚMERO DE SUJETOS DEL GRUPO TOTAL
Comparar el número de sujetos de cada una de las modalidades del atributo, con lo que conducirá a hallar la igualdad o la no igualdad entre
los números de sujetos de cada modalidad con los de las demás modalidades.
4. POSIBLES OPERACIONES ARITMÉTICAS

Además de distinguir la igualdad o desigualdad entre los sujetos respecto a las modalidades que porta cada uno de ellos en el campo de un
atributo y de contar cuántos sujetos presentan la misma modalidad, es posible: sumar restar y dividir entre sí los números de cada modalidad.
Ejemplos con los datos de los inmigrantes:
Sumar: Número de inmigrantes hispanoamericanos=número de inmigrantes ecuatorianos + número de inmigrantes colombianos + número de
inmigrantes bolivianos=30+27+19=76 inmigrantes hispanoamericanos.
Restar: número de inmigrantes hispanoamericanos-número de inmigrantes colombianos=76-27=49
Dividir: ==2 (Hay doble número de inmigrantes marroquíes que de inmigrantes colombianos).
5. PROPORCIONES Y PORCENTAJES
Supongamos que los sujetos que componen el grupo son cincuenta; de ellos, 17 tienen ojos marrones, 18 negros, 3 verdes y 12 azules. Con
esos datos, podríamos determinar las proporciones y los porcentajes. La <proporción> de un subgrupo es el cociente de dividir el número de
sujetos del subgrupo entre el número total de sujetos del grupo. Si a la proporción de un grupo la multiplicamos por 100, tendremos el
<porcentaje>. Por ejemplo, si la frecuencia de un subgrupo es 15 y el número total de sujetos del grupo es 60, la proporción es 15/60 (0,25); y el
porcentaje será 25%.
De la relación que un subgrupo tiene con su grupo, podemos hallar las proporciones y los porcentajes. La proporción es el cociente de dividir
el número de sujetos e un subgrupo entre el número total de sujetos de todo el grupo.
El porcentaje resulta de multiplicar el valor numérico de la proporción por 100
Ejemplo:
Proporción es el número de casos de un valor numérico por cada caso de total. O sea, frecuencia de un valor dividido entre la frecuencia total.
Porcentaje es el resultado de multiplicar una proporción por 100
Ejemplos:
Tabla de frecuencias, proporciones y porcentajes de número de sujetos de la modalidad <varones> y de la modalidad <mujeres> de variable
cualitativas/atributos: <sexo anatómico>.
MODALIDAD FRECUENCIA PROPORCIÓN PORCENTAJE
VARONES 20 20/60=0.33333 33.333 %
MUJERES 40 40/60=0.66666 66.666 %
TOTALES 60 0.999999=1 99.999=100 %

CUADRO Nº 5: VARIABLES CUANTITATIVAS DISCRETAS Y ESCALAS ORDINALES
1. VARIABLES CUANTITATIVAS DISCRETAS
Recordamos que las variables cuantitativas discretas son aquellas características a las que únicamente el grado de presencia puede ser
expresado por números enteros, no admiten fracciones. El número de hijos de una familia en todos los casos será un número entero: tres hijos,
un hijo, seis,…cero hijos. Pero nunca es posible que una familia tiene dos hijos y medio, o 5,3 hijos. Si tenemos, por ejemplo, cuatro familias, y
atendemos a la variable <número de hijos>, podemos encontrarnos que una o más de una tienen el mismo nº de hijos o números diferentes. Con
esos datos, se puede sumarlos todos o sólo algunos o hallar la diferencia entre dos valores (cuántos hijos tiene Juan más que José). Las
variables cuantitativas discretas se asemejan a las variables cualitativas/atributos, porque los valores se obtienen por conteo, como en las
modalidades de la variable cualitativa. Sin embargo existe una diferencia: las modalidades de las variables cualitativas no pueden ser
legítimamente ordenadas en una serie numérica (la variable <color de los ojos> presenta cinco modalidades: negro, castaño, azul, verde y gris),
no pueden ser ordenados pues no hay justificación matemática para afirmar que los ojos negros sean superiores a los ojos azules, a los verdes,…
Tal vez sea distinto en el campo de las preferencias estéticas de las personas. Eso sí, el número de sujetos de cada modalidad de la misma
variable pueden ser ordenados. Veamos el siguiente cuadro:
Cuadro de número de sujetos que pertenecen a cada modalidad de una variable cualitativa
VARIABLE MODALIDAD Nº DE SUJETOS
Negro 12
Color de
Los ojos
Castaño 15
Azul 9
Verde 4
Gris 10
Total = 50
Del mismo modo, las variables cuantitativas discretas ofrecen valores que pueden ser contados, comparados, agrupados por
frecuencias, ser presentados en una tabla de distribución de frecuencias: pueden ser medidos con una escala nominal.
Pero, además, las variables cuantitativas discretas pueden ser medidas con una escala ordinal, pues los valores numéricos que
toman pueden ser ordenados en series crecientes o decrecientes.
Por ejemplo: según el número de familias con 0, 1, 2, 3, 4, 5, 6, 7 y 8 hijos en una pequeña localidad, tendríamos la siguiente tabla de
distribución de frecuencias:
Número de hijos Frecuencia
0 6
1 32
2 61
3 18
4 7
5 8
6 1
7 1
8 1
N = 135
También, como decimos, pueden ordenarse en una serie creciente o decreciente, asignando a cada frecuencia un rango. Siguiendo con el
ejemplo anterior de las 135 familias, tendríamos las siguientes operaciones:
1º) Ordenamos las frecuencias de mayor a menor.

2º) Las asignamos rangos: la familia más frecuente (61) es la que tiene <dos hijos>; se le asigna el rango 1º. La que ocupa el siguiente rango es
la que solo tiene <un hijo>, pues hay 32 que tienen esa composición. La que ocupa el tercer rango es la familia que tiene <tres hijos>, pues 18
familias con esa prole… Veamos la tabla:
FRECUENCIAS RANGOS Nº DE HIJOS DE

(NÚMERO DE FAMILIAS CADA FAMILIA
CON EL MISMO NÚMERO
DE HIJOS)
61 1º 2 hijos
32 2º 1 HIJO
18 3º 3 HIJOS
8 4º 5 HIJOS
7 5º 1 HIJO
6 6º 0 HIJOS
1 7º 6 HIJOS
1 8º 7 HIJOS
1 9º 8 HIJOS
Las variables cuantitativas discretas no pueden ser medidas con la escala de intervalo o de razón, reservadas para todas las variables
cuantitativas continuas o sólo para algunas respectivamente.
2. ESCALA ORDINAL
Las escalas ordinales sitúan los individuos en una serie ordenada creciente o decreciente según los valores que presenta cada individuo en
una determinada variable; el puesto que ocupa cada individuo se denomina <rango>. Las series numéricas de una escala ordinal (primero,
segundo, tercero, cuarto…) son distintas a las series numéricas de una escala de valores cardinales (1, 2, 3, 4,…n). La ordenación depende de
cuatro operaciones:
a. La igualdad/desigualdad.
b. Ser mayor y menor.
c. La seriación y asignación de rangos, manteniendo una relación biunívoca entre números cardinales ordenados de mayor a menor (o
viceversa) y los rangos.
La escala ordinal puede aplicarse a variables cuantitativas discretas y a variables cuantitativas continuas, si bien en este último caso,
se pierde información. No puede aplicarse a variables cualitativas/atributos, que únicamente admite la aplicación de la escala nominal.
No es posible realizar ninguna operación aritmética con rangos de una serie ordinal. No tiene sentido sumar: tercero, sexto y séptimo,
pero si es posible determinar la distancia existente entre parejas de de rangos.
Veamos un ejemplo de aplicación de la escala ordinal a una variable cuantitativa discreta:
Si cinco especialidades de un Conservatorio tienen distinto número de alumnos, podemos ordenarlas en una serie de rangos, de mayor a
menor número de alumnos. He aquí su tabla:
NÚMERO DE ALUMNOS RANGO ASIGNADO ÁREA CURRICULAR

DE CADA ESPECIALIDAD
38 1º Solfeo
20 2º Violín
18 3º Clarinete
12 4º Trompeta
9 5º Percusión
Los índices estadísticos aplicables a datos expresados en escala ordinal son la <mediana> entre los índices de tendencia central y la
<amplitud> entre los índices de variabilidad.
Como hemos dicho, también las variables cuantitativas continuas, como la estatura humana, pueden ser legítimamente medidas por una
escala ordinal. Veamos un ejemplo:
Cinco jóvenes (Rogelio, Jorge, Alberto, Severo y Nicolás) miden respectivamente: 1,70 m., 1.59 m, 1.89 m, 1.67 m y 1.61 cm. Si los ordenamos
de mayor a menor, tendríamos la siguiente tabla:
ESTATURA EN METROS. RANGO INDIVIDUO
1.89 1º Alberto
1.70 2º Rogelio
1.67 3º Severo
1.61 4º Nicolás
1.59 5º Jorge

CUADRO Nº 6. VARIABLES CUANTITATIVAS CONTINUAS Y LAS ESCALA DE
INTERVALO Y DE RAZÓN
1. VARIABLES CUANTITATIVAS CONTINUAS Y LAS ESCALAS DE INTERVALO Y DE RAZÓN
Como ya se expuso en el <cuadro> número 3º, las variables cuantitativas continuas son aquellas variables que admiten fracciones entre
números enteros consecutivos. Ejemplos son: la longitud, la masa, la velocidad, el cociente intelectual,…Para medir este tipo de variables,
disponemos de las escalas de intervalo y de razón.
La escala de intervalo se aplica a la medición de todas las variables cuantitativas continuas, si bien algunas de ellas también pueden ser
medidas por una escala de razón. Así mismo, como vimos en el cuadro número 5º, pueden ser medidas por una escala ordinal.
En las escalas de intervalo es posible determinar:

1º) La igualdad/desigualdad entre los valores que presentan las puntuaciones.
2º) El orden: pueden ser comparados. Si son distintos, podrán ser ordenados en una serie creciente o decreciente.
3º) La igualdad de diferencias: entre cada dos valores consecutivos hay la misma diferencia que entre cualquier otra pareja de valores
consecutivos (por ejemplo, la diferencia entre 17 y 18 es la misma que entre 31 y 32), lo que significa que esa variable dispone de unidad
constante, Las escalas de intervalo no tienen cero absoluto. Si lo tuvieran ya no estaríamos hablando de escalas de intervalo, sino de escalas de
razón.
4º) Carece de igualdad entre razones. Por ello no es aceptable afirmar que un sujeto que tiene un coeficiente intelectual de 120 tiene doble
inteligencia que otro sujeto cuyo coeficiente intelectual sea de 60. Si, por el contrario 120 y 60 fueran centímetros de estatura, estaría justificado
afirmar que el primero tiene doble estatura que el segundo. No sería correcto afirmar que un objeto con 80 grados centígrados tiene doble
temperatura que un objeto con 40 grados centígrados, pues la escala Celsius no tiene cero absoluto.
En ocasiones, por simplificar los cálculos, datos de variables cuantitativas continuas, como p.e. la estatura, son tratados como si fueran de
una variable cualitativa. Si hubiéramos medido la estatura de 60 jóvenes, podríamos agrupar las puntuaciones obtenidas (160 cm., 184 cm….) en
tres categorías: <baja estatura>, <media estatura> y <alta estatura>. Necesariamente habría que marcar el umbral y el dintel de cada una de esas
modalidades. Por ejemplo, <media estatura> estaría entre 1.60 y 1.75,si así lo convenimos. Considera a la estatura de este modo supone una
depreciación de la precisión de los datos, pero puede servir para presentarlos de una manera más fácilmente operable.
2. LAS ESCALAS DE RAZÓN
Algunas variables cuantitativas continuas pueden ser medidas por una escala de intervalo o por una escala de razón. Por ejemplo: la escala
Celsius o centígrada de temperatura no tiene cero absoluto, sino que existen magnitudes de la variable que se presenta como <negativas> (-3
grados). En cambio, la escala Kelvin de temperatura sí tiene 0 absoluto. Otras variables con 0 absoluto son: la altura, la masa…, variables propias
de la Física o la Química, pero las variables en Psicología o Psicopedagogía (por ejemplo, el cociente intelectual) no pueden ser medidas con una
escala de razón, sino sólo por una escala de intervalo.
Las escalas de razón son aquellas que:

1. Distinguen la igualdad/desigualdad entre puntuaciones.
2. Ordenan las puntuaciones en una serie ascendente o descendente.
3. Mantienen la igualdad de diferencias entre valores consecutivos (o sea, con unidad constante).
4. Poseen la propiedad de la igualdad entre razones, lo que supone que la concreta variable cuantitativa continua medida tiene 0
absoluto. El ejemplo de estas variables cuantitativas continuas que posee el cero absoluto es la longitud. Si el objeto <A> mide 40
cm y el objeto , 20 cm, es completamente correcto afirmar que el objeto <A> mide el doble que el objeto .
Por el contrario, otras variables cuantitativas continuas no tienen 0 absoluto, por lo que no pueden ser medidas con una escala de
razón, como ya se expuso en la anterior sección.
Las variables propias de la conducta, objeto de estudio de la psicología y de la psicopedagogía, muy raramente y con matices, podrían
considerarse aptas para ser medida con una escala de razón. Las variables conductuales generalmente son medidas con escalas de intervalo y,
con pérdida de información, por escalas ordinales e, incluso, por escalas nominales.
CUADRO RESUMEN DE LAS OPERACIONES ARITMÉTICAS POSIBLES SEGÚN EL TIPO DE ESCALA
ESCALAS VARIABLES OPERACIONES ARITMÉTICAS POSIBLES CON ESTE TIPO DE ESCALA
NOMINAL CUALITATIVA Igualdad ( = ), desigualdad (
ORDINAL CUANTITATIVA Igual ( =) , desigual (

DISCRETA
DE CUANTITATIVA igualdad ( =), desigualdad (≠) ).

INTERVALO
CONTINUA
SIN VALOR
ABSOLUTO
DE CUANTITATIVA Todas las operaciones válidas para la escala de intervalo más la igualdad de razones. Se aplica a variables cuantitativas continuas que cuentan con <
RAZÓN cero absoluto>.
CONTINUA
CON VALOR
ABSOLUTO

CUADRO Nº 7: CONCEPTOS BÁSICOS EN ESTADÍSTICA
En Estadística, como en otras ciencias, se utiliza una serie de conceptos (con sus correspondientes símbolos) que, si no son bien
comprendidos, sería muy difícil avanzar con paso seguro en el desarrollo de los análisis estadísticos descriptivos o inferenciales.
Ya conocemos el significado de los siguientes conceptos, expuestos en los cuadros precedentes: medida, característica, constante, variables
cualitativas/atributos, y sus modalidad/categoría, variables cuantitativas discretas con sus series y rangos, variables cuantitativas continuas
con sus valores y las cuatro escalas de medida: nominal, ordinal, de intervalo y de razón. Por ello, en este cuadro no se hacen referencias a esos
conceptos.
Los conceptos estadísticos que en este cuadro presentamos son:
INDIVIDUO: Cada uno de las unidades de un grupo. Cuando los individuos son seres humanos reciben el nombre de <sujetos>.
GRUPO: conjunto de individuos a los que se les ha aplicado un instrumento de medida sobre un determinado atributo o variable.
MUESTRA: grupo de individuo (extraído de una población) y cuyos individuos han sido objeto de observación o medida en alguna de las
variables que portan.
POBLACIÓN O UNIVERSO: colectivo de todos los individuos que presentan una característica común, y que por su amplitud, extensión o
dificultad de aplicación de un instrumento de medida, no pueden ser sometidos a observación o a medida en ninguna de sus variables; incluye a
todas las muestras que puedan extraerse de la población.
NÚMERO DE CASOS: número de mediciones de una variable en una muestra, o sea, número de individuos de una muestra que han sido
observados o medidos en alguna de sus variables.
FRECUENCIA: número de individuos que han obtenido el mismo valor (p. e. , una puntuación) en la aplicación del mismo instrumento de
medida sobre la misma variable.
VALOR: Cada uno de los posibles grados o modalidades que puede presentar una variable. Por ejemplo, la puntuación <cinco> (5) obtenible
en una escala del 1 al 10
PUNTUACIÓN: grado de posesión de una determinada variable cuantitativa.
PUNTUACIÓN DIRECTA.- (X, x mayúscula): Puntuación obtenida por un individuo tras serle aplicado un instrumento de medid a una de sus
variables cuantitativas.
PUNTUACIÓN DIFERENCIAL.- (x, x minúscula): es la diferencia entre la puntuación directa, la obtenida por un individuo en una de sus
variables cuantitativas continuas y el valor de la media aritmética de la muestra que incluye al individuo.
PUNTUACIÓN ESTÁNDAR.- (z, z minúscula): es el cociente de dividir la puntuación diferencial (x) entre la desviación estándar (S).
ESTADÍSTICO.- El valor numérico resultante del cálculo de un estadígrafo (índices de tendencia central, de variabilidad, simetría, y
apuntamiento, de correlación, de asociación de la estadística descriptiva o de pruebas y contrastes de la estadística inferencial) de una muestra a
partir de las puntuaciones obtenido por la aplicación de una de las cuatro escalas de medida a una, dos o más variables de los individuos que
constituyen una muestra. Sus símbolos son letras del alfabeto latino (X, x, z, S, Mo, Md, r xy salvo en algunos coeficientes de correlación o de
asociación representados por letras del alfabeto griego (r, c, t, w, f ...). También algunos autores sustituyen el símbolo de la desviación
estándar/típica <S> del alfabeto latino, por la letra griega <s> (letra <sigma> minúscula). Nosotros designamos la desviación estándar con una
<S> (una S mayúscula).
PARÁMETRO: valor representativo de una población. Por definición no puede hallarse, pero sí estimarse. Es desconocido, pues, por muy
grande que sea el número de individuos observados o medidos, siempre será una muestra, no una población; La estimación de un parámetro se
realiza a partir del valor de uno o más estadísticos obtenidos por la aplicación de un instrumento de medida sobre una variable a grupos de
individuos (muestras) extraídas de la concreta población. El cálculo de parámetros incumbe a la estadística inferencial, no a la descriptiva. Sus
símbolos suelen ser, en casi todos los casos, letras del alfabeto griego: s, m, ...
FÓRMULA: Ecuación que indica las operaciones matemáticas, generalmente aritméticas, que deberán ser efectuadas para hallar el valor
numérico de un índice descriptivo o inferencial.
SÍMBOLO: cada uno de los signos (operadores o variables) que forman parte de una fórmula.
INTERVALO: grupos de 3, 4, 5, 6, o 7 valores consecutivos que resultan de dividir el número de valores que pueden tomar las puntuaciones,
entre 4, 5, 6, 7, 8 o 9 y, de este modo simplificar los cálculos.

CUADRO Nº 8: SÍMBOLOS USADOS EN ESTADÍSTICA DESCRIPTIVA
Conviene advertir a los lectores de este libro que la relación de los símbolos estadísticos, que a continuación se ofrece, son presentados en
este <cuadro> con la única finalidad de que puedan ser consultados por el lector si lo creyera necesario más adelante.
Todos los conceptos matemáticos pueden representarse por medio de símbolos. La estadística, una rama de las matemáticas, no iba a ser una
excepción. Por supuesto que se cumple la regla de la relación biunívoca entre cada símbolo y el concepto representado: a cada concepto le
corresponde uno y sólo uno de los símbolos y que a cada símbolo le corresponde uno y sólo uno de los conceptos.
Las fórmulas utilizadas para el cálculo de los valores numéricos de los distintos índices estadísticos, están formadas por símbolos
procedentes de los alfabetos latino y griego.
En principio puede decirse que los símbolos que son letras del alfabeto latino, casi exclusivamente son propios de la estadística descriptiva
(que utiliza una única muestra) y los símbolos que son letras del alfabeto griego son utilizados casi exclusivamente, en la estadística inferencial.
Limitándonos en este <cuadro> a los símbolos de la Estadística descriptiva, encontramos:
LETRAS LATINAS
X: (x mayúscula) Puntuación directa obtenida tras la aplicación de una prueba a un sujeto. Otros autores prefieren Xi (X mayúscula con una 
minúscula como subíndice)
Xj (X mayúscula con una <j> como subíndice): puntuación media de un intervalo. En otros textos también se ve los símbolo Xm o Xi.
x: (x minúscula): puntuación diferencial resultante de hallar la diferencia entre una puntuación directa (X) y la media aritmética ( ) de la muestra
a la que pertenece el individuo.
f (f minúscula): frecuencia (número de individuos que han obtenido la misma modalidad cualitativa en una observación o el mismo valor
cuantitativo en una puntuación o en un intervalo (agrupación de 3 a 7 valores consecutivo).
n (n minúscula): número total de individuos (sujetos si son seres humanos) o suma de todas las frecuencias de todos los valores o de todos
los intervalos de una muestra. Algunos autores sustituyen la<n> minúscula por una <N> (n mayúscula) siempre o sólo en algunos casos.
Mo: moda, valor que presenta la mayor frecuencia en una distribución.
Md: mediana, valor que ocupa el punto medio de una distribución de valores, o sea, el valor que deja por encima y por bajo el mismo número
de valores.
(X mayúscula con una línea recta horizontal sobre la X): media aritmética.
Xg: media geométrica.
Xa: media armónica.
Xc: media cuadrática.
A: (A mayúscula) amplitud o recorrido de un conjunto de puntuaciones. Es la diferencia entre la puntuación más alta y la puntuación más baja
de una serie ordenada +1.
S2 (S mayúscula con un 2 como índice de potenciación o sea, el valor de S elevado al cuadrado): varianza: media de los cuadrados de las
puntuaciones diferenciales. O sea: cuadrado de S (desviación estándar).
S o SD (S mayúscula o S y D mayúsculas): Desviación estándar: raíz cuadrada de la varianza.
rxy (r minúscula con una x y una y pequeñas como subíndices): coeficiente de correlación de Pearson.
R: (R mayúscula) rango, posición de una puntuación en una serie creciente o decreciente de puntuaciones.
W: (W mayúscula) coeficiente de concordancia de Kendall.
C: (C mayúscula) coeficiente de contingencia.
Q: (Q mayúscula) coeficiente de asociación.
V: (V mayúscula) coeficiente de Cresmer
La anterior relación no pretende ser exhaustiva.
LETRAS GRIEGAS UTILIZADAS EN LA ESTADÍSTICA DESCRIPTIVA
Las letras griegas utilizadas en la Estadística descriptiva son:
∑ (letra griega <sigma> mayúscula): sumatorio.

s (letra griega <sigma> minúscula): desviación estándar/típica, el más importante índice de variabilidad; puede simbolizarse con una <S>
mayúscula (S) o por la letra griega <s>. En la estadística descriptiva utilizaremos el símbolo <S>, no el símbolo <s>.
r (letra griega <rro> minúscula): Coeficiente de correlación entre valores ordinales de Spearman
t (letra griega <tau> minúscula): coeficiente de correlación de datos ordinales de Kendall.
w (letra griega <omega> minúscula): coeficiente de asociación
f (letra griega <fi> minúscula): Coeficiente de coaligación entre variables cualitativas.
h (letra griega <eta> minúscula): coeficiente de correlación no lineal o curvilineo
c2 (letra griega <ji> o <chi> con exponente cuadrado): un coeficiente de asociación entre variables cualitativas (atributos); también es una
prueba de contraste y decisión en la Estadística inferencial.

CUADRO Nº 9: ALGUNAS PRECISIONES SOBRE EL USO DE LOS SÍMBOLOS
MATEMÁTICOS DE LAS FÓRMULAS ESTADÍSTICAS.
1. INTRODUCCIÓN
Es preciso concretar y aclarar el uso de los signos que designan las operaciones aritméticas indicadas en las fórmulas de los distintos
índices usados en Estadística. Veamos cómo:
LA SUMA
El signo de la suma o adición es: <+>.
LA DIFERENCIA
El signo de la resta o diferencia es: <->. Lo mantenemos.
EL PRODUCTO
El signo de la multiplicación o producto habitual en Aritmética es una <x> o un simple punto <.> entre los factores. En este libro, para evitar la
confusión con la <X> (puntuación directa) o con <x> (puntuación diferencial), no usaremos ningún signo entre factores de un
producto/multiplicación, simplemente cada factor irá dentro de un paréntesis en posiciones contiguas, o sea, el único signo del producto será en
las fórmulas usadas en este libro un espacio entre dos paréntesis; dentro de cada paréntesis irá el número u otro símbolo aritmético que sea un
factor del producto.
Pongamos un ejemplo, si tuviéramos que multiplica 30×20x8, no lo escribiremos:

30x20x8=4800 porque la x minúscula en Estadística descriptiva representa una puntuación diferencial. Ni una X mayúscula 30X20X8 =4800,
pues la X mayúscula representa una puntuación directa. Por tanto, ambas prácticas nos llevarían a confusión.
También usar el punto (.) puede llevar a error, ya que el <.> se usa para diferenciar la parte entera, de la parte decimal, p.e.: 18.75 (como aquí lo
usamos) o la separación de las unidades de millar respecto de las centenas (como es habitual en nuestro país), por ejemplo, 12.375,58.
Nuestra forma de escribir ese producto no será:

30x20x15 = 4800; ni 30X20X15 = 4800; ni tampoco: 30.20.15 =4800, sino:
(30)(20)(15) = 4800
Otros ejemplos:
(5)(7)=35
(9)(6)(4) =
Una ventaja más de esta notación para los productos se pone de relieve cuando uno o más factores son una suma o una resta. Por ejemplo:
(8 + 4) (7 -2) = (12) (5)= 60
Reconocemos, no obstante, que las fórmulas se llenan de paréntesis < ( ) > e incluso habrá que usar en muchas fórmulas distintos tipos de
paréntesis, unos incluidos dentro de otros paréntesis: = 18 +16 =34
Las letras minúsculas representan variables (p.e.: <a> y ); las variables pueden ser factores de un producto. Con ellas, actuamos como con
los números, encerrándolas en paréntesis. Por ejemplo: <(a)(b)>) es el producto de los valores numéricos que pueden tomar la variable <a>, por
los valores numéricos que puede tomas la variable .

LA DIVISIÓN
El signo de la división/cociente será en todas las fórmulas un segmento de recta horizontal (raya) situado entre el dividendo y el divisor o lo
que es equivalente, entre el numerador y el denominador. Ejemplo: 20 dividido entre 4, sería: = 5
Se excluye la notación de los dos puntos (:) Ejemplo 30:5 = 6 También se excluye la notación de la <barra> (/) Por ejemplo: 30/5 = 6 Ambas
notaciones distorsionan las fórmulas estadísticas.
LA POTENCIACIÓN
La potenciación de un número será simbolizada, como es habitual en matemáticas, por un número (<base>) y otro número (<exponente>).
Recordemos que el número o la expresión que se multiplica es la <base> y el número o la expresión que indica las veces que se multiplicara la
base, es el <exponente>. La <base> se escribe con un número o expresión de tamaño normal. El número o expresión del <exponente> es de
menor tamaño que el de la <base>, y se coloca a la derecha y arriba del número o expresión de la <base>.
Ejemplos: =36 =216 53 = 125 104 = 10,000
LA RADICACIÓN
La radicación, o sea, la extracción de la raíz cuadrada, cúbica,… de un número, conocido como <radicando>, tendrá como signo el habitual en
matemáticas: El <radical. Si la raíz es cuadrada, no lleva ningún número en la parte superior de lo que parece una <v>. En los demás casos, en el
lugar mencionado, debe ir el número de orden de la raíz: <3> si la raíz de su cúbica, un <4>, si la raíz es de cuarto orden, etc.
Ejemplos: =6
=5
=2
PUNTOS Y COMAS EN NÚMEROS DECIMALES:
Para escribir un número decimal, tradicionalmente en nuestro ámbito cultural, se colocaba una coma (,) para diferenciar la parte entera a la
izquierda de la coma y la parte decimal a la derecha de la coma. Por ejemplo: el número <treinta y ocho coma seis>, en la notación tradicional de
nuestro país se escribiría <38,6>. En la notación que usaremos en este libro, el mismo número decimal, lo escribimos del siguiente modo: <38.6>.
Nos decidimos por la notación del punto (.), en lugar de la coma (,), porque los programas informáticos de estadística (por ejemplo, el SPSS) así
lo hacen. Otros países utilizan esta misma convención.
TABLA RESUMEN
OPERACIÓN EJEMPLOS EJEMPLOS DE
DE NOTACIÓN NOTACIÓN EN
HABITUAL ESTE LIBRO
SUMA/ADICIÓN 4+6+5=15 4+6+5 = 15 Es la

misma
RESTA/DIFERENCIA 12-4=8 12-4 = 8 Es la

misma
PRODUCTO/MULTIPLICACIÓN 6x5x2=60 (6) (5) (2)=60 Es

diferente
COCIENTE/DIVISIÓN 16:2=8 =8 Es
diferente
POTENCIACIÓN 42 = 16 42 = 16 ) Es la
misma
RADICACIÓN =5 =5 Es la
misma

CUADRO Nº 10. REPRESENTACIONES GRÁFICAS DE LOS DATOS
1. LAS REPRESENTACIONES GRÁFICAS DE LOS DATOS
No sólo los datos recogidos de la aplicación de alguna de las cuatro escalas de medida a una, dos o más variables cualitativas o cuantitativas
de los individuos de una muestra, pueden ser presentados en tablas de distribución de frecuencias con valores numéricos, sino también por
representaciones gráficas, aprovechando las posibilidades que ofrecen los ejes cartesianos. Recordemos esas nociones.
2. LOS EJES CARTESIANOS

Los ejes cartesianos de coordenadas en el plano son dos rectas que se cortan perpendicularmente en un punto <0>.
El eje horizontal recibe el nombre de <eje de abscisas> (0 X)
y el eje vertical, el de <eje de ordenadas> (0 Y).
3. CARACTERÍSTICAS DE LOS DATOS QUE PUEDEN REPRESENTARSE CON GRÁFICOS
Las representaciones gráficas pueden aplicarse a distintos tipos de datos:

a) Las frecuencias que obtiene cada modalidad de variables cualitativas/atributos.
b) Las frecuencias de los valores que toman las puntuaciones obtenidas con escalas de intervalo en variables cuantitativas continúas.
Las representaciones gráficas de distribuciones de frecuencias dependen de:
a. Las modalidades de las variables cualitativas.
b. Los valores que pueden tomar las puntuaciones en una variable cuantitativa continua.
c. Los intervalos que agrupan valores que pueden tomar las puntuaciones en una variable cuantitativa continua.
a. LA DISTRIBUCIÓN DE FRECUENCIAS
Recordemos qué es una distribución de frecuencias:
El tipo de distribución de frecuencias varía según el número de modalidades de la variable cualitativa o del número de valores posibles que
puedan tomar las puntuaciones de una variable cuantitativa continua; si el número de valores es superior a doce, será conveniente agrupar entre
tres y siete valores consecutivos en intervalos del mismo número de valores.
4. TIPOS DE REPRESENTACIONES GRÁFICAS
Las principales representaciones gráficas son:

1) Histograma.
2) Polígono de frecuencias
3) Curva de frecuencias.
4) Diagrama de desarrollo.
5. EL HISTOGRAMA Y EL POLÍGONO DE FRECUENCIAS
Ambos son representaciones gráficas de una distribución de frecuencias.

Un histograma está formado por rectángulos (barras) con la misma base (sobre el eje de las abscisas) y con alturas generalmente diferentes
paralelas al eje de las ordenadas. Las bases representan las modalidades de una variable cualitativa, los valores o los intervalos que agrupan
valores de una variable cuantitativa continua. Las alturas representan generalmente frecuencias. También los rectángulos pueden ser sustituidos
por prismas o cilindros en perspectiva.
Los barras (rectángulos) que representan a las modalidades de una variable cualitativa/atributo suelen dejar un pequeño espacio entre cada
dos consecutivos y el orden de colocación de las barras es indiferente, arbitrario.
En cambio, las barras (rectángulos) que representan valores o intervalos de valores de una variable cuantitativa continua, están situados sin
espacios entre ellas, <pegadas>, sin <huecos>, para mostrar la naturaleza continua de la variable. El orden de colocación de las barras está sujeto
al orden natural de los números cardinales, comprendidos entre el valor más bajo y el valor más alto.
Los histogramas pueden mostrar:

a. Frecuencias absolutas
b. Frecuencias relativas, en proporciones o porcentajes.
c. Frecuencias absolutas acumuladas, en los que cada barra acumula los valores absolutos de la suma de las frecuencias de las barras
menores (no es posible con frecuencias de modalidades de variables cualitativas/atributos).
d. Frecuencias relativas acumuladas (como el tipo de histograma anterior, pero con proporciones o porcentajes en lugar de frecuencias
absolutas).
El polígono de frecuencias deriva del histograma. Es la serie de segmentos de recta que unen los puntos medios de las frecuencias de cada
una de las barras (rectángulos) del histograma.
6. CONSTRUCCIÓN DE UN HISTOGRAMA O DE UN <POLÍGONO DE FRECUENCIAS>
La elaboración de un histograma o de un polígono de frecuencias supone el desarrollo de un mismo proceso, pues se sigue estos pasos:
a. Trazar un sistema de ejes de coordenadas cartesianas.
b. En el eje de las abscisas se sitúa las bases de los rectángulos (barras) que representarán a:
1) Las modalidades de la variable cualitativa/atributo.
2) Los valores numéricos que pueden tomar las puntuaciones de una variable cuantitativa.
3) Los puntos medios de los intervalos que agrupan valores cuando el número de estos aconseja el agrupamiento.
c. En el eje de las ordenadas se representan las frecuencias con las alturas de las barras (rectángulos); esas alturas deben ser
proporcionales a las frecuencias.
En la construcción de un histograma debe tenerse reservar espacio suficiente para la mayor de las frecuencias, aquella cuya barra será la más
alta. El resto de las frecuencias aparecerán en alturas proporcionales.
Ejemplos de histogramas y polígono de frecuencias son estos:
7. HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADAS
El histograma y el polígono de frecuencias acumulativos siguen los mismos pasos que sus semejantes no acumulativos. En los acumulativos
cada rectángulo representa la suma de las frecuencias de los rectángulos precedentes
8. SECTORES CIRCULARES PARA PRESENTAR FRECUENCIAS
Estos diagramas circulares son generalmente usados para representar frecuencias de modalidades de variables cualitativas/atributos.
Se forma tantos sectores circulares como modalidades y la frecuencia de cada una de ellas es proporcional a la extensión del área de
cada sector circular Se halla los porcentajes de las frecuencias de cada modalidad y por una simple regla de tres, se reparten los 360 grados
de la circunferencia:
Si al 100% de la suma de todas las frecuencias, le corresponde 360 grados, a un 27 % de frecuencias (o el 40%, o el 36% o el porcentaje que
sea), le corresponderá <x> grados.
Número de grados
Ejemplo: diagrama de sectores circulares con las frecuencias de alumnos que habían aprobado 0, 1, 2, 3 y 4 o más:

CUADRO Nº 11: TAREAS DE LA ESTADÍSTICA DESCRIPTIVA
1. EL TRATAMIENTO DE LOS DATOS
Los análisis de la estadística descriptiva siguen un proceso formado por estas fases:
a. Recogida de los datos

b. Ordenación
c. Tabulación
d. Representación gráfica
e. Cálculo de los índices con una sola variable o con coeficientes de correlación o asociación de dos o más variables:
Los índices son valores numéricos que representan el conjunto total de valores obtenidos por los sujetos de una muestra. Estos índices se
calculan aplicando ciertas fórmulas, una o más por índice.
Existen cuatro clases de índices descriptivos:

a. Índices de tendencia central o promedios
b. índices de variabilidad o de dispersión
c. Índice de simetría/asimetría (As)
d. Índice de apuntamiento o curtosis (K)
2. RECOGIDA Y ORDENACIÓN DE LOS DATOS
Habiendo recogido los datos fruto de la aplicación de un instrumento de medida sobre una variable presente en los sujetos de una muestra,
la primera tarea en cualquier análisis estadístico descriptivo es la organización de los datos. Estos se ordenan en una tabla de distribución de
frecuencias. La frecuencia de una modalidad de una variable cualitativa/atributo o un valor de puntuación de variable cuantitativa es el número de
individuos que presentan dicha modalidad o dicho valor.
3. TABULACIÓN
Para presentar ordenadamente los datos, han de ser elaboradas las tablas más adecuadas al tipo de:
a. La variable medida.
b. La escala de medida utilizada.
c. El número de modalidades o de valores que pueden tomar las observaciones o las puntuaciones respectivamente.
d. El índice descriptivo que se quiere calcular.
e. La fórmula del índice utilizada.
f. El número de sujetos de la muestra.
Las tablas están constituidas por un entramado de filas y columnas. Encabezan las filas, bien los sujetos (cuando no superan la docena),
bien los posibles valores o bien grupos de valores (intervalos) que una variable puede tomar. Las columnas (exceptuando la primera por la
izquierda) recogen generalmente las frecuencias y los resultados de las operaciones aritméticas que prescribe la fórmula. Limitándonos a las
tablas de <distribución de frecuencias>, distinguimos tres casos:
a. Tabla para una muestra de menos de 12 individuos. La tabla está formada por dos columnas, la de la izquierda contiene los nombres de
los individuos, uno por fila. La columna de la derecha contiene la puntuación obtenida por cada sujeto. Probablemente se repetirán los
valores de algunas puntuaciones, pero se opera del mismo modo con las puntuaciones repetidas que con las no repetidas.
b. Tabla para una muestra que supera la docena de individuos. Si el número de valores es inferior a doce, algunos valores de las
puntuaciones estarán repetidos. El número de puntuaciones que tienen el mismo valor recibe el nombre de <frecuencia>.
c. Tabla de distribución de frecuencias destinada a aquellos casos en los que el número de valores que pueden tomar las puntuaciones
es superior de 12 o 15; en ese caso, conviene agrupar los valores en <intervalos>.
Veamos estos tres tipos de tablas.
4. EJEMPLO DE TABLA PARA MUESTRAS CON MENOS DE 12 SUJETOS
Se sometió a un grupo de diez sujetos a una prueba de 12 preguntas. Los valores que puede tomar la prueba es el número de respuestas
acertadas (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 y 12).
La tabla tendrá tantas filas como individuos forman la muestra y dos columnas, la columna <A> para situar el nombre u otro signo
identificativo de cada uno de los individuos de la muestra y la columna destinada a acoger el número de preguntas acertadas por cada uno
de los sujetos. Veamos esta tabla:

A B
SUJETOS Nº PREGUNTAS ACERTADAS (X)

Advertimos que algunos valores obtenidos por los sujetos de esta muestra se repiten (Juan y
JOSÉ 12 Melchor, p. e.). Esta tabla de dos columnas puede servir para realizar solamente cálculos de índices
JUAN 8 de tendencia central/promedios.
JAIME 9
JOAQUÍN 6 5. EJEMPLO DE TABLA DE FRECUENCIAS PARA MUESTRAS SUPERIORES A DOCE SUJETOS Y

CON PUNTUACIONES CUYOS VALORES NO ESTÁN AGRUPADOS EN INTERVALOS.
JAVIER 4
Supongamos el siguiente conjunto de datos:
MELCHOR 8
Los posibles valores que pueden tomar las puntuaciones en una prueba de evaluación son diez: 1,
MIGUEL 3
2, 3, 4, 5, 6, 7, 8, 9 y 10. Las puntuaciones realmente obtenidas por 16 alumnos tienen los siguientes
MARCOS 6 valores: 1, 2, 3, 3, 4, 5, 5, 5, 6, 6, 7, 7, 7, 8, 8 y 10.
MANUEL 10
MARIO 9 La tabla adjunta es de tres columnas: los valores, sus frecuencias y los productos de cada valor por
N = 10 su frecuencia:
A B C
VALORES FRECUENCIAS PRODUCTO

DE VALORES
POR
FRECUENCIAS
1 1 1
2 1 2
3 2 6
4 1 4
5 3 15
6 2 12
7 3 21
8 2 16
9 0 0
10 1 10
n = 16 (X)(f) = 87
Así ya podemos recoger los resultados de las operaciones aritméticas implicadas en los índices de tendencia central.
6. EJEMPLO DE TABLA DE FRECUENCIAS PARA DATOS CUYOS VALORES OBTENIBLES ESTÁN AGRUPADOS EN INTERVALOS
Cuando el número de valores que pueden tomar las puntuaciones es elevado (15, 20, 30, 40), ya no es práctico hacer una tabla con una fila
por cada valor, pues la tabla tendría 15, 20, 30, 40…filas. Necesitamos reducir el número de filas para que la tabla sea manejable. En este caso,
la mejor solución es agrupar los valores en intervalos. Los intervalos deben cumplir ciertas condiciones:
a. Igualdad del número de valores que integran cada intervalo.
b. Exclusividad: cada valor sólo puede estar en un intervalo.
c. Exhaustividad: Todos los valores tienen que estar en alguno de los intervalos.
d. El número de valores de cada intervalo debiera ser <impar> (3, 5 o 7), mejor que <par> (2, 4 o 6) pues es fácil determinar el punto
medio de cada intervalo, mientras que los intervalos con número <par> de valores requieren hallar la media aritmética de los dos
valores centrales de cada intervalo, resultando un número decimal, lo que siempre complica los cálculos posteriores.
Para determinar el número de intervalos necesarios para reducir el número de valores que pueden presentar las puntuaciones, se siguen los
siguientes pasos:
1º) Se halla la <amplitud> (A) aplicando esta fórmula:
A = Xma (valor mayor) - Xmen (valor menor)+1.
Un ejemplo: si los valores se mueven entre 18 y 67, la amplitud será 50 (A= 67 – 18 + 1 = 50).
2º) Dividimos el valor de la amplitud (A), entre un número que nos permita tener entre 5 y 10 intervalos con 3, 4, 5 o 6 valores cada intervalo.
Hagamos una tabla de distribución de frecuencias con los siguientes datos:

Un grupo de 100 alumnos han sido sometidos a un test, obteniendo, por tanto, 100 puntuaciones (n = 100). Los valores que pueden adoptar
las 100 puntuaciones son 30 (del 1 al 30).
Agrupamos estos 30 valores en seis intervalos de cinco valores cada uno, resultando una tabla de seis filas y de tres columnas. Las filas
acogen los intervalos. Necesitamos cuatro columnas:
a. La columna <A> acoge los valores agrupados en intervalos.
b. La columna , los puntos medio de cada intervalo.
c. La columna <C>, las frecuencias de cada intervalo, el número de puntuaciones que coinciden con alguno de los valores que integran el
intervalo.
d. Columna <D>: productos de los puntos medios de cada intervalo por su frecuencia.
A B C D
INTERVALOS PUNTO FRECUENCIA PRODUCTO

MEDIO DEL DEL PUNTO
INTERVALO MEDIO DE
CADA
INTERVALO
POR SU
FRECUENCIA
1–5 3 3 9
6 – 10 8 7 56
11 – 15 13 42 546
16 – 20 18 38 684
21 – 25 23 8 184
26 - 30 28 2 56
n = 100 (xJ)(f) =
1535
Con esta tabla es posible y fácil calcular el valor numérico de índices de tendencia central media aritmética.

CUADRO Nº 12: ÍNDICES DESCRIPTIVOS DE UNA SOLA VARIABLE EN UNA
MUESTRA
1. ÍNDICES DESCRIPTIVOS DE UNA SOLA VARIABLE
Podemos preguntarnos cómo describir los resultados de un proceso de medida de una variable en los individuos que forman una muestra.
Responder a esta pregunta depende del número de individuos de la muestra. Por ejemplo, si tenemos cuatro hijos y las calificaciones en
Música han sido 4, 6, 6 y 5, podríamos satisfacer la curiosidad de un pariente próximo con la simple enumeración, 6, 6, 5 y 4. Podríamos añadir
que uno de los hijos tendrá que examinarse en el próximo Septiembre y que los otros tres vástagos, no.
Como hemos visto, con cuatro hijos es suficiente la enumeración, pero si son diez alumnos de una clase, la enumeración de la calificación
de cada uno de los diez no sirve para dar una visión sintética de las calificaciones obtenidas por los individuos de la muestra.
Cuando los individuos de una muestra son, 15, …20…80…100 o más, se precisa obtener ciertos valores numéricos que representen a los
valores de las puntuaciones individuales. Esos valores numéricos buscados son los índices descriptivos de muestras de sujetos medidos en una
sola variable.
2. TIPOS DE ÍNDICES DESCRIPTIVOS DE UNA SOLA VARIABLE

El proceso de análisis propio de la estadística descriptiva es el cálculo de <índices>, valores numéricos que represente al conjunto total de
valores obtenidos por los sujetos de una muestra. Estos índices se calculan aplicando ciertas fórmulas, una o más por índice.
¿Cómo poder hallar unos pocos índices numéricos que representen a toda una muestra, cuando se tienen medidas individuales de una
variable de los sujetos de una muestra?
Existen cuatro clases de índices descriptivos de una sola variable en una muestra.
a. Índices de tendencia central, también denominados <promedios>
b. Índices de variabilidad o dispersión
c. Índices de simetría/asimetría
d. Índices de apuntamiento
3. ÍNDICES DE TENDENCIA CENTRAL
Los Índices de tendencia central o promedios son:

a. La moda (Mo)
b. La mediana (Md)
c. La media aritmética ( )
d. La media geométrica (g)
e. La media cuadrática (c)
f. La media armónica a)
4. LOS ÍNDICES DE VARIABILIDAD O DISPERSIÓN
Los índices de variabilidad o de dispersión son:

a. La amplitud total o recorrido (A)
b. La amplitud semi-intercuartil (Q)
c. La varianza (S2)
d. La desviación estándar (S)
e. El coeficiente de variación (CV)
5. LOS ÍNDICES DE ASIMETRÍA Y APUNTAMIENTO
La asimetría y el apuntamiento son medidos por un único índice de asimetría y un solo índice de apuntamiento respectivamente, si bien cada
uno de ellos tiene varias fórmulas alternativas de cálculo.
6. TABLA RESUMEN
A continuación se presenta una tabla de las variables, las escalas y los índices de una sola variable:
VARIABLES VARIABLES VARIABLES VARIABLES VARIABLES

CUANTITATIVAS

CUALITATIVAS/ CUANTITATIVAS CUANTITATIVAS CONTINUAS
CON CERO
ATRIBUTOS DISCRETAS CONTINUAS SIN
CERO ABSOLUTO
ABSOLUTO
EJEMPLOS DE Grupo Número de Escala Celsius Escala Kelvin

VARIABLES Sanguíneo, hijos, de de temperatura,
Temperatura, masa,
Estado civil,
longitud
Nivel de estudios Escala de pH
ESCALA DE Escala Escala nominal Escala de Escala de

MEDIDA Nominal y ordinal (Grupo Intervalo (Grupo razón (Grupo de
isotónico) de función Similaridad)
(grupo
permutativo) Lineal)
OPERACIONES Igualdad/desigualdad Determinación Igualdad de Igualdad de

ARITMETICAS de orden intervalos o razones,
mayor/menor diferencias entre Cero
ADMITIDAS pares de valores absoluto
ÍNDICES DE Moda (Mo) Mediana (Md) Media aritmética Lo mismo

TENDENCIA ()
CENTRAL Media
geométrica (() ,
Media
cuadrática ((),
Media armónica
(a)
.ÍNDICES DE ----------- Amplitud (A). Desviación Lo mismo, y

VARIABILIDAD Amplitud semi- media (DM), Coeficiente
intercuartil Varianza (S2), de variación
<CV>
Desviación
Estándar o
Típica (S)
ÍNDICE DE ------------ ------------ As As

SIMETRÍA/ASIMETRÏA
ÍNDICE DE ------------ ----------- K K

APUNTAMIENTO O
CURTOSIS

CUADRO Nº 13: ÍNDICES DE TENDENCIA CENTRAL/PROMEDIOS Y LA <MODA>.
1. ÍNDICES DE TENDENCIA CENTRAL
Los primeros índices para una sola variable tratados en Estadística Descriptiva son los índices de tendencia central, también conocidos como
<promedios>. Son los primeros porque, entre otras razones, son necesarios para calcular la mayoría de los índices de variabilidad, de
apuntalamiento y de simetría.
Los índices de tendencia central, que a continuación se presentan, tienen como única finalidad: resumir los numerosos valores obtenidos en
las puntuaciones de los individuos de una muestra, por un valor numérico que represente a toda la muestra.
Reconocemos que la aplicación de un instrumento de una escala de medida sobre una variable supuestamente poseída en distintos grados
por los individuos de una muestra ofrece un número de tantos valores numéricos como individuos constituyen la muestra. Esa multiplicidad de
valores no pueden ser sólo enumerados, sino representados por un valor numérico que resuma y represente la totalidad de los valores obtenidos
individualmente por los sujetos. Es preciso reducir la multiplicidad de valores a un valor que recoja significativamente la totalidad, aún
reconociendo que se pierde información. En la siguiente tabla aparecen los índices de tendencia central:
Índice de Símbolo
tendencia central o
promedios
Moda Mo
Mediana Md
Media aritmética
Media geométrica g o Mg
Media cuadrática c o Mc
Media armónica a o Ma
Los índices menos utilizados son los tres últimos y la <Moda> (Mo). Por el contrario, la <mediana> (Md) y, sobre todo, la <media aritmética> ()
son los índices de tendencia central más utilizados porque, entre otras razones, son imprescindibles para aplicar los restantes índices: índices de
de variabilidad, de asimetría y de apuntamiento, así como para los coeficientes de correlación y de asociación.
Podemos ver en el siguiente cuadro una comparación entre los tres índices de tendencia central más utilizados:
MODA Mo MEDIANA Md MEDIA ARITMÉTICA
No tiene en cuenta los casos extremos No tiene en cuenta los casos extremos Tiene en cuenta todas las puntuaciones
Las puntuaciones se agrupan por los valores Requiere la ordenación de todas las puntuaciones El cálculo no necesita la ordenación de las puntuaciones
Atiende a los valores con mayor frecuencia Puede ser un número que no está en los datos. El resultado del cálculo puede que no esté entre las puntuaciones
2. LA MODA ENTRE LOS ÍNDICES DE TENDENCIA CENTRAL

La <moda> (Mo) es el índice de tendencia central más sencillo de hallar, pero más impreciso y menos riguroso de los cinco índices de
tendencia central. El símbolo de la <moda> es: Mo (una <M> mayúscula seguido por una <o> minúscula).
La <moda> (Mo) puede aplicarse a datos nominales (modalidades de una variable cualitativa) y, en cierto modo, a los datos de escala de
intervalo (variable cuantitativa continua). Para los datos ordinales se utiliza la <mediana> (Md) y para los datos de intervalo (variable cuantitativa
continua), las medias aritmética, geométrica, cuadrática y armónica. La <moda> es el único índice que puede ser aplicado para datos en escala
nominal.
1. CÓMO IDENTIFICAR LA <MODA> DE UNA DISTRIBUCIÓN DE FRECUENCIAS
Para identificar la <moda> (Mo) de una distribución de frecuencias, se comprueba:

a. ¿Qué modalidad de una variable cualitativa presenta la mayor frecuencia?
b. ¿Qué valor numérico de una variable cuantitativa continua presenta la mayor frecuencia?
La <moda> no tiene fórmula de cálculo, no incluye operaciones aritméticas, sólo es suficiente contar los individuos que presentan la misma
puntuación o pertenecen a la misma modalidad. Es suficiente comparar las frecuencias de las distintas modalidades o las frecuencias de los
valores que toman las puntuaciones, para descubrir cuál es la modalidad o la puntuación con la mayor frecuencia.
4. VERSATILIDAD DE LA <MODA>
La <Mo> es un índice de tendencia central muy versátil:

a. La <moda> es el único índice de tendencia central que puede aplicarse a datos nominales, los obtenidos de medir variables
cualitativas/atributos
b. La moda (Mo) es un índice de tendencia central que, no sólo se aplica a datos medidos con escala nominal, sino también a las variables
cuantitativas continuas, aquellas que se miden con escala de intervalo o de razón.
c. La <moda> no puede ser aplicada a datos ordinales.
5. LIMITACIONES DE LA <MODA>
La<moda> presenta numerosas limitaciones que reducen su valor a una superficial medida de una distribución de frecuencias. He aquí

algunas de estas limitaciones:
a. El valor con mayor frecuencia es independiente del resto de las frecuencias de los demás valores, por lo que la <moda> hallada es
escasamente representativa de toda la distribución de frecuencias.
b. No siempre se sitúa en el centro de la distribución.
c. Si los valores están agrupados en intervalos, la <moda> depende mucho de del número de intervalos y del número de valores asignado a
cada intervalo.
d. Se espera que la distribución presente un único valor con la mayor frecuencia; pero, si, por el contrario, la distribución tuviera más de un
valor con la mayor frecuencia, se tendría, no una distribución unimodal, sino bimodal, trimodal...
6. EJEMPLOS DE IDENTIFICACIÓN DE LA <MODA> DE DISTRIBUCIONES DE FRECUENCIAS
Presentamos tres ejemplos de identificación de la <moda> con tres distintas distribuciones de frecuencias:
a. Distribución de frecuencias de variables cualitativas.
b. Distribución de frecuencias con variables cuantitativas continuas, sin agrupar los valores en intervalos.
c. Distribución de frecuencias con variables cuantitativas continuas, agrupados los valores en intervalos.
a. EJEMPLO DE<MODA> CON VARIABLES CUALITATIVAS:

En una urbanización de la costa viven 30 extranjeros: Siete son alemanes, cinco franceses, doce británicos, dos rusos y seis suecos.
Hallar la <moda>.
Nacionalidad Número
de
nacionales
Francesa 5
Británica 12
Rusa 2
Sueca 6
Alemana 7
Comparamos las cinco frecuencias: 7, 5, 12, 2 y 6. El número mayor de los cinco es: <12>. Este número es el que corresponde a nacionales
británicos. Luego la <moda>, es este caso es la <británica>.
b. EJEMPLO DE <MODA> CON VARIABLES CUANTITATIVAS CONTÍNUAS CON VALORES NO AGRUPADOS EN INTERVALOS
Hallar la <moda> entre las puntuaciones obtenidas por 25 alumnos en una prueba de composición escrita. En la tabla se presentan las
frecuencias de cada uno de los posibles valores que podían tomar las puntuaciones:
VALORES QUE FRECUENCIA (NÚMERO DE

PODÍAN TOMAR LAS PUNTUACIONES QUE TOMAN
PUNTUACIONES CADA VALOR)
1 0
2 1
3 2
4 2
5 6
6 9
7 3
8 2
9 0
10 0
Comparamos las frecuencias (0, 1, 2, 2, 6, 9, 3, 2, 0 y 0) y vemos que la mayor frecuencia de las diez es <9> y <9>, correspondiendo a la
puntuación: <6>. Por tanto, el valor que reúne más puntuaciones es <6> y consecuentemente, la<moda> es <6>. Puede aceptarse que el
resultado de la prueba de composición escrita es bastante satisfactorio: 9 de 25 alumnos tiene una puntuación próxima a la centralidad.
c. EJEMPLO DE <MODA> CON VARIABLES CUANTITATIVAS CONTÍNUAS AGRUPANDO LOS VALORES EN INTERVALOS
Del mismo modo que hemos alcanzado el valor del índice de tendencia central <moda> de una distribución de frecuencias con valores
numéricos no agrupados en intervalos, se podría hacer otro tanto una distribución de frecuencias de valores agrupados en intervalos.
Hallar la <moda> de las puntuaciones obtenidas por 100 sujetos en una prueba en la que los valores que pueden tomar las puntuaciones han
sido agrupados en intervalos de cinco valore cada uno. La distribución de frecuencias se muestra en la adjunta tabla:
INTERVALOS FRECUENCIAS
1-5 6
6-10 22
11-15 10
16-20 8

21-25 4
El intervalo que presenta la mayor frecuencia

(22) es el <6-10). La mayor frecuencia (22), corresponde al
intervalo <6-10, por tanto, la <moda> está en el intervalo <6-
10>.

CUADRO Nº 14: LA MEDIANA
1. INTRODUCCIÓN
Recordamos que los índices de tendencia central son la moda (Mo), la mediana (Md), la media aritmética (X), la media geométrica (Xg), la media
armónica (Xa) y la media cuadrática (Xc); vamos a dedicar este cuadro a presentar la mediana.
La mediana (Md) es un índice de tendencia central que requiere la ordenación de las puntuaciones, obtenidas por los sujetos de una muestra,
en una serie, creciente o decreciente de puntuaciones a las que se les ha sido asignado rangos correlativos, en una relación biunívoca con las
puntuaciones. Pues bien, la mediana es aquella puntuación que ocupa el rango central de la serie o sea, que deja el mismo número de rangos por
encima, que por debajo de ella.
2. EL CÁLCULO DE LA MEDIANA (Md)
En el cálculo de la mediana cabe distinguir dos casos:

a) Si el número de puntuaciones (n) es pequeño, por ejemplo, menos de 20 (n 20), no es necesario agrupar las puntuaciones en intervalos.
b) Si el número de puntuaciones es igual o superior a 20 (n ≥ 20), conviene agrupar las puntuaciones en intervalos
3. TIPOS DE CÁLCULOS DE LA MEDIANA CON PUNTUACIONES NO AGRUPADAS EN INTERVALOS
Limitándonos al primer caso (sin intervalos), tenemos que hacer otras distinciones según dos criterios:
a. Si el número de puntuaciones (n) es impar o, por el contrario, es par.
b. Si la puntuación del rango o rangos centrales comparten la misma o las mismas puntuaciones con otros rangos de la serie ordenada.
Combinando estos dos criterios, encontramos cuatro casos diferentes de calcular la mediana con las puntuaciones no agrupadas en
intervalos:
a. Con un número impar de puntuaciones sin que la puntuación que ocupa el rango central sea compartida con cualquier otro rango.
b. Con un número par de puntuaciones sin que una o las dos puntuaciones que ocupan los dos rangos centrales sean compartidas con
otros rangos.
c. Con un número impar de puntuaciones y con la puntuación del rango central compartida con otro u otros rangos.
d. Con un número par de puntuaciones y con una o las dos puntuaciones de los dos rangos centrales sean compartidas con otros rangos.
4. CÁLCULO DE LA MEDIANA EN ESTE <CUADRO>.
En este cuadro, presentamos un ejemplo del procedimiento de cálculo de la <Md> en series con número impar, sin que la puntuación que
ocupa el rango central coincida con las puntuaciones que ocupan los rasgos adyacentes al rango central.
5. EJEMPLO DE PROCEDIMIENTO PARA HALLAR LA MEDIANA DE UNA SERIE FORMADA POR UN NÚMERO IMPAR DE PUNTUACIONES Y
SIN QUE LA PUNTUACIÓN DEL RANGO CENTRAL COINCIDA CON LAS PUNTUACIONES DE OTRO U OTROS RANGOS
Veamos el procedimiento aplicándolo a un problema:
Un grupo de 13 niños han obtenido las siguientes puntuaciones: 5, 7, 5, 9, 9, 6, 7, 5, 4, 8, 5, 4 y 7. Hallar la mediana:
Paso 1º) Ordenamos las puntuaciones en una serie creciente de puntuaciones: 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 8, 9, 9. (el resultado sería el mismo si
las puntuaciones hubieran sido ordenadas en una serie decreciente).
Paso 2º) A cada una de esas puntuaciones de la serie ordenada le corresponde un rango, desde el rango 1º, al rango 13º.
Puntuaciones 4 4 5 5 5 5 6 7 7 7 8 9 9
Rangos 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º
Paso 3º) Sumamos a 13 una unidad (1): 13+1 =14.

Paso 4º) Dividimos 14 entre 2 y el resultado es el rango central: =7
Paso 5º) Restamos a trece rangos, el rango central, nos quedan 12 rangos (13 – 1 = 12).
Paso 6º) Dividimos 12 entre 2: = 6. Conocemos que la mediana está en el rango 7º, ya que deben quedar seis rangos por debajo y seis rangos
por encima del rango central.
Paso 7º) Vemos que el valor numérico que ocupa el 7º rango es concretamente la puntuación <6>. Se comprueba que la puntuación del rango
central no coincide con la de otros rangos (el número <6>) del rango 7º es diferente a las puntuaciones de los rangos próximos: un <5> en el
rango 6º y un <7> en el rango 8º. La mediana de esta serie de 13 puntuaciones es: <6>, (Md =6).

CUADRO Nº 15: PROCEDIMIENTO DE CÁLCULO DE LA MEDIANA DE UNA SERIE
PAR DE RANGOS
1. INTRODUCCIÓN
Si el número de puntuaciones (n) es par, el proceso de cálculo de la mediana difiere del expuesto en el anterior <cuadro>, dedicado a presentar
el cálculo de la mediana de una serie impar de rangos.
Concretamente varía el paso 4º del proceso expuesto más arriba. La fórmula es distinta:
Se calcula cuáles son los dos rangos centrales utilizando estas dos fórmulas:
a. Para determinar cuál será el rango inferior de la pareja central de rangos, se divide <n> entre 2: , cuyo resultado es un entero.
b. Para determinar cuál será el rango superior , se suma <1> al valor hallado en el paso anterior: + 1
c.
Aplicando estas fórmulas, se obtiene el número de rangos que quedarán por debajo y por encima de la pareja de rangos centrales. Esta pareja
de rangos centrales aporta dos puntuaciones entre las que se encuentra la Mediana de la serie. La mediana estará entre las puntuaciones que
ocupan los dos rangos centrales. La mediana será el resultado de obtener la media aritmética de ambas puntuaciones.
2. EJEMPLO DE CÁLCULO DE LA MEDIANA DE UNA SERIE FORMADA POR UN NÚMERO PAR DE PUNTUACIONES Y SIN QUE LAS DOS
PUNTUACIONES DE LOS DOS RANGOS CENTRALES COINCIDAN CON LAS PUNTUACIONES DE OTRO U OTROS RANGOS
Para una mejor comprensión del procedimiento de cálculo, lo vamos a aplicar a este problema:
Encontrar el valor de la mediana (Md) de las siguientes diez puntuaciones: 2, 11, 3, 6, 1, 5, 9, 7, 8 y 13

Paso 1º) Ordenamos las diez puntuaciones de menor a mayor o de mayor a menos (el resultado es el mismo). Elegimos, p. e., de menor a
mayor. Veamos: 1, 2, 3, 5, 6, 7, 8, 9, 11, 13.
Paso 2º) Se asignan rangos correlativos a los diez números de la serie
PUNTUACIONES 1 2 3 5 6 7 8 9 11 13
RANGOS 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
Paso 3º) Como vemos, se ha asignado una serie ordenada de rangos a una serie ordenada de puntuaciones.
Como la serie tiene un número par (n=10) de puntuaciones, la mediana será la media aritmética de las puntuaciones que ocupan los dos
rangos centrales. Las fórmulas para determinar cuáles son los dos rangos centrales:
Primer rango de la pareja central = En nuestro caso, = 5º
Segundo rango de la pareja central: = + 1. En nuestro caso, + 1 = 6º
Los rangos centrales serán el 5º y el 6º. Así resultan cuatro rangos (1º, 2º, 3º y 4º) por debajo de los rangos centrales y cuatro rangos (7º, 8º,
9º y 10º) por encima de los dos rangos centrales.
Paso 5º: Se halla la media aritmética de las puntuaciones que ocupan los rangos 5º y 6º.
RANGOS PUNTUACIONES
Rango 5º 6
Rango 6º 7
Md = = 6.50 La mediana (Md) es <6.50>

CUADRO Nº 16: CÁLCULO DE LA MEDIANA DE UNA SERIE CON VALORES
REPETIDOS EN EL RANGO O RANGOS CENTRALES
1. EJEMPLO DE CÁLCULO DE LA MEDIANA CUANDO ESTÁ REPETIDA LA PUNTUACIÓN DEL RANGO CENTRAL
Recordamos que para calcular la mediana, se debe
a. Ordenar en una serie creciente o decreciente las puntuaciones alcanzadas por los sujetos.
b. Asignar a cada puntuación un rango creciente o decreciente en una relación biunívoca.
c. Que la mediana es la puntuación que ocupa el rango central (si la serie es impar) o la media de los dos rangos centrales (si la serie es
un número par).
Sin embargo, lo que parece sencillo se complica si la puntuación del rango o rangos centrales es idéntica a otra u otras puntuaciones
del o de los rangos anteriores o posteriores al rango o rangos centrales. Veamos un ejemplo de procedimiento de cálculo cuando esto
sucede:
Hallar la mediana de nueve puntuaciones, las que presentamos ordenadas en esta serie creciente: 3, 4, 5, 5, 5, 6 , 7.
Paso 1º) Como las puntuaciones ya están ordenadas de menor a mayor, asignamos los rangos:
PUNTUACIONES 3 4 5 5 5 8 9
RANGOS 1º 2º 3º 4º 5º 6º 7º
Paso 2º) Como la serie está formada por un número impar (7) de rangos, la mediana es, en principio, la puntuación que ocupa el rango 4º, pues
cumple la regla principal de la mediana: dejar por debajo y por encima del rango central el mismo número de rangos, en nuestro problema: 3 (1º,
2º y 3º) por debajo y 3 (5º, 6º y 7º) por encima.
Paso 3º) Pero advertimos que la puntuación que ocupa el rango 4º (5) es igual a las que ocupan los rangos 3º y 5º (5 y 5). Si tenemos tres
puntuaciones idénticas, no parece correcto afirmar que la mediana es <5>, pues tal puntuación es compartida con otros dos rangos. Será preciso
determinar los límites exactos de los rangos.
Si restamos el límite inferior al límite superior, resulta la unidad: 5.50 - 4.50 = 1. Habrá que dividir <1> entre los tres rangos que coinciden en la
puntuación <5>:
= 0.33
Correspondería añadir 0.33 a cada una de las puntuaciones de los rangos 3º, 4º y 5º.
Paso 4º) Marcamos los límites exactos de la puntuación de cada rango:
SERIE CON NÚMERO IMPAR DE PUNTUACIONES
Rangos 1º 2º 3º 4º 5º 6º 7º
Puntuaciones 3 4 5 5 5 8 9
Suma de Inferior 4.50 4.83 5.16 Superior

0.33 a límite a 4.50 + 0.33 = + 0.33 = + 0.33 = de 5.50
inferior 4.83 5.16 5.550
Límites Lim. Lim. Lim.

exactos inf Inf 4.83 Inf.
4.50 5.16
Lim.
Lim.
Sup Lim.
Sup.
5.16 Sup.
4.83
5.50
Luego, la mediana (Md) estará en el rango 4º, que tiene por límite inferior 4.83 y como límite superior 5.16. El punto medio estará hallando la
media aritmética de los dos límites: = = 4.995, o sea: 5
No debe extrañarnos que resulte una mediana de <5>, pues el <5> del rango 3º se equilibraba con el <5> del rango 5º. Hubiera sido muy
distinto si el número de puntuaciones idénticas hubieran ocupado más rangos por encima que por debajo del rango central o viceversa.
CUADRO Nº 17: CÁLCULO DE LA MEDIANA CON LAS PUNTUACIONES

AGRUPADAS EN INTERVALOS
1. EJEMPLO DE CÁLCULO DE LA <Md> CON LAS PUNTUACIONES AGRUPADAS EN INTERVALOS
Con la resolución de un problema, intentaremos presentar el procedimiento para hallar la mediana cuando las puntuaciones están agrupadas
en intervalos:
Hallar el valor que toma la mediana de una serie de 35 puntuaciones, que, por su alto número es aconsejable que se agrupen en intervalos de
tres valores correlativos cada uno. En la tabla siguiente se muestran los intervalos y sus frecuencias.
INTÉRVALOS FRECUENCIA
DE LOS VALORES (NÚMERO DE
QUE PUEDEN PUNTUACIONES
TOMAR LAS QUE COINCIDEN
PUNTUA-CIONES CON ALGUNO DE
LOS VALORES DEL
INTERVALO)
1-3 6
4-6 4

7-9 3
10-12 4
13-15 6
16-18 6
19-21 3
22-24 3
n=35
El procedimiento para calcular la mediana (Md) cuando los valores están agrupados en intervalos, está formado por los siguientes
pasos:
Paso 1º) Dividir el número total de puntuaciones (35) entre dos (2):
= 17.5
Paso 2º) Comenzamos a sumar las frecuencias de los intervalos a partir del intervalo inferior de la distribución de frecuencias, hasta llegar al
intervalo que contiene el valor 17.5.
El primer intervalo (1-3) aporta 6 puntuaciones.
El segundo intervalo (4-6) aporta 4 puntuaciones, que sumadas con las 6 anteriores resultan 10.
El tercer intervalo (7-9), añade sus 3 puntuaciones (10+3 =13).
El cuarto intervalo (10 – 12) aporta 4 puntuaciones que sumadas a las 13 de las sumas anteriores, resulta 17 (13 + 4 = 17). Por tanto, el valor
17.50 tiene que estar en el intervalo siguiente <13 – 15>, el llamado <intervalo de mediana>.
Paso 3º) Se halla la diferencia entre 17.50 ( = 17.50) y la suma de las frecuencias de todos los intervalos por debajo del <intervalo de mediana>
(6 + 4 +3 + 4 = 17): 17.50 – 17 = 0.50
Paso 4º) Calculamos la proporción del intervalo de mediana que debe ser añadida a su límite inferior con el fin de alcanzar la puntuación de la
mediana.
Paso 5º) Se divide el número obtenido en el paso anterior (0.50) por la frecuencia del <intervalo de mediana>: (6); ( = 0.08).
Paso 6º) Se multiplica el resultado de la anterior división por el tamaño del intervalo (3):
(0.08) (3) = 0.24
Paso 7º) Sumamos el resultado (0.24) obtenido en el paso anterior (6º) con el límite exacto inferior del intervalo de mediana (13 – 15), que es
12.50 :
0.24 + 12.50 = 12.74.
El valor de la mediana es: 12.74
Existe una fórmula que puede facilitar el tránsito por los siete <pasos> del procedimiento de cálculo de la mediana:
Mediana = (l)+ ()
SIMBOLOGÍA:
l : límite exacto inferior del intervalo de mediana.
n : número total de puntuaciones
f : número de puntuaciones del intervalo de mediana.
F: suma de las puntuaciones de todos los intervalos inferiores al <intervalo de mediana>.
i: tamaño de cada intervalo o sea, número de valores agrupados en el intervalo.

CUADRO Nº 18: DETERMINAR LA POSICIÓN DEL INDIVIDUO EN EL GRUPO
1. INTRODUCCIÓN
Cuando aplicamos un instrumento de evaluación a una muestra, no sólo nos interesa describir las características de la muestra reduciendo los
resultados a unos índices descriptivos de tendencia central (mediana y media aritmética, preferentemente), variabilidad, asimetría y apuntamiento,
sino también determinar la posición que ocupa cada individuo en el conjunto del grupo. No es suficiente conocer la puntuación del individuo si no
se sabe, al menos, el número de individuos de la muestra o, mejor aún, la media y la desviación estándar de las puntuaciones de la muestra.
Valorar la posición requiere situarla en el conjunto del grupo. Para ello, existen dos formas de hallar la posición de un individuo en su grupo:
a. Hallar la puntuación estándar <z> del individuo (z = ) y, suponiendo que la variable medida cumple los requisitos exigidos, hallar el
porcentaje de sujetos con puntuaciones inferiores a la obtenida por el sujeto en la tabla de áreas bajo la curva normal para cada<z>.
b. Determinar el percentil del rango que ocupa la puntuación del individuo, en la serie ordenada creciente de las puntuaciones obtenidas
por los individuos que forman la muestra.
Vamos a tratar en este <cuadro> cómo calcular los percentiles.
2. LOS PERCENTILES
a. ¿Qué son los percentiles?
Los percentiles son los resultados de distribuir una serie ordenada creciente de puntuaciones entre cien (100) intervalos, cada uno de los
cuales incluye el 1 % del total de puntuaciones.
b. Ventajas de los percentiles:
1) No requiere calcular los índices descriptivos (media aritméticas, desviación estándar,…) de las puntuaciones de la muestra.
2) Puede utilizarse con puntuaciones ordinales.
c. Los percentiles sirven para:
a) Comparar dos puntuaciones obtenidas por dos individuos o por el mismo individuo, cualquiera que hayan sido los valores de la escala de
medida utilizada o del tipo de la variable cuantitativa medida.
b) Interpretar la significación de las puntuaciones individuales en el conjunto de la muestra.
3. LAS OPERACIONES CON PERCENTILES
Las posibles operaciones son estas dos:
a. Hallar el percentil que le corresponde a una concreta puntuación.
b. Hallar la puntuación que le corresponde a un concreto percentil.
4. HALLAR EL PERCENTIL CORRESPONDIENTE A UNA PUNTUACIÓN DADA
Comenzamos con la primero operación: Dado una puntuación, encontrar el percentil.
a. FÓRMULAS:
Disponemos de tres fórmulas equivalentes:
1) P = 100 –
2) Claparede: P= (100)
3) Otis: P= (100)
Aquí vamos a utilizar la primera de las tres.
b. SIMBOLOGÍA:
R : rango correspondiente de una puntuación dada.
n : número de sujetos.
5. UN EJEMPLO DE CÁLCULO:

Hallar el percentil correspondiente a la puntuación que ocupa el rango 32º de una serie creciente de 64 rangos.
Paso 1º) Ordenar las puntuaciones en una serie creciente
Paso 2º) Adjudicar los rangos a las puntuaciones.
Paso 3º) Trasladamos a la fórmula los dos valores conocidos (R y n)
P = 100 –
P = 100 – = =100 – 49= 51
6. HALLAR LA PUNTUACIÓN QUE LE CORRESPONDE A UN DETERMINADO PERCENTIL
El otro posible cálculo consiste en hallar la puntuación que ocupa el rango correspondiente a un determinado percentil.
a. FÓRMULA:
R=–1
b. SIMBOLOGÍA:
Los mismos significados expuestos más arriba.
7. UN EJEMPLO DE CÁLCULO:
Hallar la puntuación que ocupa el rango que tiene el percentil 60 en una muestra de 80 individuos.
Paso 1º: Encontrar el rango que corresponde al percentil 60.
R= –1 R= –1 1 R = 48 – 1= 47
Paso 2º: encontrar en la serie de puntuaciones, la puntuación que corresponde al rango 47º, hallado en el paso 1º. Para ello, en la serie de
puntuaciones, contamos desde la que ocupa el rango 1º hasta llegar a la puntuación que ocupa el rango 47, o sea, tantas puntuaciones como
indique el rango hallado cuando aplicamos la fórmula precedente.
8. LOS CUARTILES
Los cuartiles son, como los percentiles y los deciles, <cuantiles>, y son tres: < cuartil 1º> (Q1)), <cuartil 2º> (Q2) y <cuartil 3º> (Q3), que se
corresponden respectivamente con los percentiles <25>, <50> y <75>. El <Q2> coincide con la <mediana> (Md).
Los <cuartiles> pueden ser calculados aplicando las fórmulas presentadas para el cálculo de los percentiles, teniendo presente las
equivalencias existentes entre <cuartiles> y <percentiles>.

CUADRO Nº 19: LA MEDIA ARITMÉTICA
1. INTRODUCCIÓN
Recordamos que los índices de tendencia central, también llamados promedios, son la moda (Mo), la mediana (Md), la media aritmética (), la
media geométrica (Xg), la media armónica (Xa) y la media cuadrática (Xc).
Dedicamos este cuadro a presentar la media aritmética, que también puede denominarse simplemente <media> sin añadir ningún adjetivo
(geométrica, armónica o cuadrática).
2. DEFINICIÓN, SÍMBOLO, FÓRMULAS Y SIMBOLOGIAS DE LA MEDIA ARITMÉTICA
a. DEFINICIÓN
La media aritmética es la suma de todas las puntuaciones dividida entre el número de puntuaciones.
b. SÍMBOLO
El símbolo de la media aritmética es una (una X mayúscula con un segmento de recta situado sobre la X).
c. FÓRMULAS
Las fórmulas de la media aritmética son las tres siguientes:
1) Fórmula básica =
2) Fórmula para datos con frecuencias: =
3) Fórmula para datos agrupados en intervalos con sus frecuencias: =
d. SIMBOLOGÍA
: media aritmética
X (X mayúscula): puntuación directa
n (n minúscula): número de puntuaciones, una por cada individuo.
∑ (letra griega <sigma> mayúscula): sumatorio: indica que hay que sumar los valores numéricos que toman los símbolos que siguen al
sumatorio.
f (<f> minúscula): frecuencia, número de sujetos cuyas puntuaciones han obtenido el mismo valor.
Xj (X mayúscula con una <j> minúscula como subíndice): punto central o medio de cada intervalo.
3. CASOS EN EL CÁLCULO DE LA MEDIA ARITMÉTICA:
En el cálculo de la media aritmética se pueden presentar tres casos, según sea el número de valores que pueden tomar las puntuaciones y el
número de puntuaciones:
a. Menos de 12 valores numérico, con o sin agrupar las puntuaciones por frecuencias.
b. Entre 15 y 20 valores sin agrupar en intervalos, cada valor con su frecuencia.
c. Más de 20 valores, necesariamente agrupados en intervalo, con sus frecuencias.
4. CASO <a>: CÁLCULO DE LA MEDIA ARITMÉTICA CON UN NÚMERO DE VALORES MENOR DE 12, SIN Y CON FRECUENCIAS:
Cuando el número de valores es bajo, menos de 12 o 15, puede calcularse manualmente la media aritmética. Se aplica la fórmula ya conocida;
no es necesario agrupar los valores en intervalos.
El procedimiento es muy sencillo: una suma y una división.

Paso 1º) Se suman las puntuaciones directas: ∑X
Paso 2º) Se divide la anterior suma entre el número de puntuaciones: n
Describamos el procedimiento resolviendo este problema:

Un grupo de doce (12) alumnos han obtenidos en un test con diez (10) posibles valores (1, 2, 3, 4, 5, 6, 7, 8, 9 y 10), las siguientes
puntuaciones: 6, 5, 6, 7, 7, 4, 5, 6, 5, 3, 5 y 8.
Paso 1º) Presentamos estos valores en la siguiente tabla:
SUJETOS PUNTUACIÓN
OBTENIDA POR
CADA SUJETO
Ruth 6
Neftalí 8

Rebeca 6
Sara 3
Abraham 4
Isaac 5
Moisés 7
Esther 5
Susana 5
Rubén 6
Raquel 5
Noé 7
n = 12 ∑X = 67
Paso 2º) Utilizamos la fórmula general, usada cuando no hay tabla de frecuencias de los valores ni hay intervalos agrupando valores:
=
n= 8
∑X= 6 + 8 + 6 + 3 + 4 + 5 + 7 + 5 + 5 + 6 + 5 + 7 = 67
Paso 3º) Trasladamos esos datos a la fórmula:
= = 5.58
También podríamos haber calculados la media aritmética utilizando la tabla de frecuencias (estaríamos ya en el segundo caso de los tres
posibles en el cálculo de la media aritmética):
Valores del test Frecuencia Producto de

de cada valor cada valor por su
frecuencia
1 0 0
2 0 0
3 1 3
4 1 4
5 4 20
6 3 18
7 2 14
8 1 8
9 0 0
10 0 0
n = 12 ∑(x)(f)=67
Utilizaremos otra fórmula, pero el resultado es idéntico:
===5.58
5. CASO : CÁLCULO DE LA MEDIA ARITMÉTICA DE LAS PUNTUACIONES AGRUPADAS POR SUS POSIBLES VALORES CON SUS
RESPECTIVAS FRECUENCIAS.
Cuando el número de puntuaciones es elevado, la mayoría de los valores de las puntuaciones se repiten, presentan frecuencias. En este caso
la fórmula a utilizar para calcular la media aritmética (X) es la siguiente:
a. FÓRMULA:
b. SIMBOLOGÍA:
X= puntuación directa
f= frecuencia, número de puntuaciones que obtienen el mismo valor.
n= ∑ f =número de puntuaciones o sea, sumatorio de las frecuencias de todos los valores..
∑ (X)(f)= sumatorio de los productos de cada valor por su respectiva frecuencia.
c. UN EJEMPLO DE PRO CEDIMIENTO DE CÁLCULO

Hallar la media aritmética de las puntuaciones obtenidas por una muestra de 20 sujetos en una prueba en la que se habían podido obtener
once distintos valores (0, 1, 2, 3, 4, 5, 6, 7, 8, , 9 y 10)
Tabla I
A B C
VALORES QUE FRECUENCIAS (Nº DE PRODUCTO DE

PUEDEN TOMAR PUNTUACIONES CON VALORES POR
LAS EL MISMO VALOR) FRECUENCIAS
PUNTUACIONES
0 0

1 0
2 1
3 3
4 6
5 8
6 5
7 3
8 2
9 1
10 1
N = 30
Paso 1º) Se suman las frecuencias (COLUMNA ).

Paso 2º) Se multiplica cada valor (columna <A>) por su correspondiente frecuencia (columna ) resultando la columna <C>.
Paso 3º) Se suman los productos de los valores por sus frecuencias (columna <C>).
VALORES FRECUENCIAS PRODUCTOS

VALORES
PORFRECUENCIAS
0 0 0
1 0 0
2 1 2
3 3 9
4 6 24
5 8 40
6 5 30
7 3 21
8 2 16
9 1 9
10 1 10
N = 30 ∑ (X) (f) = 140
Paso 4º) Trasladamos estos datos a la fórmula:
= 4.66

CUADRO Nº 20: CÁLCULO DE LA MEDIA ARITMÉTICA CON LOS DATOS
1. INTRODUCCIÓN
Cuando el número de valores es superior a 12 0 15, es más práctico agruparlos en intervalos. Los intervalos deberán cumplir las siguientes
condiciones:
a. Cualquier valor debe estar incluido en un intervalo y sólo en ese intervalo.

b. Todos los intervalos tendrán el mismo número de valores.
De este modo, la aplicación de una escala de medida que acoge un número de valores alto, p. e., 21, puede reducirse a siete intervalos de tres
valores cada uno. Operar con siete (7) es más fácil que operar con veintiuno (21). Ciertamente que unificar las frecuencias obtenidas por cada
valor del intervalo en una única frecuencia para todos los valores incluidos en ese intervalo, se pierde información, pero cuando esta pérdida se
considera despreciable para el resultado de la investigación, parece lícito hacerlo.
2. PROCEDIMIENTOS PARA AGRUPAR VALORES EN INTERVALOS
Veamos un ejemplo:
Supongamos una distribución de frecuencias de las puntuaciones obtenidas por 137 sujetos en un test de factor numérico de 21 valores (0
-20). En la siguiente tabla se expresa el número de sujetos (frecuencia) que han obtenido cada uno de los 21 valores posibles:

VALORES QUE PUEDEN FRECUENCIAS: Nº DE
TOMAR LAS PUNTUACIONES SUJETOS QUE HAN OBTENIDO
ESE VALOR
O 1
1 1
2 3
3 4
4 6
5 3
6 6
7 9
8 9
9 8
10 12
11 12
12 16
13 15
14 10
15 7
16 5
17 4
18 3
19 2
20 1
N = 137
Como vemos, tablas con 21 filas son poco manejables, por lo que parece conveniente agrupar los 21 valores en intervalos; por ejemplo, los 21
valores en 7 intervalos de 3 valores cada uno:
Intervalo Frecuencia
(i)
del
intervalo
0–2 5
3-5 13
6–8 24
9 – 11 32
12 - 14 41
15 – 17 16
18 - 20 6
N=137
Las frecuencias de cada intervalo resultan de la suma de las frecuencias de cada valor incluido en el intervalo. Por ejemplo:
Frecuencia del intervalo<12 – 14> (41) proviene de sumar 12 + 15 + 10, las frecuencias de los valores <12>, <13> y <14> respectivamente.
3. FÓRMULA Y SIMBOLOGIA
La fórmula para calcular la media aritmética () de las puntuaciones agrupadas en intervalos es:
=
a. SIMBOLOGÍA:

Significados de los símbolos de la fórmula:
media aritmética
n: numero de puntuaciones, o sea, la suma de todas las frecuencias
Xj: valor central de cada intervalo, o sea la mediana de cada intervalo.
fi: frecuencia del intervalo
(Xj)(fi): Producto del valor central de cada intervalo por la frecuencia del mismo intervalo.
∑ (Xj)(fi): Sumatorio, o sea, total de la suma de los productos de los valores centrales de cada intervalo por la frecuencia de cada intervalo.
4. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE LA MEDIA ARITMÉTICA CON LOS VALORES AGRUPADOS EN INTERVALOS
Problema:
Hallar la media aritmética de los valores agrupados en intervalos y sus respectivas frecuencias tal como aparecen en la Tabla I:
Tabla I
A B C D
INTERVALO (I) PUNTO FRECUENCIA DEL PRODUCTO DEL

CENTRAL INTERVALO (fi) PUNTO CENTRAL DEL
INTERVALO POR LA
DEL
FRECUENCIA DEL
INTERVALO
INTERVALO (f) (Xj)
(XJ)
0–2 1 5
3-5 4 13
6–8 7 24
9 – 11 10 32
12 - 14 13 41
15 – 17 16 16
18 - 20 19 6
n=137
Paso 1º.- Se determina el punto central de cada intervalo <XJ> (X mayúscula con una j minúscula como subíndice). Pueden darse dos casos:
a. Si el número de valores del intervalo es impar, el punto medio del intervalo será aquel que deja a su derecha y a su izquierda el mismo
número de valores.
b. Si el número de valores del intervalo es par, el punto medio será la suma de los dos valores centrales dividido por dos (2). Por ejemplo,
si el intervalo es
8 – 13, el número de valores que lo integran son <6>, hay dos valores centrales (10 y 11). El valor central que represente al intervalo es: =
= 10.50
En nuestro caso el número de valores de cada intervalo es un número impar, por lo que el punto central es un número entero, lo que
simplifica los cálculos.
Paso 2º) La columna <D> acogerá los productos (las multiplicaciones) de los puntos centrales de cada intervalo por su respectiva frecuencia:
el valor central (X¡) por la frecuencia de ese concreto intervalo: (Xj)(f).
Tabla II
A B C D
INTERVALO PUNTO FRECUENCIA PRODUCTO

(I) CENTRAL DEL INTERVALO DEL PUNTO
DEL (fi) CENTRAL DEL
INTERVALO INTERVALO POR
(XJ) LA FRECUENCIA
DEL INTERVALO
(f) (Xj)
0–2 1 5 5
3-5 4 13 52
6–8 7 24 168
9 – 11 10 32 320
12 - 14 13 41 533
15 – 17 16 16 256
18 - 20 19 6 114
n=137 1448
Paso 4º) Trasladamos los datos a la fórmula de la media aritmética:

= 10.56
CUADRO Nº 21: LA MEDIA GEOMÉTRICA
1. LAS OTRAS TRES MEDIAS

Ya hemos presentado los índices de tendencia central más utilizados:
Moda (Mo),
Mediana (Md)
Media aritmética ( )
Pero tenemos tres índices más de tendencia central:
Media geométrica (Xg)
Media armónica (Xa)
Media cuadrática (Xc)
Dedicamos este <cuadro> a presentar la primera de estas tres últimas.
2. LA MEDIA GEOMÉTRICA
Se define la media geométrica (Xg) como la media aritmética de los logaritmos de las puntuaciones. También puede definirse como la raíz
enésima del producto de las puntuaciones, entendiendo por <enésima> equivalente a <n>: el número de puntuaciones.
Símbolo de la media geométrica: Xg
a. FÓRMULAS:
Xg =
Xg =
b. SIMBOLOGÍA:
n: número de sujetos
Xa: puntuación obtenida por el sujeto <a>
Xb: puntuación obtenida por el sujeto 
Xc : puntuación obtenida por el sujeto <c>
Xn : puntuación obtenida por el sujeto <n>
c. PROCEDIMIENTO:
Paso 1º: Se multiplican las tres, cuatro…<n> puntuaciones, las que sean.
Paso 2º: Se calcula la raíz cúbica si son tres las puntuaciones, o la raíz cuarta si son cuatro, la raíz quinta si son cinco, etc., el índice de la raíz
es el número de puntuaciones (n) obtenidas en una prueba por una muestra.
Problema:
Ejemplo : Hallar el valor de la media geométrica de las siguientes tres puntuaciones: 5, 8 y 10.
1º) Multiplicamos el (5) (8)= 40. Multiplicamos (40)(10)=400.
2º) A este resultado, se le extrae la raíz cúbica, ya que son tres las puntuaciones. Utilizamos la calculadora científica para calcular la raíz
cúbica:
= 4.47
Otro ejemplo:
Hallar el valor de la media geométrica de las siguientes cuatro puntuaciones: 4, 5, 7 y 8:
1º) multiplicamos los cuatro números: (4)(5)(7)(8) = 1120
2º) Extraemos la raíz cuarta de 1120. Resulta 2.40
CUADRO Nº 22: LA MEDIA CUADRÁTICA Y LA MEDIA ARMÓNICA
1. DEFINICIÓN, SÍMBOLO, FÓRMULAS Y SIMBOLOGIA DE LA MEDIA CUADRÁTICA
a. DEFINICIÓN
La media cuadrática (Xc) es el valor resultante de extraer la raíz cuadrada a la media aritmética de los cuadrados de todas las puntuaciones.
b. SÍMBOLO: Xc
c. FORMULA:
Xc=
d. SIMBOLOGÍA:
X: puntuación directa obtenida por cada sujeto.

X2: cuadrado de la puntuación obtenida por cada sujeto.
∑: suma de cuadrados de las puntuaciones obtenidas por todos los sujetos.
2. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE LA MEDIA CUADRÁTICA
Problema:
Hallar la media cuadrática de las cinco siguientes puntuaciones: 3, 5, 5, 6 y 8.
Veamos la siguiente tabla:

A B
PUNTUACIONES CUADRADOS DE
LAS
PUNTUACIONES
3 9
5 25
5 25
6 36
8 64
TOTAL 159
1º) Hallamos los cuadrados de las cinco puntuaciones: 9, 25, 25, 36 y 64.
2º) Sumamos estos cinco cuadrados: 9+25+25+36+64=159.
3º) Dividimos la suma de los cuadrados (159) entre el número de puntuaciones (5). Resulta 31.8
4º) Extraemos la raíz cuadrada de 31.8.
Xc= Xc= = 5.63
3. DEFINICIÓN, SÍMBOLO, FÓRMULA Y SIMBOLOGÍA DE LA MEDIA ARMÓNICA
a. DEFINICIÓN
La media armónica puede definirse:
1) La <Xa> es el número recíproco de la media aritmética de los números recíprocos de las puntuaciones.
La <Xa > es el valor numérico resultante de dividir el número de sujetos entre la suma de los números recíprocos de las puntuaciones
obtenidas por los sujetos de la muestra. Utilizaremos esta fórmula en el ejemplo de cálculo.
b. SÍMBOLO: Xa (también se la simboliza con la letra <H> mayúscula; procede del término <Harmony>).
c. FÓRMULA :
Xa =
SIMBOLOGÍA:
n: número de puntuaciones
: número recíproco de cada puntuación.
∑: suma de los recíprocos de todas las puntuaciones.
4. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE LA MEDIA ARMÓNICA

Este problema como ejemplo de cálculo:
Hallar la media armónica ( Xa) de las siguientes seis puntuaciones: 2, 3, 4, 4, 5 y 6.
A B C
SUJETOS PUNTUACIONES RECÍPROCOS

DE LAS
PUNTUACIONES
Iván 2
Irene 3
Sandra 4
Sergio 4
Tania 5
Miguel 6
Paso 1º): Se halla con una calculadora científica los valores de los recíprocos de cada puntuación (el recíproco de un número es el resultado
de dividir la unidad <1> entre dicho número).
Los números recíprocos de 2, 3, 4, 4, 5 y 6 son respectivamente: 0.50, 0.33, 0.25, 0,25, 0,20 y 0.16.
= 0.33 =0.25 =0.25 = 0.20 = 0.16
Paso 2º): Sumamos los recíprocos de las seis puntuaciones.
A B C
SUJETOS PUNTUACIONES RECÍPROCOS DE

LAS PUNTUACIONES
Iván 2 0.50
Irene 3 0.33
Sandra 4 0.25
Sergio 4 0.25
Tania 5 0.20
Miguel 6 0.16
n=6 ∑= 1.69
Paso 3º): Dividimos el número de puntuaciones (n) entre el resultado de la suma anterior (1.69):
Xa = Xa = = 3.55
La media armónica resultante en el problema anterior es: 3.55

CUADRO Nº 23: LOS ÍNDICES DE VARIABILIDAD/DISPERSIÓN
1. ¿POR QUÉ ES NECESARIO CALCULAR LOS ÍNDICES DE VARIABILIDAD PARA DESCRIBIR LAS PUNTUACIONES DE UNA MUESTRA?.
Los índices de variabilidad/dispersión de las puntuaciones obtenidas por una muestra en una determinada variable son imprescindibles,
porque los índices de tendencia central son insuficientes para describir correctamente la distribución de frecuencias de los valores de una
muestra. Es frecuente que dos muestras de 10 alumnos cada una tengan la misma media aritmética y, sin embargo, sus distribuciones de
frecuencias sean muy distintas. Por ejemplo, las dos distribuciones siguientes:
Muestra (A). Puntuaciones: 3, 5, 7, 9, 9, 10,10, 14,16 y 17. Suma de estas diez puntuaciones es 100: (∑X = 100), luego:
= = 10
Muestra (B). Puntuaciones: 9, 10, 10, 10, 10, 10, 10, 10, 10 y 11. Suma de estas puntuaciones es 100: (∑X = 100).
= = 10
Como vemos, la suma de los diez valores en ambas muestras es 100 (∑ X = 100). Por tanto, las medias aritméticas de ambas
distribuciones coinciden: 10: ( =10).
No obstante, aunque coinciden las medias aritméticas de ambas distribuciones de frecuencias, observamos que son distribuciones
muy distintas. En la distribución de frecuencias <A>, las puntuaciones se extienden, están más dispersas, mientras que en la distribución , las
puntuaciones están muy próximas al valor central. La información que dan las medias aritméticas es insuficiente para representar a toda la
distribución. Se necesitan otros índices que complementen las medidas de tendencia central; son precisos unos nuevos índices, aquellos que
nos van a decir si las puntuaciones se agrupan muy próximas al valor central de la distribución (la media aritmética, en nuestro caso) o, por el
contrario, aparecen dispersas con respecto a ese mismo valor central.
Esos nuevos índices son principalmente los de variabilidad/ dispersión y los índices de asimetría y de apuntamiento de menor importancia.
2. RELACIÓN DE LOS ÍNDICES DE VARIABILIDAD/DISPERSIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS.
Las características de los distintos índices de tendencia central (moda, mediana, media aritmética y las otras medias) limitan la aplicación de
los índices de variabilidad:
a. Los datos de variables cualitativas/atributos, medidos por escala nominal, sólo pueden ser tratados con un índice de tendencia central:
la <moda> (Mo), y ningún índice de variabilidad.
b. Los datos de variables cuantitativas discretas únicamente pueden ser tratados con un índice de tendencia central, conocido como
<mediana> (Md), con dos índices de variabilidad:
La <amplitud total o recorrido> (A)
La <amplitud semiintercuartíl> (Q).
c. Finalmente, para aquellos datos de variables cuantitativas continuas, se dispone, además de los dos anteriores, de cuatro índices de
variabilidad más:
a. La desviación media (DM)
b. La varianza ( S2)
c. La desviación estándar o típica (S)
Y derivado de este último, tenemos:
d. El coeficiente de variación (CV).
3. ADECUACIÓN DEL ÍNDICE DE VARIABILIDAD ELEGIDO CON EL TIPO DE DATOS
Están a nuestra disposición seis índices de variabilidad/dispersión de los datos de una distribución de frecuencias, pero conviene conocer
cuál es el más conveniente utilizar según sean las características de cada tipo concreto de datos.
a. La <Amplitud total> o <Recorrido> (A)
La amplitud total (A) se usa cuando se desea conocer los valores extremos, o sea obtener rápidamente un índice de variabilidad de acceso
inmediato, sin tener que realizar operaciones aritméticas. Pero la amplitud total es el índice de variabilidad menos fiable pues se basa en dos
únicos datos, el más alto y el más bajo de la distribución de frecuencias.
b. La amplitud semi-intercuartil (Q)
La <amplitud semi-intercuartíl> (Q) es un índice de variabilidad útil cuando:
a) Cuando el único índice de tendencia central que se puede calcular es la mediana (Md).
b) Cuando en una distribución los intervalos extremos carecen de límite superior y de límite inferior
c) Cuando la distribución de frecuencias es muy asimétrica.
d) Cuando se desea conocer sólo el 50% central de una distribución o sea, de los casos entre el cuartil 1º (Q1 ) y el cuartil 3º (Q3).

c. La desviación media (DM)
La desviación media (DM) puede usarse cuando la distribución es aproximadamente simétrica y completa, y no se desea realizar los complejos
cálculos necesarios para hallar la varianza (S2 ) o la desviación estándar (S).
d. La <varianza> y la <desviación estándar o típica>
La varianza (S2) y la desviación estándar (S) son los índices de variabilidad/dispersión más fiables y precisos ,y son indispensables para el
cálculo de ulteriores índices estadísticos.
e. El <coeficiente de variación> (CV)
El coeficiente de variación (CV) únicamente puede calcularse cuando los datos proceden de la aplicación de escalas de razón, o sea las que
miden variables cuantitativas continuas que tienen cero absoluto. Las variables implicadas en la problemática psicológica o pedagógica rara vez
cumplen este requisito; prácticamente sólo las variables psicofísicas (estatura, masa, velocidad, tiempo de reacción,...) pueden ser medidas con
escalas de razón. Hace posible comparas datos de dos muestras con diferentes medias y desviaciones estándar.
La fórmula del coeficiente de variación es:

V = (100)
O sea: cociente entre la desviación estándar de la muestra y la media aritmética de la misma muestra, multiplicado por 100.
Sus valores están entre <0> y <1>. Si es <0>, la muestra es compacta y si es <1>, dispersa.
4. PUNTUACIONES DIRECTAS Y PUNTUACIONES DIFERENCIALES
En primer lugar es necesario distinguir entre puntuaciones directas (X), o sea X mayúscula, y puntuaciones diferenciales (x), o sea x
minúscula. La puntuación diferencial es la diferencia entre cada puntuación directa, la obtenida por cada sujeto, y la media aritmética: x = X-
5. ADVERTENCIA SOBRE LOS SÍMBOLOS DE LA <VARIANZA Y LA <DESVIACIÓN ESTÁNDAR O TÍPICA>
De todos los índices de variabilidad arriba citados, prácticamente la inmensa mayoría de los problemas estadísticos utilizan la varianza <S2> y
la desviación estándar <S> (véase que estas letras son en mayúscula, y que la varianza es el cuadrado de la desviación estándar). En algunos
textos de estadística descriptiva y calculadoras científicas encontraremos que la <S> y la <S2> son sustituidas por la letra griega sigma
minúscula < s> para la desviación estándar con datos muestrales, y la sigma minúscula al cuadrado <s2> para la varianza también para datos
muestrales. Nosotros preferimos reservarlas para la varianza y la desviación estándar estimadas en la población, ya tema propio de la Estadística
Inferencial.
A nuestro entender, para evitar confusiones, los símbolos de la varianza y la desviación estándar de datos muestrales serán letras del alfabeto
latino (<S2> y <S>), como se hace en este texto. Por el contrario, los símbolos de la desviación estándar y la varianza estimadas en poblaciones
deben ser letras del alfabeto griego: sigma minúscula <s > y sigma minúscula al cuadrado <s2>.
6. CUADRO CON LAS RELACIONES ENTRE VARIABLES, ESCALAS DE MEDIDA, ÍNDICES DE TENDENCIA CENTRAL E ÍNDICES DE
VARIABILIDAD/DISPERSIÓN
TIPOS DE ESCALA ÍNDICES ÍNDICES DE

VARIABLES DE MEDIDA DE VARIABILIDAD
TENDENCIA
CENTRAL
Variables Escala Moda (Mo) Ninguno

Cualitativas nominal
Variables Escala Mediana Amplitud total o

Cuantitativas ordinal (Md) recorrido (A)
Amplitud semi-
Discretas
intercuartil
(Q)
Variables Escala de Media Desviación media

cuantitativas Intervalo y aritmética Desviación estándar
Media o típica
continuas escala de
geométrica
razón Varianza
Media Coeficiente o razón
cuadrática de variación (Sólo con
Media escalas de razón)
armónica
CUADRO Nº 24: AMPLITUD TOTAL Y AMPLITUD SEMI-INTERCUARTIL
1. INTRODUCCIÓN
Hemos visto en el cuadro nº 23 dedicado a la presentación de los índices de variabilidad o dispersión, de las dos formas se les puede
denominar, las siguientes:
a. Amplitud/recorrido total,

b. Amplitud semiintercuartílica,
c. Desviación media
d. Varianza y desviación estándar
e. Coeficiente de variación
En el presente cuadro vamos a tratar únicamente:
a. La amplitud total (A): es el índice de variabilidad más simple, aunque el menos preciso, raramente utilizado, salvo, con datos ordinales,
pues es el único índice de variabilidad que puede aplicarse a datos ordinales.
b. Amplitud semi-intercuartil: amplitud existente entre el valor del cuartil 2º menos el cuartil1º (o lo que es lo mismo: amplitud existente
entre el percentil 75, menos el percentil 25) y dividido entre dos (2).
Comenzamos con:
2. LA AMPLITUD TOTAL
La amplitud o recorrido total puede aplicarse a una distribución de puntuaciones de una variable cuantitativa discreta o continua, ordenadas
en una serie progresiva de menor a mayor puntuación. Su valor es la diferencia entre la puntuación más alta y la más baja más la unidad. Por
supuesto que para calcular la amplitud> es preciso ordenar las puntuaciones de menor a mayor o viceversa. Hecho esto, es fácil determinas las
puntuaciones máxima y mínima.
Pueden darse dos casos:
a. Que la puntuación menor sea <uno> (1).

b. Que la puntuación menor de la serie no sea <uno> (1)
Si la serie comienza con <1>, será suficiente contar el número de puntuaciones: ese número será la <amplitud>.
En aquellos casos en los que los valores numéricos que portan las puntuaciones no comienzan con la unidad (1), habrá que
determinar cuál es el valor inferior de la serie de puntuaciones y el valor superior de la misma. Por ejemplo, si en un test de razonamiento
numérico, la puntuación menor de la serie es 65 y la puntuación superior de la misma serie es de 90, será preciso calcular la amplitud de esa
serie, cuya puntuación menor el 65 y cuya puntuación superior es 90. La amplitud (A) es la diferencia entre la puntuación superior y la puntuación
inferior +1 (Lsup-Linf +1). En nuestro ejemplo: 90-65 +1 La amplitud (A) de esa serie es 26.
a. FÓRMULA:
A = Xmax – Xmin + 1
b. SIMBOLOGÍA:
A : amplitud
Xmax : la mayor puntuación de la serie ordenada de menor puntuación a mayor puntuación de las obtenidas por los sujetos.
Xmin : la menor puntuación de la misma serie
3. EJEMPLOS DE CÁLCULO DE LA AMPLITUD
Un problema:
Un grupo de seis (6) niños han obtenido en una prueba de diez (10) valores, las siguientes puntuaciones: 3, 9, 5, 4, 2, 7. En primer lugar las
ordenamos en una serie desde la puntuación menor hasta la puntuación mayor: <2, 3, 4, 5, 7, 9>.
Aplicamos la fórmula:
A = 9 – 2+1 = 5 + 1 = 8
Otros ejemplos:
a. Una serie ordenada de puntuaciones comienza en <5> y concluye en <24>.
A = 24-5+1 = 19+1 =20
b. Otra serie: <33, 34, 35, …48, 49>
A = 49-33+1 = 16+1 = 17
4. LA AMPLITUD SEMIINTERCUARTIL (Q)
Es un índice de variabilidad útil cuando:

1) El único índice de tendencia central que se puede calcular es la mediana (Md
2) Cuando en una distribución, los intervalos extremos carecen de límite superior y de límite inferior.
3) Cuando la distribución de frecuencias sea muy asimétrica,
4) Cuando se desea conocer la distribución de frecuencias del 50% central, o sea, de los casos entre el cuartil 1º y el cuartil 3º.
a. FÓRMULA:

DC =
b. SIMBOLOGÏA:
DC : desviación <cuartílica> o <amplitud intercuartil>
Q3 : Cuartil 3º, o sea, percentil 75
Q1 : Cuartil 1º, o sea, percentil 25
5. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO:
En primer lugar hay que determinar los rangos del primer cuartil (Q1) y del tercer cuartil (Q3) de la serie ordenada de las puntuaciones.
Sabemos que el primer cuartil es igual al percentil 25 y que el tercer cuartil es igual al percentil 75. Para calcular los rangos correspondientes a
los percentiles 25 y 75, utilizamos esta fórmula:
R=–1
Por ejemplo:
Qué rangos de una serie de 80 puntuaciones corresponderán a los percentiles 25 y 75.
R = – 1 = 20 – 1 = 19
R = – 1 = 60 – 1 = 59
Calcular la amplitud semiintercuartil de una serie de puntuaciones, siendo los valores de los cuartiles primero y tercero 20 y 52
respectivamente.
DC = = 16

CUADRO Nº 25: LA DESVIACIÓN MEDIA (DM)
1. DEFINICIÓN
La desviación media <DM> es uno de los índices de variabilidad o dispersión, como la amplitud o recorrido (A), la varianza (S2), la desviación
estándar o típica (S) y el coeficiente de variación.
Definimos la desviación media (DM) como la media aritmética de las puntuaciones diferenciales (x, x minúscula) en valores absolutos, o
sea, prescindiendo del signo positivo (+) o negativo (-) que las pueda preceder. Podemos preguntarnos por qué debemos prescindir de los signos
que preceden a cada puntuación diferencial (x).La razón de ello reside en la naturaleza de las puntuaciones diferenciales.
2. RECORDAMOS QUÉ SON LAS PUNTUACIONES DIFERENCIALES
Una puntuación diferencial (x minúscula) es el resultado de restar a cada puntuación directa (X, X mayúscula) el valor de la media aritmética
de las puntuaciones directas (). Escrito como ecuación: x = X-
¿Por qué hay que prescindir de los signos positivos o negativos de las puntuaciones diferenciales? Porque la suma de las puntuaciones
diferenciales siempre resulta cero, las puntuaciones diferenciales positivas anulan a las puntuaciones diferenciales negativas. Por tanto, no
podemos calcular su media aritmética, ni operar con ellas, a menos que utilicemos una de estas dos soluciones:
a. Prescindamos de los signos positivos (+) o negativos (-) de las puntuaciones diferenciales (x) o sea, operar con sus valores absolutos.
b. Elevar al cuadrado dichas puntuaciones diferenciales, pues al elevar al cuadrado cualquier número, ya sea positivo o negativo, siempre
será positivo. Recordemos aquella reglas algebraica que decía: <+> por <+>, da <+>; <-> por <->, da <+>; <+> por <->, da <->; <-> por
<+>, da <->.
3. TIPOS DE CASOS EN EL CÁLCULO DE LA DESVIACIÓN MEDIA (DM):
Distinguimos tres casos:

a. Las puntuaciones son menos de 12 (Hemos elegido 12, pero puede ser otro número superior, según el <calculador> esté más o menos
dispuesto a dedicar tiempo y esfuerzo a la tarea de operar manualmente o con calculadora).
b. El número de puntuaciones es igual o mayor de 12.
c. Si el número de valores es superior a 12, conviene agrupar los valores en intervalos.
4. CÁLCULO DE LA DESVIACIÓN MEDIA CUANDO EL NÚMERO DE PUNTUACIONES ES INFERIOR A DOCE
a. FÓRMULA:
DM=
b. SIMBOLOGÍA:
DM: desviación media
x: puntuación diferencial, o sea, la diferencia entre la puntuación directa (X) y la media aritmética (de las puntuaciones directas de todos los
sujetos de la muestra.
: puntuación diferencial en valores absolutos, o sea, prescindiendo del signo.
∑ : suma de todas las puntuaciones diferenciales en valores absolutos, o sea prescindiendo del signo aritmético. Observemos que los
números absolutos se escriben entre dos líneas rectas verticales: , por ejemplo.
n= número de puntuaciones, o sea, número de sujetos que han obtenido una puntuación.
5. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE LA DESVIACIÓN MEDIA
Problema:
Hallar la desviación media de las puntuaciones obtenidas por 10 alumnos en una prueba de historia. Las puntuaciones fueron: 3, 5, 7, 9, 6, 2, 5,
7, 4 y 8.
Situamos las puntuaciones, la media aritmética y las puntuaciones diferenciales en valores absolutos en la Tabla I
Tabla I
A B C D
Puntuaciones Media Puntuaciones Puntuaciones

directas (X) aritmética diferenciales (x) diferenciales en
valores
absolutos
2 5.6 2 - 5.6 = - 3.6 3.6
3 5.6 3 - 5.6 = -2.6 2.6
4 5.6 4 - 5.6 = -1.6 1.6
5 5.6 5 - 5.6 = - 0.6 0.6

5 5.6 5 - 5.6 = -0.6 0.6
6 5.6 6 - 5.6 = +0.4 0.4
7 5.6 7 - 5.6 = +1.4 1.4
7 5.6 7 - 5.6 = +1.4 1.4
8 5.6 8 - 5.6 = +2.4 2.4
9 5.6 9 – 5.6 = +3.4 3.4
∑X = 56 ∑18
Paso 1º) Calculamos la media aritmética y la situamos en la columna :
= 5.6
Paso 2º) Calculamos las puntuaciones diferenciales, hallando las diferencias entre cada puntuación directa y la media aritmética, como puede
verse en la columna <C> de la anterior tabla.
Paso 3º) Sumamos las puntuaciones diferenciales como valores absolutos, o sea, prescindiendo del signo positivo (+), negativo (-) o nulo (0)
(columna<D>).
Paso 4º) Dividimos el total obtenido en el paso anterior, por el número de puntuaciones:
DM = DM = =
6. PROCEDIMIENTO DE CÁLCULO DE LA DESVIACIÓN MEDIA CUANDO EL NÚMERO DE PUNTUACIONES ES IGUAL O SUPERIOR A DOCE (12)
CON SUS FRECUENCIAS
El procedimiento de cálculo de la DM cuando las puntuaciones llegan a un número demasiado grande y, por tanto, el número de operaciones
aritméticas aumenta, conviene agrupar las puntuaciones repetidas dos o más veces por sus valores y frecuencias. Este procedimiento es casi
idéntico al expuesto más arriba.
a. FÓRMULA:
DM=
Advirtamos que la fórmula anterior es similar a la fórmula del primer caso, salvo que en el numerador de la anterior aparece como factor la <f>
(frecuencia).
b. SIMBOLOGÍA:
DM : desviación media
X: puntuación directa
x: puntuación diferencial, o sea, la diferencia entre la puntuación directa (X) y la media aritmética () de las puntuaciones directas de todos los
sujetos de la muestra.
f : frecuencia, número de puntuaciones de cada valor.
∑ (f)( X) : suma de todos los productos de cada puntuación directa por su respectiva frecuencia.
∑(f)() : suma de los productos de las puntuaciones diferenciales en valores absolutos por sus respectivas frecuencias.
n= número de puntuaciones, o sea, suma de todas las frecuencias.

7. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE LA DESVIACIÓN MEDIA CON LAS FRECUENCIAS DE CADA VALOR
Problema:
Se aplicó un test de seis valores posibles (1, 2, 3, 4, 5 y 6) a un grupo de 70 estudiantes. Los valores ocupan la columna <A> de Tabla II:
Tabla II
A B C D E F
Puntuaciones Frecuencias Productos Puntuaciones Puntuaciones Producto

directas (X) (f) de las diferenciales x = diferenciales en de las
puntuaciones X- valores absolutos puntuaciones
directas por () diferenciales
sus en valores
frecuencias absolutos
(X)(f) por sus
frecuencias ()
(f)
1 10 10
2 15 30
3 20 60
4 12 48
Paso 1º) Sumamos las frecuencias. Obtenemos <n>: n = 70 (columna 

5 8 40
de la Tabla II).
6 5 30
Paso 2º) Multiplicamos cada valor por su frecuencia (columna <C>).
Totales n = 70 218 Paso 3º) Sumamos los productos de cada puntuación directa por su
respectiva frecuencia (columna <C>).
Paso 4º) Se calcula la media aritmética de las puntuaciones directas, dividiendo la suma de los productos de las puntuaciones directas por sus
frecuencias (∑(f)(X) ) entre la suma de las frecuencias (n) o sea, el número de casos.
= = = 3.11
Paso 5º) Restamos de los valores (X), la media aritmética (), los resultados de esas restas son las puntuaciones diferenciales (x) la mitad
llevaran signo positivo y la otra mitad, negativo.(columna <D> de la Tabla III). Todas las diferencias aparecen indicadas: el valor como minuendo
y la media aritmética como sustraendo.
Paso 6º) Se prescinde de los signos de las puntuaciones diferenciales, o sea, se las considera valores absolutos (columna <E> de la Tabla III).
Paso 7º) Multiplicamos cada puntuación diferencial en valores absolutos por sus respectivas frecuencias (columna <F>).
Tabla III
A B C D E F
Puntuaciones Frecuencias Producto Puntuaciones Puntuaciones Producto

directas (X) (f) (X)(f) diferenciales x = Diferenciales ()(f)
X- Con valores
absolutos ()
1 10 10 1-3.11 = -2.11 2.11 21.1
2 15 30 2 – 3.11=-1.11 1.11 16.65
3 20 60 3 – 3.11 = -- 0.11 2.20

0.11
4 12 48 4 – 3.11 =+ 0.89 10.68

0.89
5 8 40 5-3.11=+1.89 1.89 15.12
6 5 30 6-3.11=+2.89 2.89 14.45
Totales N = 70 218 80.20
8º) Sumamos, los resultados de las productos: ∑ (f) (columna <F>).

9º) Trasladamos los valores obtenidos en los pasos anteriores, que están recogidos en la Tabla III, a la fórmula:
DM= DM= DM= 1.14
CUADRO Nº 26: CÁLCULO DE LA DESVIACIÓN MEDIA (DM) CON DATOS

1. INTRODUCCIÓN
El cálculo de la desviación media (DM) cuando los valores, que pueden tomar las puntuaciones obtenidas por <n> individuos, son más de más
de 12 o 15, por comodidad, agrupamos los valores en intervalos; o sea, se divide el número de valores entre 3, 4, 5 o 6, lo que agrupa los valores
en intervalos, cada uno de estos con el mismo número de valores correlativos. Por ejemplo, si una escala puede tener entre los valores <1> y
<30> y decidimos formar intervalos de 3 valores cada uno, nos resultarán diez (10) intervalos. Si la escala comienza en 21 y concluye en 60, los
cuarenta valores posibles pueden ser repartidos en ocho (8) intervalos de cinco (5) valores consecutivos cada uno.
Recordadas estas nociones básicas sobre los intervalos, proponemos la resolución de un problema a fin de facilitar la comprensión del
procedimiento de cálculo de la desviación media (DM) cuando los valores están agrupados en intervalos. Veamos, en primer lugar, la fórmula y
el significado de los símbolos que aparecen en ella.

a. FÓRMULA:
DM =
b. SIMBOLOGÍA:
Xj: puntuación media del intervalo.
fi : frecuencia de cada intervalo.
n : suma de todas las frecuencias de cada intervalo (n = ∑Xj) o sea: número total de puntuaciones.
x: puntuación diferencial.
: puntuación diferencial en valores absolutos.
∑(f): suma de los productos de las puntuaciones diferenciales en valores absolutos por sus frecuencias.
3. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO
Problema:
Hallar
la desviación
media de los
datos
presentados en
la Tabla I
Tabla I
A B C D E F G
INTERVALOS PUNTO FRECUENCIA PRODUCTO PUNTUACIÓN PUNTUACIÓN PRODUCTO
MEDI0 DEL f PUNTO MEDIO DIFERENCIAL EN
DIFERENCIAL PUNTUACIÓN
INTERVALO POR VALORES
Xj FRECUENCIA x= Xm- ABSOLUTOS DIFERENCIAL
(Xj)(f) POR
FRECUENCIA
(f)
1-5 3 5
6 - 10 8 20
11 -15 13 30
16 - 20 18 45
21 - 25 23 25
26 – 30 28 10
TOTALES 135
Paso 1º) Sumamos las frecuencias de todos los intervalos, obtenemos <n>.
Paso 2º) Multiplicamos el punto medio de cada intervalo por su respectiva frecuencia.
Paso 3º) Sumamos los productos del <paso> 2º
Paso 4º) Calculamos la media aritmética
= = 16.51
Paso 5º) Calculamos las puntuaciones diferenciales: restamos la media aritmética del punto medio de cada intervalo.

Tabla II
MEDI0 <f> PUNTO MEDIO
DIFERENCIAL DIFERENCIAL PUNTUACIÓN
POR
DEL <x= Xm-> EN VALORES DIFERENCIAL
FRECUENCIA
INTERVALO POR
<(Xj)(f)> ABSOLUTOS FRECUENCIA
<Xj>
(f)>
1-5 3 5 15 3–16.51= - 13.51

13.51
6 - 10 8 20 160 8– 6.51 = - 8.51

8.51
11 -15 13 30 390 13 – 3.51

16.51=-3.51
16 - 20 18 45 810 18 – 1.49
16.51=+1.49
21 - 25 23 25 575 23 – 6.49
16.51=+6.49
26 – 30 28 10 280 28- 11.49

16.51=+11.49
TOTALES n =135 = 2230
Paso 6º) Multiplicamos cada puntuación diferencial en valores absolutos (o sea, prescindiendo del signo <+> o del signo <->) por su frecuencia
(tabla III).
Paso 7º) Sumamos los resultados de los productos de las puntuaciones diferenciales en valores absolutos por sus frecuencias (Tabla III).
Tabla III
MEDI0 <f>
PUNTO DIFERENCIAL DIFERENCIAL PUNTUACIÓN
DEL MEDIO <x= Xm-> EN VALORES DIFERENCIAL
INTERVALO POR
<Xj> POR ABSOLUTOS
FRECUENCIA FRECUENCIA
<(Xj)(f)> (f)>
1-5 3 5 15 3–16.51= - 13.51 67.55

13.51
6 - 10 8 20 160 8– 6.51 = - 8.51 170.20

8.51
11 -15 13 30 390 13 – 3.51 105.30

16.51=-3.51
16 - 20 18 45 810 18 – 1.49 67.05

16.51=+1.49
21 - 25 23 25 575 23 – 6.49 162.25

16.51=+6.49
26 – 30 28 10 280 28- 11.49 114.90

16.51=+11.49
TOTALES n =135 = 2230 (f)=687.25
Paso 8º) Trasladamos los resultados a la fórmula:

DM = ; DM = = 5.09
CUADRO Nº 27: VARIANZA Y DESVIACIÓN ESTANDAR
1. OPERAR CON PUNTUACIONES DIFERENCIALES
Como ya hemos expuesto en los anteriores <cuadros>, una puntuación diferencial <x> (x minúscula) es el resultado de restar a cada
puntuación directa <X> (X mayúscula) el valor de la media aritmética de las puntuaciones directas (). Escrito como ecuación: x = X- . Las
puntuaciones diferenciales o son cero o llevan signo positivo o signo negativo; pero, si deseamos calcular la media aritmética de las
puntuaciones diferenciales ( x ), necesariamente el resultado es <0> (cero), porque la suma de las puntuaciones diferenciales positiva es igual a
la suma de las puntuaciones diferenciales negativas, por lo que mutuamente se anulan.
¿Cómo superar esta aporía?
Sólo has dos posibilidades para hacer que desaparezcan los signos positivos y negativos que preceden a las puntuaciones
diferenciales:
Solución <A>: Prescindir de los signos <+> o <-> de las puntuaciones diferenciales (x) o sea, operar con los valores absolutos. Solución :
Elevar al cuadrado las puntuaciones diferenciales, pues al elevar al cuadrado cualquier número, ya sea positivo o negativo, siempre será
positivo. Recordemos aquella reglas algebraica que decía: <+> por <+>, da <+>; <-> por <->, da <+>; <+> por <->, da <->; <-> por <+>, da <->.
Con la solución <A> tenemos la <desviación media> (DM).
Con la solución , tenemos la <varianza> (S2). Si se extrae la raíz cuadrada a la <varianza> (S2), tenemos la <desviación estándar> (S).
2. LA DESVIACIÓN ESTANDAR ENTRE LOS ÍNDICES DE VARIABILIDAD
Ya conocemos dos índices de variabilidad/dispersión:

a. <Amplitud (también denominado: <recorrido>): Es el más simple, pero muy limitado, si bien puede aplicarse tanto a variables
cuantitativas discretas como a variables cuantitativas continuas
b. La <Desviación media> (DM).
Ahora vamos a dedicar este <cuadro> y los dos inmediatos siguientes a los índices de variabilidad o dispersión más precisos y
utilizados: la <varianza> (S2) la <desviación estándar>(S).
Ambas requieren variables cuantitativas continuas que estén medidas en escala de intervalo. Generalmente se calcula previamente la media
aritmética (de las puntuaciones directas (X), para así determinar las puntuaciones diferenciales(x). No obstante, se dispone de una fórmula que
evita calcular las puntuaciones diferenciales, operando directamente con las puntuaciones directas.
3. RELACIONES ENTRE VARIANZA Y DESVIACIÓN ESTÁNDAR
Por otra parte hay que subrayar que la desviación estándar es solamente la raíz cuadrada de la varianza. Hallada la varianza, extrayendo su
raíz cuadrada, tenemos la <desviación estándar>. Por consiguiente, nos reducimos a la <desviación estándar>, sin más referencias a la
<varianza>, ya que todo lo que se diga de la <desviación estándar es válido para la <varianza>, pues elevando al cuadrado la <desviación
estándar>, tendremos la <varianza>.
4. LA DESVIACION ESTÁNDAR EN TRES <CUADROS>
En el presente <cuadro> nos limitamos a exponer el cálculo de la <desviación estándar> más simple: aquellas fórmulas útiles para resolver
problemas cuyos datos cumplan estas dos condiciones:
a. El número de valores que pueden tomar las puntuaciones no supera los 10 0 12 valores.
b. El número de puntuaciones coincidentes en el mismo valor es inferior a cuatro.
En el <cuadro> 28º se tratará la desviación estándar cuando las puntuaciones coincidentes en un uno o más valores es superior a 3, lo que
obliga a agrupar las puntuaciones de un mismo valor en <frecuencias>.
En el <cuadro> 29º se trata el cálculo de <S> cuando el número de valores que pueden tomar las puntuaciones es tan elevado, que conviene
agrupar los valores en <intervalos>.
5. FÓRMULAS DE LA DESVIACIÓN ESTÁNDAR (S):
Distinguimos:
a. Fórmula para operar con puntuaciones diferenciales
b. Fórmula para operar con puntuaciones directas.
6. CÁLCULO DE LA DESVIACIÓN ESTÁNDAR (S) OPERANDO CON PUNTUACIONES DIFERENCIALES:
a. FÓRMULA:
S=
b. SIMBOLOGÍA:
n: número de puntuaciones. X: puntuación directa
∑X: suma de las puntuaciones directas. ∑x: suma de las puntuaciones diferenciales.
∑x2: suma de los cuadrados de las puntuaciones diferenciales.
c. RESOLUCIÓN DE UN PROBLEMA:
Hallar la desviación estándar de las ocho (8) puntuaciones obtenidas por una muestra de ocho alumnos en una prueba escolar. Los datos son
presentados en la Tabla I.

Tabla I
SUJETOS PUNTUACIONES DIRECTAS: <X> MEDIA ARITMÉTICA PUNTUACIONES CUADRADOS
DIFERENCIALES DE LAS
PUNTUACIONES
DIFERENCIALES
Pedro 12
Juan 10
Jacob 8
Mateo 9
Marcos 7
Tadeo 11
Tomás 6
Pablo 14
n=8 ∑X = 77
Paso 1º) Calculamos el valor de la media aritmética de las puntuaciones directas con esta fórmula:
= 9.62
Tabla II
SUJETOS PUNTUACIONES MEDIA PUNTUACIONES CUADRADOS DE
DIRECTAS: <X> ARITMÉTICA DIFERENCIALES LAS
PUNTUACIONES
DIFERENCIALES
Pedro 12 9.62 + 2.38
Juan 10 9.62 + 0.38
Jacob 8 9.62 - 1.62
Mateo 9 9.62 - 0.62
Marcos 7 9.62 - 2.62
Tadeo 11 9.62 + 1.38
Tomás 6 9.62 - 3.62
Pablo 14 9.62 + 4.38
Totales ∑X = 77 00
Paso 2º) Hemos colocado una columna destinada al valor de la <media aritmética> con el fin de facilitar la comprensión de los cálculos: x = , o
sea, cada puntuación diferencial resulta de restar la media aritmética a cada una de las puntuaciones directas. Adviértase que las puntuaciones
diferenciales llevan signo positivo (+), negativo (-) o son nulas (porque coinciden con la media aritmética).
Paso 3º) Hallamos los cuadrados de las puntuaciones diferenciales. Como sabemos los cuadrados de cualquier número, positivo o negativo,
son positivos.
Paso 4º) Sumamos los cuadrados de las puntuaciones diferenciales
Tabla III
SUJETOS PUNTUACIONES DIRECTAS: <X> MEDIA ARITMÉTICA: PUNTUACIONES DIFERENCIALES: <x> CUADRADOS DE LAS PUNTUACIONES DIFERENCIALES: <x2>
Pedro 12 9.62 + 2.38 5.66
Juan 10 9.62 + 0.38 0.14
Jacob 8 9.62 - 1.62 2.62
Mateo 9 9.62 - 0.62 0.38
Marcos 7 9.62 - 2.62 6.86
Tadeo 11 9.62 + 1.38 1.90
Tomás 6 9.62 - 3.62 13.10
Pablo 14 9.62 + 4.38 19.18
Totales ∑X = 77 00 ∑
Paso 5º) Trasladamos a la fórmula de <S> los valores numéricos resultantes de las operaciones aritméticas reflejadas en la Tabla III:
S = ; S = = = 2.49
7. CÁLCULO DE LA DESVIACIÓN ESTANDAR OPERANDO SÓLO CON LAS PUNTUACIONES DIRECTAS (<X>), SIN TENER QUE HALLAR LAS
PUNTUACIONES DIFERENCIALES (<x>)
a. FÓRMULA:
S
c. SIMBOLOGÍA:
<n>: número de puntuaciones.
<∑X>: suma de las puntuaciones directas
<∑X2>: suma de los cuadrados de las puntuaciones directas.

<>: media aritmética de las puntuaciones directas.
8. UN EJEMPLO DE CÁLCULO DE <S> CON PUNTUACIONES DIRECTAS

Un problema:
Hallar la desviación estándar de los datos que aparecen en la Tabla I.
Tabla I
Sujetos Puntuaciones Puntuaciones
directas: X directas elevadas
al cuadrado: X2
Pedro 12
Juan 10
Jacob 8
Mateo 9
Marcos 7
Tadeo 11
Tomás 6
Pablo 14
Total ∑X = 77
N=8
Paso 1º) Sumamos las puntuaciones directas.

Paso 2º) Elevamos al cuadrado las puntuaciones directas.
Tabla II
Sujetos Puntuaciones Puntuaciones
directas : X directas
elevadas al
cuadrado: X2
Pedro 12 144
Juan 10 100
Jacob 8 64
Mateo 9 81
Marcos 7 49
Tadeo 11 121
Tomás 6 36
Pablo 14 196
n=8 77 791
Paso 3º) Sumamos los cuadrados de las puntuaciones directas.

Paso 4º) Calculamos la media aritmética de las puntuaciones directas:
=9.62
Paso 5º) Hallamos la media aritmética de los cuadrados de las puntuaciones directas:
= = 98.87
Paso 6º) Integramos en la fórmula de <S> los resultados de las medias aritméticas de las puntuaciones directas y de los cuadrados de las
puntuaciones directas recogidas en la Tabla II:
S = = 2.51

CUADRO Nº 28. CÁLCULO DE LA DESVIACIÓN
ESTANDAR CON PUNTUACIONES DIFERENCIALES
Y CON PUNTUACIONES DIRECTAS Y SUS
RESPECTIVAS FRECUENCIAS.
1. CÁLCULO DE <S> OPERANDO CON PUNTUACIONES DIFERENCIALES
Aún reconociendo que el procedimiento de cálculo de la <S> es muchísimo

más fácil de llevar a cabo con puntuaciones directas que con puntuaciones
diferenciales, no hemos querido prescindir de presentar en primer lugar el
procedimiento de cálculo de la <S> operando con puntuaciones diferenciales para el
caso de agrupamiento de las puntuaciones por valores. El procedimiento no difiere
básicamente del que se expuso en el <cuadro> 27. Veámoslo:
a. FÓRMULA:
Fórmula para el caso de que los valores sean menos de 12 y, por tanto, no es
preciso agruparlos en intervalos:
S=
b. SIMBOLOGÍA:
∑: sumatorio
X: puntuación directa
x : puntuación diferencial
x2 : cuadrado de la puntuación diferencial
n : número de puntuaciones
No podemos confundir la <x> (x minúscula), que representa las puntuaciones

diferenciales, con la <X> (X mayúscula), que representa a las puntuaciones directas,
las que han obtenido los individuos. Las puntuaciones diferenciales <x>, que
aparecen en esas fórmulas, son el resultado de hallar la diferencia entre las
puntuaciones directas y la media aritmética (x = X - ).
2. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO
Supongamos el siguiente problema:
Hallar la desviación estándar de los datos (valores y frecuencias) obtenidos

por 100 individuos, tal como se presenta Tabla I:
Tabla I
A B C DE F G
Puntuaciones Frecuencias Producto Puntuaciones Cuadrados Producto

de diferenciales de los
directas De las
puntuaciones cuadrados de
puntuaciones
directas por las
Diferenciales
frecuencias puntuaciones
diferenciales
por sus
frecuencias
2 10
3 35
4 26
5 20
6 9
n = 100
Paso 1º) Sumamos las frecuencias (columna ).

Paso 2º) Multiplicamos cada puntuación directa (columna <A>) por sus frecuencias
(columna ); los resultados aparecen en la columna <C>.
Tabla II
A B C D E F
Puntuaciones Frecuencias Producto Puntuaciones Cuadrados Productos

Directas de diferenciales de las de Los
puntuaciones puntuaciones cuadrados de
directas por diferenciales las
frecuencias puntuaciones
diferenciales
por
las
frecuencias
2 10 20 2 -3.83 = -1.83 3.34
3 35 105 3-3.83= -0.83 0.68

4 26 104 4-3.83=+017 0.02
5 20 100 5-3.83= +1.17 1.36
6 9 54 6-3.83 = +2.17 4.70
N = 100 ∑(X)(f) = 10.1

383
Paso 3º) Sumamos los productos de cada valor por su frecuencia (columna <C>).
Paso 4º) Se halla la media aritmética. Su fórmula:
= = 3.83
Paso 5º) Se calculan las puntuaciones diferenciales <x> (columna <D>), restando el
valor de la media aritmética (3.83) de cada uno de las puntuaciones directas <X>
(columna <A>).
Tabla III
A B C D E F
Puntuaciones Frecuencias Producto Puntuaciones Cuadrados Producto de los

de diferenciales de las cuadrados de las
Directas
puntuaciones puntuaciones puntuaciones
diferenciales diferenciales por
directas
sus frecuencias
por
frecuencias
2 10 20 -1.83 3.34 33.4
3 35 105 -0.83 0.68 23.8
4 26 104 +0.17 0.02 0.52
5 20 100 +1.17 1.36 27.2
6 9 54 +2.17 4.70 42.3
TOTALES N = 100 ∑(X)(f) = ∑ x2 = 127.22

383 10.1
Paso 6º) Elevamos al cuadrado las puntuaciones diferenciales (columna <D>) y los
resultados aparecen en la columna <E>.
Paso 7º) Multiplicamos los cuadrados de las puntuaciones diferenciales (columna
<E>) por sus frecuencias (columna ); los resultados están en la columna <F>.
Paso 8º) Sumamos los productos de la columna <F>.
Paso 9º) Trasladamos esos datos a la fórmula de <S>:
S= S= = S = = 1.12
3. CÁLCULO DE LA <S> OPERANDO CON PUNTUACIONES DIRECTAS
El procedimiento para calcular la desviación estándar con puntuaciones

directas es mucho más sencillo que el expuesto en la sección anterior con
puntuaciones diferenciales. Apenas varía del ya presentado en el <cuadro> 27. Veamos
la fórmula, el significado de sus símbolos y un ejemplo del procedimiento de cálculo.
a. FÓRMULA:
b. SIMBOLOGÍA:
S : desviación estándar; X : puntuación directa ; X2 : cuadrado de la puntuación directa ; : media aritmética; n : número de puntuaciones;
f : frecuencia.
4. UN EJEMPLO DE CÁLCULO DE <S> OPERANDO CON PUNTUACIONES DIRECTAS
Un problema:
Hallar la desviación estándar de las puntuaciones obtenidas por setenta y ocho estudiantes de Latín. Las puntuaciones están agrupadas por
sus valores en la Tabla I:
Tabla I
A B C D E
Puntuación Frecuencia Producto de cada Cuadrados de las Productos de los cuadrados

directa <X> <f> puntuación puntuaciones directas de las puntuaciones directas por
directa por su sus frecuencias
frecuencia ((X)(f))2

( X) (f)
1 2
2 6
3 5
4 12
5 20
6 16
7 12
8 4
9 1
10 0
TOTALES n = 78
Paso 1º) Sumamos las frecuencias y obtenemos <n> (columna).

Paso 2º) Multiplicamos las puntuaciones directas <X> (columna <A>) por sus respectivas frecuencias (columna ) y colocamos los
resultados de estos productos en la columna <C>.
Paso 3º) Sumamos los productos de la columna <C>.
Estas operaciones ya aparecen en la Tabla II
Tabla II
A B C D E
Puntuación Frecuencia Producto de puntuación Cuadrado de las Producto de las

X> por frecuencia ( X) (f) puntuaciones directas puntuaciones directas al
cuadrado por sus
frecuencias
1 2 2
2 6 12
3 5 15
4 12 48
5 20 100
6 16 96
7 12 84
8 4 32
9 1 9
10 0 0
TOTALES n= 78 ∑( X) (f) = 398
Paso 4º) Hallamos la media aritmética con los datos obtenidos:

= = 5.10
PASO 5º) Elevamos al cuadrado las puntuaciones directas (columna <D>).
Paso 6º) Multiplicamos los cuadrados de las puntuaciones directas (columna <D>) por las frecuencias (columna ); colocando los
resultados en la columna <E>.
Tabla III
A B C D E
Puntuación Frecuencia Producto de Cuadrado de las Producto de la

X> puntuación por puntuaciones puntuación directa al
frecuencia ( X) (f) directas cuadrado por la
frecuencia
1 2 2 1 2
2 6 12 4 24
3 5 15 9 45
4 12 48 16 192
5 20 100 25 500
6 16 96 36 576
7 12 84 49 588
8 4 32 64 256
9 1 9 81 81
10 0 0 100 0
TOTALES n = 78 2264
Paso 7º) Sumamos los productos de la columna <E>.

Paso 8º) Trasladamos los datos obtenidos a la fórmula:
S
S
S = = 1.73

CUADRO Nº 29: CÁLCULO DE LA DESVIACIÓN ESTANDAR CON LOS VALORES
1. PROCEDIMIENTO DE CÁLCULO DE LA DESVIACIÓN ESTÁNDAR (S) CON VALORES AGRUPADOS EN INTERVALOS UTILIZANDO
Presentamos en primer lugar el procedimiento de cálculo de la desviación estándar con los valores agrupados en intervalos, utilizando
puntuaciones diferenciales <x>, resultado de hallar la diferencia entre puntuaciones directas (X) y la media aritmética ( ). Al estar agrupados los
valores en intervalos, las puntuaciones directas son sustituidas por los puntos medios de cada intervalo.
a. FÓRMULA:
S=
b. SIMBOLOGÍA:
Xj: punto medio del intervalo
f: frecuencia
x: puntuación diferencial
x2: cuadrado de la puntuación diferencial
Vemos el procedimiento a través de la resolución de un problema:

Hallar la desviación estándar de las puntuaciones obtenidas por una muestra de 80 estudiantes en una prueba de Geología, prueba en la que
se podía obtener entre 1 y 30 puntos, tal como se presenta en la siguiente distribución de frecuencias:
Tabla I
A B C D E F G
Intervalos Punto Frecuencia Producto Puntuación Cuadrado Producto

de valores medio (f) del punto Diferencial (x) de la del
del medio del puntuación cuadrado de
intervalo intervalo por diferencial la
(Xj) la puntuación
frecuencia(Xj diferencial
) (f) por la
frecuencia
1-5 3 2
6-10 8 8
11-15 13 16
16-20 18 28
21-25 23 14
26-30 28 12
n=80
Paso 1º) Agrupamos los 30 valores posibles en 6 intervalos de cinco valores cada uno. Situamos esos datos en la columna <A>:
Paso 2º) La columna acoge los puntos medios de cada intervalo.
Paso 3º) Las frecuencias de los intervalos irán en la columna <C>.
Paso 4º) Multiplicamos los puntos medios de cada intervalo (columna ) por sus frecuencias (columna <C>).Los resultados de estos
productos son colocados en la columna <D>:
Paso 5º) Se halla la media aritmética, dividiendo la suma de los productos (columna <D>) entre <n> (columna <C>.
= = 18
Paso 6º) Hallamos las diferencias entre la media aritmética y los puntos medios (Xj) de cada intervalo; la columna <E> acoge esas
diferencias, las puntuaciones diferenciales.
Paso 7º) Elevamos al cuadrado las puntuaciones diferenciales y las ponemos en la columna <F>):
Tabla II
A B C D E F G
Intervalo Punto Frecuencia (Xi ) Puntuación Cuadrado Producto

medio (f) (f) Diferencial (x) de la del
del puntuación cuadrado
intervalo diferencial de la
(Xm) (x)2 puntuación
diferencial
por la
frecuencia
1-5 3 2 6 3-18=- 15 225
6-10 8 8 64 8-18=-10 100
11-15 13 16 208 13-18=-5 25
16-20 18 28 504 18-18=0 0
21-25 23 14 322 23-18=+5 25
26-30 28 12 336 28-18=+10 100
n=80 1440
Paso 8º) Multiplicamos los cuadrados de las puntuaciones diferenciales por sus respectivas frecuencias:
Paso 9º) Sumamos los productos de la columna <G>:
Tabla III
A B C D E F G
Intervalo Punto Frecuencia (Xi ) Puntuación Cuadrado Producto

medio (f) (f) Diferencial (x) de la del
del puntuación cuadrado
intervalo Diferencial de la
(Xm) (x)2 Puntuación
diferencial
por la
frecuencia
1-5 3 2 6 3-18=- 15 225 450
6-10 8 8 64 8-18=-10 100 800
11-15 13 16 208 13-18=-5 25 400
16-20 18 28 504 18-18=0 0 0
21-25 23 14 322 23-18=+5 25 350
26-30 28 12 336 28-18=+10 100 1200
n=80 1440 3200
Paso 11º) Trasladamos a la fórmula los correspondientes datos:

S= ; S= ; S= ; S = 6.32
3. PROCEDIMIENTO DE CÁLCULO DE LA DESVACIÓN ESTÁNDAR CON VALORES AGRUPADOS EN INTERVALOS UTILIZANDO

UNICAMENTE LAS PUNTUACIONES DIRECTAS, SIN NECESIDAD DE CALCULAR LAS PUNTUACIONES DIFERENCIALES
a. FÓRMULA:
S=
b. SIMBOLOGÏA: S =
): suma de los cuadrados de los puntos medios de cada intervalo.
: cuadrado de la media aritmética.
: frecuencia de cada intervalo.

: cuadrado del punto medio de cada intervalo.
Exponemos el procedimiento de cálculo mediante la resolución de este problema:
Hallar la desviación estándar de las puntuaciones obtenidas por veinte alumnos, cuyos valores agrupados en intervalos y sus respectivas
frecuencias se presentan en la Tabla I:
Observemos que la tabla tiene menos columnas (6) que la tabla del procedimiento antes presentado (8) en la sección precedente, esto es
debido a que desaparecen la columna de las puntuaciones diferenciales y la columna de los cuadrados de las puntuaciones diferenciales.
Tabla I
A B C D E F

INTERVALOS PUNTO FRECUENCIA PRODUCTO CUADRADOS PRODUCTO
MEDIO DEI DEL PUNTO DE LOS DE LOS
INTERVALO MEDIO POR PUNTOS PUNTOS
FRECUENCIA MEDIOS MEDIOS POR
FRECUENCIA
10 – 12 11 3 33
7–9 8 6 48
4–6 5 7 35
1–3 2 4 8
n = 20 ∑ (XJ) (f) = ∑ (Xj)2 (f) =

124
Los pasos 1º, 2º, 3º y 4º son los mismos que en el anterior procedimiento (en aquel que operábamos con puntuaciones diferenciales).
Paso5º) Calculamos la media aritmética:
= = = 6.2
Paso6º) Elevamos al cuadrado los puntos medios de los intervalos (columna ) y los situamos en la columna<E>.
Paso7º) Multiplicamos los cuadrados de los puntos medios de los intervalos por sus frecuencias. Colocamos los resultados en la columna
<F>.
Tabla II
A B C D E F
INTERVALOS PUNTO FRECUENCIA PRODUCTO CUADRADOS PRODUCTO

MEDIO DEI DEL PUNTO DE LOS DE LOS
INTERVALO MEDIO POR PUNTOS PUNTOS
FRECUENCIA MEDIOS MEDIOS POR
FRECUENCIA
10 – 12 11 3 33 121 363
7–9 8 6 48 64 384
4–6 5 7 35 25 125
1-3 2 4 8 4 8
n = 20 ∑ (XJ) (f) = ∑ (Xj)2 (f) =

124 880
S= S= S= S = = 2.35

CUADRO Nº 30: ÍNDICES DE ASIMETRIA
1. ÍNDICE DE SIMETRÍA/ASIMETRÍA
Conocemos ya cuáles son y cómo se calculan los índices de tendencia central, y de variabilidad.. El objetivo de estos índices es resumir en
unos pocos valores las características de las distribuciones de frecuencias. generalmente ambos índices son suficientes para caracterizar los
valores de una muestra, pero en ocasiones, si se desea una mayor precisión conviene calcular otros dos índices: el índice de asimetría y el índice
de apuntamiento o curtosis. Veremos en este <cuadro> el índice de simetría/asimetría y en el siguiente <cuadro> nº 31, el índice de apuntamiento
o curtosis.
Es posible que dos distribuciones coincidan tanto en sus medias aritméticas y en sus varianza y, sin embargo su expresión geométrica sean
muy distintas:
Si la media aritmética coincide con la <mediana> (Md) y con la <moda> (Mo) la distribución es simétrica.
Si la media aritmética es mayor que la mediana o la moda, la asimetría es positiva.
Si la mediana o la moda son mayores que la media aritmética, la asimetría es negativa.
2. FORMULAS Y SU SIMBOLOGÍA PARA CALCULAR EL ÍNDICE DE ASIMETRÍA
a. FÓRMULAS:
Disponemos de varias fórmulas:
1) Fórmula de Pearson
Utiliza la <media aritmética>, la <mediana> y la <desviación estándar>. As=

2) Fórmulas de Fisher
As =
3) Para percentiles:
As = - percentile 50
b. SÍMBOLOGÍA
As: coeficiente de asimetría.
: media aritmética
Md: mediana
S: desviación estándar
x: puntuación diferencial, o sea el resultado de hallar la diferencia entre la puntuación directa de cada individuo (.
x3: cubo de la puntuación diferencial.
n : número de puntuaciones directas o lo que es lo mismo, número de individuos de la muestra.
S3: desviación estándar al cubo.
f: frecuencia: número de individuos con la misma puntuación o con puntuaciones incluidas en el mismo intervalo.
3. DOS EJEMPLOS DEL PROCEDIMIENTO DE CÁLCULO

He aquí un problema:
Calcular el índice de asimetría de una distribución de frecuencias con 3 de media aritmética, 2 de mediana y 1.50 de desviación estándar.
Vamos a utilizar la fórmula de Pearson:
As= As= As= = 2
La asimetría resultante es positive: (20)
Otro ejemplo:
Hallar el índice de asimetría de una distribución de frecuencias con 68 de percentil 90, 12 de percentil 10 y 40 de percentil 50.
Utilizamos la fórmula para percentiles
As = - 40
As = 28 – 40 = 12
La asimetría es positive: (12 )
4. INTERPRETACIÓN
Si As la asimetría es negativa.
Si As = 0, la distribución de frecuencias es simétrica
Si As la asimetría es positiva

CUADRO Nº 31: EL ÍNDICE DE APUNTAMIENTO O CURTOSIS.
1. APUNTAMIENTO O CURTOSIS
El apuntamiento o curtosis atiende a la forma de la distribución, a la distribución de la varianza. El índice de apuntamiento indica el grado de
concentración que presentan los valores respecto de la media aritmética.
Cuanto mayor es el valor del índice, mayor es la concentración de datos alrededor de la media aritmética, a la vez que tal hecho coexiste con
una relativamente elevada frecuencia de datos muy alejados de la media aritmética. En ese caso, estamos ante una distribución <leptocúrtica>, o
sea muy apuntada.
Si la distribución extiende las frecuencias a lo largo de muchos valores, hablamos de una distribución <platicúrtica>, muy aplanada.
Si la distribución no es ni <leptocúrtica>, ni <platicúrtica> o sea <normocúrtica> podría ser una distribución normal si además es simétrica.
2. ÍNDICE DE APUNTAMIENTO O CURTOSIS
El índice que mide el apuntamiento de una distribución de frecuencias es <K> o <Ku>.
a. FÓRMULAS
Disponemos de estas fórmulas:
Ku = – 3
Fórmula por percentiles:
3. EJEMPLO DEL PROCEDIMENTO DE CÁLCULO
Hallar el valor del índice de apuntamiento de una distribución que tiene los siguientes valores en los percentiles:
Percentil Valor
Percentil 10 22
Percentil 25 48
Percentil 75 96
Percentil 90 110
Trasladamos esos valores a la fórmula del índice de apuntamiento o curtosis:
; = 0.18
La distribución es platicúrtica: (0.18 0.26)

Ku =

4. INTERPRETACIÓN
Si Ku es mayor de 0.263, la distribución es <leptocúrtica>.

Si <Ku> es menor de 0.263, la distribución es <platicúrtica>.
La curva normal es <mesocúrtica>.

CUADRO Nº 32: ESTADÍSTICA DE DOS O MÁS VARIABLES EN LA MISMA MUESTRA
1. INTRODUCCIÓN
En los <cuadros> anteriores hemos presentado los índices que expresan las características de una distribución de frecuencias de una única
variable en una muestra. En el presente <cuadro> vamos a introducir los índices que expresan una correlación entre dos o más variables
cuantitativas y los índices de asociación entre dos variables cualitativas, también en una sola muestra.
El presente cuadro tiene únicamente una finalidad introductoria al estudio de las relaciones que pueden darse entre dos o más variables. Si
las relaciones son entre variables cuantitativas reciben el nombre de correlaciones; si, por el contrario, son relaciones entre variables
cualitativas, se las conoce como <asociaciones>. Veamos los coeficientes de correlación y los coeficientes de asociación de un modo abreviado e
introductorio.
2. LA CORRELACIÓN ENTRE DOS VARIABLES
La correlación expresa la variación concomitante de dos o más variables cuantitativas. Cuando comprobamos que una variación en una de
ellas coincide con una variación con otra u otras, decimos que correlacionan. En ningún caso se dice que una de ellas influya en la otra, esa
relación no sería una correlación, sino una relación causa-efecto, cuya expresión matemática sería una <función>, no una <correlación>. En la
correlación varían dos variables de modo concomitante debido a una tercera variable desconocida, cuya acción influye en las dos variables
correlacionadas.
Ejemplos de variables correlacionadas.
a. Velocidad de un vehículo en una distancia dada y tiempo en recorrerla.

b. Número de libros leídos por los alumnos de 6º de Primaria y amplitud de vocabulario mostrado en las redacciones.
3. INTERPRETACIÓN DE LOS RESULTADOS DE LOS COEFICIENTES DE CORRELACIÓN
La tabla siguiente ofrece criterios para interpretar los valores numéricos obtenidos en la aplicación de las fórmulas de los coeficientes de
correlación a datos de variables cuantitativas expresados en escalas de intervalo u ordinales:
Tipos de correlación.
Correlación perfecta Positiva +1
Negativa -1
Correlación imperfecta Positiva Entre 0 y

+1
negativa Entre 0 y
-1
4. CUADRO RESUMEN DE LOS COEFICIENTES DE CORRELACIÓN

En el siguiente cuadro aparece una clasificación de los coeficientes de correlación agrupados por tipologías:
A B C D E
TIPO DE VARIABLE NÚMERO DE VARIABLES ESCALA COEFICIENTE DE CORRELACIÓN SÍMBOLO

DE
Dos cuantitativas continuas Dos (2) Intervalo Coeficiente de correlación lineal de rxy
Pearson
Ordinal Coeficiente de correlación ordinar <r> (rro) de <r>

Spearman
Coeficiente de correlación ordinal <t> (tau) de <t>

Kendall
Coeficiente de concordancia <W> de Kendall <W>
Continuas, una dicotomizada Dos (2) Intervalo Coeficiente de correlación biserial rb
Una cuantitativa continua y otra cualitativa Dos (2) Una de Coeficiente de correlación biserial puntual rbp
dicotómica Intervalo y
otra
nominal
Cuantitativas continuas Tres (3) o más variables Intervalo Coeficiente de correlación múltiple r1.23
Cuantitativas continuas Tres (3) o mas variables Intervalo Coeficiente de correlación parcial r12.3

5. COEFICIENTES DE ASOCIACIÓN
Los coeficientes de asociación pretenden decidir:
1) Si hay alguna relación entre dos variables cualitativas/atributos (en escala nominal) dicotómicas o policotómicas.
2) Si esa relación es positiva o negativa.
3) El grado de intensidad de esa relación.
No todos los coeficientes de asociación sirven para alcanzar los tres cometidos enunciados en a), b) y c). Algunos sólo el
primero, otros los dos primeros y algunos menos, los tres cometidos.
6. CUADRO CON LA CLASIFICACIÓN DE LOS COEFICIENTES DE ASOCIACIÓN
En el siguiente cuadro se ofrece una clasificación de los distintos coeficientes de asociación agrupados por tipologías:
Coeficiente <JI (chi) cuadrado> c2 c2
Derivados del coeficiente < ji Coeficiente de contingencia C

cuadrado> c2
Coeficiente de contingencia Cmax

máximo
Coeficiente de contingencia Ckor

corregido
Coeficiente <V> de Cramer V
Coeficiente <T2> de Tschuprow T2
Otros coeficientes de Coeficiente <Phi > de f

Kendall
Asociación
Coeficiente <Phi> cuadrado f2
Coeficiente Omega
Coeficiente Q de Yule Q
Coeficiente tetracórico rt

CUADRO Nº 33: COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
1. DEFINICIÓN:
El coeficiente de correlación lineal <producto momento> de Pearson <rxy> sirve para determinar la relación de variación concomitante,
supuestamente existente, entre dos variables cuantitativas continuas, medidas por escala de intervalo o de razón.
El símbolo es: <rxy> (r minúscula, con una x y una y minúsculas como subíndices)
2. REQUISITOS EXIGIDOS A LAS VARIABLES CUANTITATIVAS CONTINUAS PARA PODER CALCULAR JUSTIFICADAMENTE LA
CORRELACIÓN DE PEARSON
Para este tipo de correlación son requisitos indispensables: Continuidad, función rectilínea y homocedasticidad.
CONTINUIDAD:
Aquellas variables cuantitativas continuas medidas por una escala de intervalo, o sea, de unidad constante. Quedan excluidas las variables
cualitativas/atributos y las variables cuantitativas discretas. La razón es que tenemos que someter los datos a las diversas operaciones
aritméticas, cosa que sólo puede hacerse con las medidas de una escala de intervalo.
FUNCIÓN RECTILÍNEA:
La correlación de Pearson requiere que los datos se relacionen entre si de una manera rectilínea, es decir, que los datos que quedan dentro de
una elipse, puedan representarse de modo aproximado a una línea recta. Cuando la superficie es de tipo curvilíneo, la línea que representa la
relación entre los datos sería una curva. Ahora bien, la correlación de Pearson equivale a hallar la ecuación de una recta. Por lo cual da resultados
incorrectos si la relación es de tipo curvilíneo.
HOMOCEDASTICIDAD:
La dispersión de todas las filas debe ser igual a la dispersión de todas las columnas. Si la dispersión entre las dos variables no es igual a la de
largo de ambas, sino que varía de una parte a otra, no se puede expresar la relación con un índice de correlación único.
3. INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN LINEAL
Los valores que puede tomar el coeficiente de correlación lineal van desde el < -1 > hasta el < +1 >. Hay, por tanto, coeficientes positivos y
negativos. Los primeros indican que el incremento de una de las variables, conlleva un incremento en la otra. En las correlaciones negativas
(número precedido por signo < - >, <menos>), el incremento en una variable coincide con un decremento en la otra.
Desde un punto de vista cuantitativo, interpretamos:
UNA HASTA MERECE

CORRELACIÓN CALIFICARLA
DESDE COMO
0.00 0.20 Despreciable
0.20 0,40 Baja
0.40 0.60 Moderada
0.60 0.80 Alta
0.80 1.00 Muy alta
4. DOS CASOS EN EL PROCEDIMIENTO DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN LINEAL:
Se distinguen dos casos:

a. Con puntuaciones agrupadas por valores con sus respectivas frecuencias, pero no agrupadas en intervalos.
b. Con puntuaciones agrupadas en intervalos de valores.
Cada uno de ellos dispone de una tabla distinta:

Tabla para puntuaciones agrupadas por valores con sus respectivas frecuencias
VARIABLE<Y> VARIABLE
<X>
1 2 3 fy (fy) (fy) (X) (fy)

(Y) (Y)2 (Y) (X)(Y)
(Y)2
1 16 4 2
2 4 18 12
3 6 2 18
fx 26 24 32 ∑f=
(fx)(X)
(X)2
(fx)(X)2
(X)(Y)
(fx)(X)(Y)
Tabla II para puntuaciones agrupadas en intervalos de valores
Variable <X>
Variable <y> 1–5 6 – 10 11 – 15 16 - 20 fY
1-3
4-6
7-9
10 - 12
13 - 15
16 - 18
fx
5. FÓRMULAS
Se dispone de fórmulas que operan con:

a. Puntuaciones estándar (<z>)
b. Puntuaciones diferenciales (<x>)
c. Puntuaciones directas (<X>)
a. FÓRMULA PARA PUNTUACIONES ESTÁNDAR:

rxy =
SIMBOLOGÍA DE ESTA FÓRMULA:
zx: puntuación estándar de la variable <X>; zY : puntuación estándar de la variable <Y>; n : número de sujetos.
Comentario: Es poco práctico utilizar esta fórmula pues hay que calcular las medias aritméticas, las desviaciones estándar, las respectivas
puntuaciones diferenciales y las puntuaciones estándar correspondientes a cada puntuación directa. Hay fórmulas, aparentemente más
complejas, pero sus tablas de datos son más sencillas y requieren menos operaciones aritméticas como la utilizada para puntuaciones directas.
b. FÓRMULA PARA PUNTUACIONES DIFERENCIALES
1) FÓRMULA
rxy =
2) SIMBOLOGÍA:

x: puntuación diferencia en la variable <X>, o sea la diferencia entre cada puntuación directa (X) y la media aritmética (
y: puntuación diferencial en la variable <Y>, o sea la diferencia entre cada puntuación directa (Y) y la media aritmética (.
3) UN EJEMPLO DE CÁLCULO:
Advertimos al lector que con una muestra tan pequeña carece de sentido hallar el <rxy >, pero nos servirá para ejemplificar los cálculos.
En la Tabla I hemos colocado los datos relativos a la variable <X> y a la variable <Y>.
Tabla I
A B C D E G H
SUJETOS PUNTUACIONES PUNTUACIONES CUADRADO PUNTUACIONES CUADRADO DE PRODUCTO DE
DIRECTAS DE LAS LAS LAS DOS
DIFERENCIALES DIRECTAS <Y>
PUNTUACIONES PUNTUACIONES PUNTUACIONES
<X> <x> DIFEREN-
DIFERENCIALES DIFERENCIALES
CIALES
<x2>
Iván 10 10
Tánia 7 28
Igor 13 22
30 60
Paso 1º) Para determinar los valores de las puntuaciones diferenciales (x) es indispensable calcular previamente las medias aritméticas:
= = 10
= = 20
Paso 2º) Se resta de cada una de las puntuaciones directas (X) de la variable <X>, su media aritmética (10) y de las puntuaciones directas (Y)
de la variable <Y>, su correspondiente media aritmética (20) (columnas <C> y <F>, respectivamente)
Paso 3º) Elevamos al cuadrado las puntuaciones diferenciales (<x> e <y>) (columnas <D> y <G>).
Paso 4º) Se multiplican los cuadrados de las puntuaciones diferenciales de una variable (<x>) por los de la otra (<y>) (columna <H>).
Tabla II
A B C D E F G H
SUJETOS PUNTUACIONES PUNTUACIONES COADRADO DE PUNTUACIONES PUNTUACIONES CUADRA-DO DE PRODUCTO DE
DIRECTAS DIFERENCIALES LAS LAS LAS
DIRECTAS DIFERENCIALES
<x> PUNTUACIONES
<X> PUNTUACIONES <y> PUNTUACIONES
<Y>
DIFERENCIALES DIFERENCIALES DIFERENCIALES
<x2>
Iván 10 O 0 10 -10 100 O
Tánia 7 -3 9 28 +8 64 -24
Igor 13 +3 9 22 +2 4 +6
30 0 18 60 0 168 -18
Paso 5º) Llevando estos resultados a la fórmula:
rxy = rxy =
rxy = = = = 0.68

CUADRO Nº34: CÁLCULO DEL COEFICIENTE DE CORRELACIÓN LINEAL
UTILIZANDO PUNTUACIONES DIRECTAS
1. CÁLCULO DE LA CORRELACIÓN LINEAL UTILIZANDO PUNTUACIONES DIRECTAS
Aunque puede asustar la fórmula, el cálculo del coeficiente de Pearson utilizando sólo puntuaciones directas (sin tener que hallar las
puntuaciones diferenciales) es mucho más sencillo, la tabla tiene menos columnas.
a. FÓRMULA:
rxy =
b. SIMBOLOGÍA:
n: número de sujetos.
X: puntuación directa de un sujeto en la variable <X>.
Y: puntuación directa de un sujeto en la variable <Y>.
X2: cuadrado de la puntuación directa <X>.
Y2: cuadrado de la puntuación directa <Y>.
(X)(Y): producto de las puntuaciones directas de la variable <X> por las puntuaciones directas de la variable <Y>.
∑(X)(Y): suma de los productos de la puntuación directa <X> por la puntuación directa <Y>.
∑(X): suma de las puntuaciones directas <X>.
∑(Y): suma de las puntuaciones directas <Y>.
∑(X2): suma de los cuadrados de las puntuaciones directas <X>.
∑(Y2): suma de los cuadrados de las puntuaciones directas <Y>.
Veamos un problema como ejemplo:
Un grupo de diez jóvenes han sido examinados en ortografía y en vocabulario. Se desea conocer el grado de correlación entre las dos
habilidades. Los datos aparecen en la Tabla I
Paso 1º) Situamos las puntuaciones directas de los diez sujetos en la variable <X> y en la variable <Y> en las columnas y <D>
respectivamente.
Paso 2º) Sumamos las puntuaciones directas de la variable <X> y las de variable <Y>.
Tabla I
A B C D E F
SUJETOS PUNTUACIONES <X> CUADRADOS PUNTUACIONES CUADRADOS PUNT <Y2> PRODUCTO

PUNT.<x2> <Y> PUNT <X> Y
PUNT. <Y>
Simón 6 8
Juan 7 7
Jacob 4 6
Mateo 6 5
Marcos 5 7
Tomás 4 8
Magdalena 9 7
Isabel 5 6
Judith 7 5
Esther 8 6
n = 10 ∑X = 61 ∑Y = 65
Paso 3º) Elevamos al cuadrado las puntuaciones directas de ambas variables y colocamos los resultados en las columnas <C> y <E>
respectivamente.
Paso 4º) Sumamos los cuadrados situados en la las columnas <C> Y <E> de la Tabla II.
Paso 5º) Multiplicamos la puntuación directa de cada sujeto en la variable <X>, por la puntuación directa en la variable <Y>. Esos productos
ocupan las flas de la columna <F>.
Paso 6º) Sumamos esos productos de la columna <F>.

TABLA II
A B C D E F
SUJETOS PUNTUACIONES <X> CUADRADOS PUNTUACIONES CUADRADOS PRODUCTO

PUNT <x2> <Y> PUNT <Y2> PUNT <X> Y
PUNT. <Y>
Simón 6 36 8 64 48
Juan 7 49 7 49 49
Jacob 4 16 6 36 24
Mateo 6 36 5 25 30
Marcos 5 25 7 49 35
Tomás 4 16 8 64 32
Magdalena 9 81 7 49 63
Isabel 5 25 6 36 30
Judith 7 49 5 25 35
Esther 8 64 6 36 48
n = 10 ∑X= 61 ∑X2 =397 ∑Y= 65 ∑Y2= 433 ∑(X)(Y) =

394
Paso 7º) Trasladamos los resultados recogidos en las casillas de la última fila de las columnas de la <C> a la <F>, a la fórmula:
rxy =
rxy = ; rxy ;
rxy rxy rxy rxy = - 0.15
Interpretamos que el valor obtenido (-0.15) representa una correlación <negativa> y

<despreciable/muy baja>, lo que nos lleva a afirmar que las habilidades de los alumnos en esas materias son
independientes.

CUADRO Nº 35: CÁLCULO DEL COEFICIENTE DE CORRELACIÓN LINEAL
UTILIZANDO MEDIAS ARITMÉTICAS
El procedimiento de cálculo del coeficiente de correlación lineal utilizando las medias aritméticas aparentemente muy complejo, pero no lo es:
no hay que calcular puntuaciones diferenciales. Veámoslo.
a. FÓRMULA:
La fórmula para el cálculo del coeficiente de correlación lineal de Pearson con datos no agrupados en intervalos, utilizando solamente las
medias aritméticas de las dos distribuciones es la siguiente:
rxy =
c. SIMBOLOGÏA:
media aritmética de los productos de las puntuaciones directas de cada sujeto en ambas variables.
media aritmética de los cuadrados de las puntuaciones directas en la variable <X>.
: media aritmética de los cuadrados de las puntuaciones directas en la variable <Y>.
UN EJEMPLO DEL PROCEDIMENTO DE CÁLCULO:
Hallar el coeficiente de correlación lineal entre las calificaciones obtenidas por ocho estudiantes en dos asignaturas. Los datos están
expuestos en la tabla I.

TABLA I
A B C D E F
SUJETOS PUNTUACIÓN PUNTUACIÓN PRODUCTO CUADRADOS CUADRADOS

DIRECTA <x> DIRECTA <Y> DE <x> DE DE
POR <y> PUNTUACIONES PUNTUACIONES
<X2> <Y2>
Guillermo 6 9 54
Federico 4 17 58
Luis 3 16 48
Juan 7 10 70
Carlos 4 8 32
Fernando 5 6 30
Bruno 8 14 112
Otón 3 10 30
n=8 ∑X = 40 ∑y = 90 ∑(X)(y) = ∑X2 ∑Y2

434
Paso 1º) Vemos en la Tabla I situadas las puntuaciones directas de la variable <X> (columna ) y de la variable <Y> (columna <C>).
Paso 2º) También podemos ver en la columna <D> de la Tabla I, los resultados de multiplicar la puntuación directa de cada sujeto en la variable
<X> por la puntuación directa del mismo sujeto en la variable <Y>.
Paso 3º) Sumamos los valores de cada columna (, <C> y <D>).
Paso 4º) Elevar al cuadrado las puntuaciones directas en la variable <X>. Las situamos en la columna <E> de la Tabla II.
Paso 5º) Sumamos los cuadrados de la columna <E> de la Tabla II.
Paso 6º) Elevamos al cuadrado las puntuaciones directas de la variable <Y> que aparecen en la columna <C> de la Tabla I o la Tabla II. Esos
cuadrados ocupan la columna <F> de la Tabla II.
Paso 7º) Sumamos los cuadrados que aparecen en la columna <F> de la Tabla II.
Tabla II
A B C D E F
SUJETOS PUNTUACIÓN PUNTUACIÓN PRODUCTO CUADRADOS CUADRADOS

DIRECTA <x> DIRECTA <Y> DE <x> DE DE
POR <y> PUNTUACIONES PUNTUACIONES
<X> <Y>
Guillermo 6 9 54 36 81
Federico 4 17 58 16 289
Luis 3 16 48 9 256
Juan 7 10 70 49 100
Carlos 4 8 32 16 64
Fernando 5 6 30 25 36
Bruno 8 14 112 64 196
Otón 3 10 30 9 100
n=8 ∑X = 40 ∑Y = 90 ∑(X)(Y) = ∑X2 = 224 ∑Y2 = 1122

434
Paso 8º) Calculamos el valor de cada media aritmética: de las puntuaciones <X>, de las puntuaciones <Y>, de los productos de las
puntuaciones <X> por las puntuaciones <Y>, de los cuadrados de las puntuaciones <X>, y de los cuadrados de las puntuaciones <Y>.
=5 ; = 11.25 ; = 54.25 ; = = 28 ; = = 140.25
rxy = rxy = ;
rxy = rxy = ;
rxy = rxy = = - 0.31
Hemos hallado una correlación <negativa> y <moderada> entre ambas variables.

CUADRO Nº 36: REGRESIÓN LINEAL
1. REGRESIÓN LINEAL
Se habla de <regresión> en Estadística a la estimación o predicción de los valores de una variable a partir de los valores de otra variable, y del
valor del coeficiente de correlación lineal de Pearson <rxy> entre las dos variables, siempre que el coeficiente resultante sea imperfecto: ni <+1>,
ni <-1>.
El matemático inglés Francis Galton fue el creador del concepto de <regresión>. Hallar la regresión supone aproximar una línea recta a una
nube de puntos de un diagrama de dispersión. Las expresiones matemáticas para hacer esta estimación o predicción son las <ecuaciones de
regresión> y decimos en plural <ecuaciones> y no <ecuación> porque son distintas las ecuaciones de regresión, pues dependen de si se trata de
<X> sobre <Y>, o de <Y> sobre <X>.
Cada punto es la proyección de la puntuación obtenida por un individuo en una de las dos variables sobre el eje de las abscisas y la
puntuación del mismo individuo en la otra variable sobre el eje de las ordenadas, entre las que ha sido calculado el coeficiente de correlación
lineal de Pearson. Se produce una nube de puntos, tantos puntos como individuos. La recta de regresión busca representar a la nube de puntos y
sirve para predecir las puntuaciones en una variable en función de las puntuaciones en la otra variable.
Se suele usar la recta de regresión porque es la que mejor se ajusta a la nube de puntos, recta que posea la menor distancia a todos los
puntos. El punto () de la recta recibe el nombre de <centro de gravedad>.
2. RECTA DE REGRESIÓN
Según la geometría analítica, la recta se ajusta a la ecuación:

y = a + bx
<a>: es la ordenada en el origen, donde se corta la recta con el eje de ordenadas y : es el número de unidades que cambia <Y> por cada
unidad que cambia <X>. Se la conoce como <pendiente>.
Tenemos dos casos:
a. regresión de <Y> sobre <X>.
b. regresión de <X> sobre <Y>
3. REGRESIÓN DE <Y> SOBRE <X>
Para predecir puntuación Y, a partir de la puntuación <X> utilizamos la fórmula de la siguiente ecuación de recta de regresión lineal:
FÓRMULAS:
y´ = ay/x + by/x (X)
(Atención: la notación de los valores estimados Y´ y X´ llevan una <´> como índice para evitar ser confundidos con los valores reales <X> e
<Y>).
Las fórmulas de los coeficientes <a> y son estas:
ay/x = - by/x (
b = (rxy )()
SIMBOLOGÍA:
Y´: puntuación estimada para la variable <Y> para un valor concreto de la variable <X>.
rxy: coeficiente de correlación lineal entre la variable cuantitativa continua <X> y la variable cuantitativa continua <Y>.
: cociente entre la desviación estándar de <Y> y la desviación estándar de <X>
<a>: es la diferencia entre la media aritmética de <Y> y el producto de la media aritmética de <X> por el coeficiente 
: es el producto del coeficiente de correlación por la razón de la desviación estándar de <Y> (SY) entre la desviación estándar de <X> (SX).
Sx : desviación estándar en la variable <X>
Sy : desviación estándar en la variable <Y>
Y : puntuación de la variable <Y>
: media aritmética de la variable <X>
: media aritmética de la variable <Y>
4. EJEMPLO DE CÁLCULO DE LA RECTA DE REGRESIÓN DE <Y> SOBRE <X>
¿Qué valor tendrá probablemente <y> cuando <x> tiene un valor <10>, teniendo en cuenta que:
8.00 = 9.00 Sx = 3.60 Sy= 2.00 rxy= 0.90
Comenzamos hallando el valor del coeficiente <by/x> ( de <y> sobre <x>), realizando las operaciones aritméticas indicadas en su fórmula
(b = (rxy )()) :
Paso 1º) Dividimos la desviación estándar de <Y> (Sy) entre la desviación estándar de <X> (Sx):
= = 0.55
Paso 2º) Multiplicamos el valor hallado en el paso anterior (0.55) por el coeficiente de correlación lineal de Pearson entre <X> e <Y> (0.90),
resultando: (0.55)(0.90) = 0.49 . Ya tenemos hallado el valor del coeficiente <by/x>.
Paso 3º) Para hallar el valor del coeficiente <ay/x>, atendemos a las operaciones aritméticas indicadas en su fórmula (ay/x = - by/x ( );
multiplicamos la media aritmética de la variable <X> (= 8.00) por el valor del coeficiente <by/X> (by/X = 0.49) (que hemos ya calculado en el paso 2º)
resultando: (8.00)(0.49) = 3.92
Paso 4º) Restamos del valor de la media aritmética de la variable <Y> ( = 9.00) el valor hallado en el paso anterior (3.92): (9.00 – 3.92 = 5.08. Ya
tenemos calculado el valor del coeficiente <by/X>.
Paso 5º) Por tanto, ya podemos integrar en la fórmula de <y´> los resultados hallados en los pasos 2º, 3º y 4º.
y´ = ay/x + by/x (X) y´ = 5.08 – 0.49 (X)
Como el enunciado del problema indica que el valor de X es 10, la anterior ecuación se resuelve sustituyendo <X> por su valor (10):
Y´ = 5.08 + 0.49 (10) = 5.08 -4.9 = 9.98
Cuando un individuo ha obtenido una puntuación de 10 en la variable <X>, estimamos que el mismo individuo obtendrá una puntuación de 9.98
en la variable <Y> si el coeficiente de correlación lineal es 0.90 y los valores de los índices se mantienen.
5. REGRESIÓN DE <x> SOBRE <y>
Las fórmulas correspondientes para calcular el valor estimado de <X> sobre <Y> son las mismas que hemos utilizado en el cálculo del valor
estimado de <Y> sobre <X>, salvo que donde ponía <Y>, ahora debemos poner <X> y donde ponía <X>, ahora debe poner <Y>:
X´ = ax/y + bx/y (Y)
bx/y = (rxy )()
ax/y = - bx/y (
Problema:
Estimar el valor que tomaría en la variable <X> un alumno que en la variable <Y> hubiera obtenido un <8> y los restantes datos para realizar la
estimación son los siguientes:
=5 Sx = 2 Sy = 3 rxy = 0.80
Calculamos el valor del coeficiente <bx/y>

bx/y = (rxy )() bx/y = (0.80)() = (0.80)(0.66)= 0.52
Calculamos el valor del coeficiente <ax/y>:
ax/y = - bx/y ( ax/y = 6 – (0.52) ( = 6 – 2.60 = 3.4
Como ya conocemos los valores de los dos coeficientes (bx/y y ax/y ), podemos estimar <X´>, conociendo que Y = 8 (como aparece en el
enunciado del problema):
X´ = ax/y + bx/y (Y) x´ = 3.4 + (0.52) (8) = 3.4 + 4.16 = 7.56
Por tanto, podemos estimar que el alumno que en la variable <Y> obtuvo un <8>, probablemente obtendría un <7.56 > en la variable <X>.

CUADRO Nº 37: LAS PUNTUACIONES ESTÁNDAR <z>
1. LOS TRES TIPOS DE PUNTUACIONES
Son tres los tipos de puntuaciones que describen la posición de un individuo en una variable cuantitativa continua en escala de intervalo:
a. La puntuación directa (símbolo: <X>, X mayúscula) es el valor numérico resultante de la aplicación de un instrumento de medida a un
individuo.
b. La puntuación diferencial (símbolos: <x>, x minúscula) es la diferencia entre la puntuación directa (X) obtenida por un individuo y el
valor de la media aritmética (de la muestra de la que forma parte el individuo.
c. La puntuación estándar( o típica (símbolo : <z>, z minúscula) es la puntuación diferencial alcanzada por un individuo, dividida por la
desviación estándar de la muestra a la que pertenece el individuo. Nos indica cuántas unidades de desviación estándar (S) separan la
puntuación directa (X) obtenida por el individuo, de la media aritmética (). La fórmula de <z> es: z = , o lo que es igual: z =
Solamente tienen sentido las puntuaciones <z> cuando la variable cuantitativa tiene una distribución ajustada a la curva normal.
2. INSUFICIENCIA DE LAS PUNTUACIONES DIRECTAS Y DIFERENCIALES PARA COMPARAR LA PUNTUACIÓN OBTENIDA POR UN
INDIVIDUO EN DOS MEDICIONES O CON LAS PUNTUACIONES OBTENIDAS POR OTROS INDIVIDUOS
Dos puntuaciones directas (Xa y Xb) obtenidas por un individuo al medir dos variables distintas (<A> y ) no pueden ser comparadas, pues
cada una viene expresada en unidades de medida de magnitudes distintas; no puede compararse: un <7> en Lengua castellana, con un 9 en
Matemáticas. Se necesitaría conocer el número de ambas muestras, las medias aritméticas y las desviaciones estándar de las mismas.
Tampoco permite comparar las puntuaciones directas obtenidas por un mismo individuo en dos aplicaciones de instrumentos de medida
de la misma variable cuantitativa, pues cuando un individuo ha obtenido 17 puntos en una primera prueba y 19 en la segunda, no estaría
justificado inferir que ha mejorado su rendimiento. Para poder afirmar o negar tal hecho, necesitamos haber calculado previamente la media
aritmética y la desviación estándar de las puntuaciones directas obtenidas por los individuos de las muestras (si no era la misma muestra. Si la
media aritmética () de la primera prueba es 12, su puntuación de 17 es <buena>, está por encima de la media. Si la media aritmética de la segunda
prueba es 22, la puntuación directa (19) obtenida por el individuo es <mala>, está por debajo de la media (22), por lo que no podría afirmarse que
el rendimiento del individuo ha mejorado.
Las puntuaciones diferenciales permiten una mayor justificación de nuestras inferencias sobre el valor de una puntuación lograda por un
individuo, ya que las puntuaciones diferenciales nos indican la distancia que una puntuación directa tiene respecto a la media aritmética de la
muestra. Las puntuaciones diferenciales pueden ser comparadas con un cierto fundamento. No obstante, para precisar más la posición de un
individuo no es suficiente conocer su puntuación diferencial, sino que necesitamos conocer si las puntuaciones conseguidas por los individuos
de la muestra, están próximas o alejadas de la medía aritmética. Uno de los índices que miden la dispersión es la desviación estándar. Puede ser
una buena unidad de medida de las puntuaciones diferenciales: la fracción < Pues bien, esas fracciones son conocidas como puntuaciones
estándar <z>.
3. LAS PUNTUACIONES ESTÁNDAR <Z>
Podremos comparar las puntuaciones directas (17 y 19) si las transformamos en puntuaciones estándar <z>. Para transformarlas necesitamos
haber calculado previamente la media aritmética () y la desviación estándar (S). Podemos obtener la puntuación estándar (z) aplicando la
fórmula: z = ; si se hubieran calculado ya las puntuaciones diferenciales (x), la fórmula de las puntuaciones estándar <z> ,como hemos dicho,
sería: z =
4. PROPIEDADES LAS PUNTUACIONES ESTÁNDAR <z>
Dos puntuaciones <z> son números abstractos porque:
a. La suma de las puntuaciones estándar de los individuos de una muestra es igual a cero (∑z= 0); por tanto, la media aritmética de las
puntuaciones estándar <z> es igual a cero (.
b. La desviación estándar (S) de las puntuaciones estándar (z) es igual a <1> (uno). Por lo que, la varianza (S2) es igual a <1> ((1)2 = 1).
c. Permite comparar la posición de un sujeto con la de cualquier otro de otra muestra siempre que se conozcan las medias aritméticas y
las desviaciones estándar de cada muestra.
d. Si la variable medida se ajusta a la distribución normal de frecuencias, la comparación entre <z>, es más precisa que la comparación
entre percentiles.
e. También si la variable medida se ajusta a la distribución normal de frecuencias (curva de Gauss) se puede conocer qué proporción de
sujetos están por debajo o por encima de la puntuación <z> de un sujeto.
5. EJEMPLO DE CÁLCULO DE LAS PUNTUACIONES ESTÁNDAR
Una puntuación estándar (z) resulta de restar a la puntuación directa (X) obtenida por el individuo, la media aritmética (de la muestra a la que
pertenece el individuo; el resultado de esa diferencia debe ser dividido entre la desviación estándar de la misma muestra.

Problema:
Calcular las puntuaciones <z> de siete jóvenes cuyas puntuaciones directas aparecen recogidas en la columna de la Tabla I:

Tabla I
A B C D E
SUJETOS PUNTUACIONES CUADRADOS PUNTUACIÓN PUNTUACIÓN

DIRECTAS DE LAS DIFERENCIAL ESTÁNDAR
PUNTUACIONES
DIRECTAS
Guillermo 6 36
Ricardo 8 64
Isabel 12 144
Eduardo 18 324
Enrique 15 225
Jorge 6 36
Jacobo 5 25
TOTALES ∑X = 70 ∑854
Paso 1º) Sumamos las puntuaciones directas (∑ (columna ).
Paso 2º) Hallamos la media aritmética ( ):

= = 10
Paso 3º) Para calcular la desviación estándar, necesitamos haber elevado al cuadrado las puntuaciones directas; los resultados se presentan
en la columna <C>.
Paso 4º) Sumamos los cuadrados de las puntuaciones directas (columna <C>).
Paso 5º) Calculamos la desviación estándar con la fórmula:
S= ; S= ; S = = = 4.69
Paso 6º) Hallamos las puntuaciones diferenciales correspondientes a los siete alumnos: restamos de cada puntuación directa <X> (columna
), la media aritmética (10).
Paso 7º) Dividimos cada puntuación diferencial entre la desviación estándar; los resultados están la columna <E>:
Tabla II
A B C D E
SUJETOS PUNTUACIONES CUADRADOS DE PUNTUACIÓN PUNTUACIÓN

DIRECTAS LAS DIFERENCIAL ESTÁNDAR
PUNTUACIONES
DIRECTAS
Guillermo 6 36 6-10=-4 -0.85
Ricardo 8 64 8-10=-2 - 0.42
Isabel 12 144 12-10=+2 + 0.42
Eduardo 18 324 18-10=+8 +1,70
Enrique 15 225 15-10=+5 +1.06
Jorge 6 36 6-10=-4 - 0.85
Jacobo 5 25 5-10=-5 - 1.06
TOTALES ∑X = 70 ∑854
6. PUNTUACIONES NORMALIZADAS <T>
Debido a la dificultad que para el cálculo suponen los valores positivos y negativos de las puntuaciones estándar <z>, se ha propuesto
transformarlas en puntuaciones <T>.
Si multiplicamos las puntuaciones <z> por una constante, desaparecen los decimales; si sumamos a ese producto una constante positiva, los
valores negativos se transforman en números positivos. Se suele usar 10 y 50 como constantes. Las puntuaciones normalizadas <T> resultan de
multiplicar <z> por 10 y sumar 50, o sea, una media de 50 y una desviación estándar de 10.
Fórmula de las puntuaciones <T>

T = (z) (10)+ 50
Las puntuaciones <T> correspondientes a estas puntuaciones estándar <z> son:
PUNTUACIONES PUNTUACIONES <T>
ESTÁNDAR <z>
-1.20 38
+1.30 63
+ 0.50 55

-0.30 47
CUADRO Nº 38: LA CURVA NORMAL
1. DISTRIBUCIONES DE PROBABILIDADES Y CURVAS
Muchas variables cuantitativas de intervalo, como la<talla>, la <longitud del pie (número de zapato) o, probablemente, el cociente intelectual
tienen una distribución de probabilidades en la población que se ajusta a la curva normal o campana de Gauss. Para que así ocurra, la variable
debe reunir las siguientes condiciones:
a. Linealidad:
b. Homocedasticidad
c. Normalidad
2. CARACTERÍSTICAS DE LA CURVA NORMAL DE PROBABILIDADES
a. Es una distribución continua, cuyas variables pueden medirse con el grado de precisión que se desee. La curva normal tiene las
siguientes características:
1) La media aritmética, la mediana (Md) y la moda (Mo) en la distribución normal de probabilidades coinciden.
2) El eje pasa por la media aritmética.
3) Los puntos de inflexión coinciden con una distancia entre la media aritmética ( y la desviación estándar (S).
b. Es una curva simétrica sobre un eje que divide el espacio bajo la curva en dos mitades iguales.
c. Es una curva asíntota al eje de las abscisas.
d. El área total bajo la curva normal es igual a <1> o sea al 100 %.
e. La media aritmética ( es <0> y la desviación estándar (S) es <1>.
Consultando la tabla de áreas de la curva normal, podemos conocer qué proporción o porcentaje de sujetos están en el área comprendida
entre la puntuación <z> y la media aritmética ( = 0).
3. DESCRIPCIÓN DE LA TABLA DE LAS ÁREAS DE LA CURVA NORMAL

La tabla de áreas de la curva normal está constituida por 11 columnas y 39 filas. La tabla ofrece para cada puntuación estándar <z>, la
proporción o porcentaje (%) del área comprendida entre esa <z> y la media aritmética.
Las puntuaciones estándar <z> están formadas por tres cifras, la primera es un entero (incluida su ausencia, el <0>) y dos cifras decimales:
una décima y una centésima.
En la primera columna por la izquierda, de arriba abajo, encontramos los números desde 0.0 hasta 3.0. La cifra de las centésimas determina
qué columna debemos consultar. Las columnas, desde la 2ª a la 11ª, están encabezadas por las cifras de las centésimas, que van desde <0> a
<9>. Según sea la centésima de nuestra puntuación <z>, seleccionaremos la columna pertinente.
Si la centésima fuera, p. e. un <3>, seleccionaríamos la columna encabezada por un <3>. De modo análogo, haríamos con cualquiera de las
otras nueve posibles cifras de las centésimas. Las cifras (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9) de las centésimas nos indican la columna que debemos
observar: aquella columna encabezada por la misma cifra que la centésima.
4. TABLA DE LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL
Presentamos a continuación la tabla de los porcentajes bajo la curva normal de todos los valores numéricos que puede tomar una puntuación
estándar <z>:
5.- ¿CÓMO ENCONTRAR EL AREA (PROPORCIÓN O PORCENTAJE) CORRESPONDIENTE A UNA <z> DADA?
Si, por ejemplo, la <z> es igual a 2.23, vamos a la primera columna por la izquierda de la tabla. En esa columna está la cifra de los enteros y la
primera cifra de los decimales. Buscamos en esa primera columna: <2.2>, pues son el entero y las décimas de <z> (2.23). Encontramos <2.2> en
la fila <24ª> si contamos de arriba abajo. Si contamos de abajo a arriba, <2.2> está en la fila <9ª>.

Ya tenemos localizada la fila (la fila del <2.2>). Pero aún no sabemos cuál es la proporción o porcentaje que corresponde a <z> = 2.23. Nos
fijamos en la cifra de las centésimas (<3>) de la <z> = 2.23. Elegimos la columna encabezada por un <3>.
Ahora ya podemos hallar el área de la curva que le corresponde a nuestra <z> (2.23). Esa área o porcentaje está donde se cruzan la fila <2.2> y
la columna encabezada por el <3>. Hallamos: 0.4871 (proporción) o sea 49.01 % del área entre la media aritmética de la distribución de las <z>
(<0>) y la <z> = 2.23.
6.-PUNTUACIONES <Z> POSITIVAS Y PUNTUACIONES <Z> NEGATIVAS
Si la puntuación <z> va precedida del signo <+> ( o sea, es una <z> positiva), se sumara <50> al porcentaje hallado en la tabla.
Si, por el contrario, la puntuación <z> va precedida del signo <-> (o sea, es una <z> negativa), se restara a <50>, el porcentaje que aparece en
la tabla.
RELACIONES ENTRE LAS PUNTUACIONES ESTÁNDAR <Z> Y LAS ÁREAS BAJO LA CURVA NORMAL
PUNTUACIONES <z> ÁREA CUBIERTA

BAJO LA CURVA
NORMAL
Entre <z> +3 Y <z> +2 2.15 % 99%
Entre <z> +2 y <z> +1 13.5 % 95%
Entre <z>+1 y <z> 0 34.13 % 68%
Entre <z> 0 y <z> -1 34.13 %
Entre <z> -1 y <z> -2 13.5 %
Entre <z> -2 y <z> -3 2.15 %

CUADRO Nº 39: EJEMPLOS DE PROBLEMAS DE PUNTUACIONES <z> Y ÁREAS
BAJO LA CURVA NORMAL
1. EJEMPLOS DE BUSQUEDA DEL PORCENTAJE QUE CORRESPONDE A UNA PUNTUACIÓN ESTÁNDAR (z) DADA
Pueden darse distintos problemas según sea positiva o negativa la puntuación <z> y entre <z> y <0>, entre dos <z>, (ambas positivas, ambas
negativas o una positiva y otra negativa).
Veamos unos problemas:

PROBLEMA 1º
Hallar el porcentaje de sujetos que obtuvieron puntuaciones inferiores a la <z> = 1.63
FIGURA <A>
Como puede verse en la figura <A> una puntuación <z> de 1.63, debe aparecer entre la z = 1 y la z= 2 positivas. Para hallar el porcentaje en la
tabla, daremos los siguientes pasos.
Paso 1º) Vemos que 1.63 se compone de un entero (1) y dos cifras decimales (.63). La cifra del entero y la del primer decimal aparece en la
primera columna por la izquierda, la que está encabezada por una <z>. Ya hemos encontrado la fila, la de 1.6. Es la fila 15ª.
Paso 2º) Ahora nos vamos a la columna encabezada por un <3> (5ª columna contando desde la izquierda), pues la centésima de nuestra
<z> (1.63) es <3>.
Paso 3º) Ya tenemos la fila (1.6) y la columna (3). En el punto donde se cortan la fila y la columna está la proporción (0.4484), o sea, un
porcentaje de 44.84%.
Al ser un número positivo (1.63), le sumamos 50 % (el porcentaje de la mitad de puntuaciones <z> negativas):
50 + 44.84 = 94.84 % estarían por debajo de la z = 1.63

Por tanto, el porcentaje de los que obtienen una z superior a 97.13 es:
100% - 97.13 = 8.87 % . El 8.87 % de los sujetos habrían obtenido <z> superiores a 1.63
PROBLEMA 2º
Hallar el porcentaje de sujetos existente entra las puntuaciones: z=+0.40 y z= -2.70
Paso 1º) Miramos la figura y vemos que el área buscada se extiende a la derecha y a la izquierda de la media. Se diferencia del
problema nº 1º en el que la mitad izquierda de la media era total (el 50 %), en el problema nº 2º, el área izquierda no es completa, pues queda
una pequeña cola exterior a la <z> negativa (-2.70).
FIGURA 
Paso 2º) Para determinar la proporción o porcentaje del área obscura de la figura , tenemos que hallar por separado en la tabla el área que
va desde la media a la <z> positiva y el área desde la media a la <z> negativa:

Encontramos en la tabla los siguientes porcentajes:
A una z= +0.40, le corresponde un porcentaje de: 15.54
A una z= -2.70, le corresponde un porcentaje de: 49.65
Sumando los porcentajes de ambas áreas, resulta:
15.54 % + 49.65% = 65.19%
PROBLEMA 3º
Hallar el porcentaje de sujetos que han obtenido puntuaciones <z> superiores
a z=+ 2.60
Paso 1º) Vemos la figura <C> y vemos que el área cuyo porcentaje queremos encontrar, es la cola del área derecha (área de las <z> positivas.
Paso 2º) Buscamos en la tabla el porcentaje de sujetos que ocupan el área entre la media (0) y la z= +2.60. Encontramos: 49.53 %.
Paso 3º) Como lo que buscamos no es el porcentaje del área entre la media y la z = +2.60, sino la pequeña área, la cola, de la mitad derecha.
Conocemos que el porcentaje total de la mitad de la distribución es el 50 %, luego si restamos a 50 %, dl porcentaje hallado 49.53, resulta:
50% - 49.53% = 0.47%
FIGURA <C>
PROBLEMA 4º
Hallar el porcentaje de sujetos que ocupan el área ennegrecida de la figura <D>, más allá de la z= - 1.95
Paso 1º) Buscamos en la tabla el área comprendidaentre la media y la z= - 1.95.

Encontramos: 47.44%
Paso 2º) Como lo que deseamos conocer es el área que está más allá de la z= -1.95, habrá que restar de 50 %, el área hallada entre la media y la
z= - 1.95:
50% - 47.44% = 2.56 %
FIGURA <D>
PROBLEMA 5º
Hallar el porcentaje de sujetos del área existente entre dos puntuaciones <z> positivas: z= 1.99 y z=2.70 (área ennegrecida de la figura <E>)
Consultamos la tabla: el porcentaje entre la media (0) y la z= 1.99 es de 47.67% . El porcentaje entre la media (0) y la z= 2.70 es de 49.65% .
Como vemos en la figura <E> el área obscurecida es la diferencia entre el área 49.65 y el área 47.67
49.65 % – 47.67 % = 1.98 %
FIGURA <E>
PROBLEMA 6º
Hallar el porcentaje de sujetos del área ennegrecida de la figura <F>. Es un área entre dos puntuaciones <z>, una positiva (z = +2.11) y otra
negativa
(z = -2.11)
Paso 1º) Consultamos la tabla: a una <z>= 2.11, le corresponde un porcentaje de 48.26.

FIGURA <F>
Paso 2º) Conocemos que tanto el área entre la media (0) y z= +2.11, como el área entre la media (0) y la z= -2.11, tienen cada una de esas
áreas P= 48.26. Por tanto, ambas suman:
48.26% + 48.26% = 96.52%
2. CÓMO HALLAR LA PUNTUACIÓN <z> QUE CORRESPONDE A UN PORCENTAJE CONCRETO
Es el proceso inverso al que se ha expuesto en la sección <1>: Se busca determinar la puntuación <z> (positiva o negativa) a partir del
porcentaje de área conocido.
En esta búsqueda pueden ocurrir dos casos:

a. Si el porcentaje es superior a 50%, sabemos que lo que excede, sobrepasa, de 50, se resta 50 al porcentaje. El resultado de esa
diferencia se busca en la tabla.
b. Si el porcentaje es inferior a 50%, se resta el porcentaje a 50. El resultado de esa diferencia se buscará en la tabla.
PROBLEMA 1º
Hallar la puntuación estándar <z> correspondiente a un porcentaje de 48.26%.
Paso 1º) Como 48.26 es un porcentaje inferior a 50%, restamos de 50 el porcentaje (48.269):
50-48.26 = 1.74.
Paso 2º) Para buscar 1.74 en la tabla debemos transformar el <porcentaje> en <proporción>, pues en la tabla las áreas vienen expresadas en
proporciones: un porcentaje de 1.74 % () es igual a una proporción 0.1740.
Paso 3º) Encontramos que esa proporción (0.1740) ocupa un lugar en una fila y en una columna. La fila nos da la cifra de los enteros y la cifra
de las décimas y la columna nos da la cifra de las centésimas. Encontramos que la proporción más próxima a 0.1740 en la tabla es: 0.1736. La
<z> que corresponde a esa proporción es: 0.45, ya que está ubicada en la fila <0.4> y en la columna encabezada por un <5>. La <z> buscada es z=
0.45
PROBLEMA 2º
Hallar la puntuación <z> correspondiente a un porcentaje de75%.
Paso 1º) Un área de 75% supera a 50%, por lo que debemos restar 50% a 75%:
75% - 50% = 25%
Paso 2º) Transformamos 25% a proporción: 0.2500
Paso 3º) Buscamos en la tabla la proporción más próxima a 0.2500. Encontramos: 0.2486. A esta proporción le corresponde una puntuación
<z> de: 0.67 (ya que está en la fila encabezada por 0.6 y en la columna encabezada por un <7>).

CUADRO Nº 40: COEFICIENTES DE CORRELACIÓN MÚLTIPLE Y DE CORRELACIÓN
PARCIAL
1. LOS COEFICIENTES DE CORRELACIÓN MÚLTIPLE Y PARCIAL
Recordamos que el coeficiente de correlación lineal de Pearson <rxy> busca determinar el grado de variación concomitante de dos variables.
Para aquellos casos en que se relacionan más de dos variables en la misma muestra, disponemos de dos coeficientes de correlación, derivados
del coeficiente de correlación lineal de Pearson, que son:
a. Coeficiente de correlación múltiple

b. Coeficiente de correlación parcial
2. COEFICIENTE DE CORRELACIÓN MÚLTIPLE
3. DEFINICIÓN:
Cuando una variable interacciona con otras variables y se conoce el grado de correlación que la primera mantiene con cada una de las otras
en particular, puede desearse conocer la correlación de la variable primera con todas las demás conjuntamente. Para estos casos, disponemos
del coeficiente de correlación múltiple. Previamente se ha de conocer las correlaciones entre:
a. la variable <X1> y la variable <X2> (r12).
b. la variable <X1> y la variable <X3>…..(r13).
c. La variable <X2> y la variable <X3>…(r 2 3 ).
1) SÍMBOLO DEL COEFICIENTE DE CORRELACIÓN MÚLTIPLE:

r1.2 3 (una <r> minúscula con tres cifras como subíndices, la primera cifra separada por un punto a las otras dos ( o más de dos, si las
hubiera).
b) FÓRMULA:
r1.2 3 =
4) SIMBOLOGÍA
r12 ; coeficiente de correlación entre las variables <1> y <2>
r13 coeficiente de correlación entre las variables <1> y <3>
r23 : coeficiente de correlación entre las variables <2> y <3>
4. PROCEDIMIENTO DE CÁLCULO
Para una mejor comprensión del procedimiento, proponemos un ejemplo de resolución de un problema:
Se desea conocer el grado de dependencia de la variable <rendimiento académico> respecto de las variables <Cociente intelectual> y
<Sociabilidad> conjuntamente. Para ello, debe hallarse el coeficiente de correlación múltiple,
Paso 1º) Se construye la tabla:
VARIABLES COEFICIENTE
DE CORRELACIÓN
<r>
RENDIMIENTO COCIENTE 0.70

ACADÉMICO INTELECTUAL
RENDIMIENTO SOCIABILIDAD 0.45

ACADÉMICO
COCIENTE INTELECTUAL SOCIABILIDAD 0.25
Paso 2º) Trasladamos los datos a la fórmula:
r1.2 3 =
r1.2 3 =
r1.2 3 = R1.2 3 = = 0.57
5. COEFICIENTE DE CORRELACIÓN PARCIAL
El coeficiente de correlación parcial pretende conocer la correlación existente entre dos variables si una tercera variable permanece constante,
o sea, eliminando el influjo de la tercera.
Un ejemplo de estas correlaciones: el coeficiente de correlación entre <masa corporal> y <habilidad de cálculo aritmético> suele ser alta y
positiva entre niños de 4 a 14 años. De este hecho no podemos deducir que un niño gordo sea mejor calculador que uno delgadito. Claro que tal

deducción sería equivocada, pues la correlación positiva se deriva de la presencia de otra variable: la edad. El coeficiente de correlación parcial
sirve para conocer el valor de la relación entre peso y habilidad para el cálculo aritmético, si se elimina el factor <edad>.
1) SÍMBOLO DEL COEFICIENTE DE CORRELACIÓN PARCIAL:
R12.3 (una <r> minúscula
a. FÓRMULA:
R12.3
b. SIMBOLOGÍA:
r 1.2 : Coeficiente de correlación entre la variable <1> y la variable <2>.
r1.3 : Coeficiente de correlación entre la variable <1> y la variable <3>.
r2.3 : : Coeficiente de correlación entre la variable <2> y la variable <3>
c. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO
Hallar la correlación parcial entre l variable <1>, (factor de fluidez verbal) y la variable <2> (cálculo aritmético) si se excluye el influjo de la
variable <3> (ortografía). Las correlaciones entre estas tres variables son las que se muestran en la siguiente tabla:
VARIABLES CORRELACIONADAS COEF.

CORRELACIÓN <rxy
Factor fluidez Verbal Cálculo aritmético 0.50
Factor fluidez Verbal ortografía 0.80
Ortografía Calculo aritmético 0.60
Operaciones en el numerador de la fracción de la fórmula:
Paso 1º) Se multiplican <r1.3> por <r2.3>: (0.80)(0.60) = 0.48

Paso 2º) Se resta de <r1.2> (0.50) el producto hallado en el paso 1º (0.48): 0.50 – 0.48 = 0.02.
Operaciones en el denominador de la fracción de la fórmula:
Paso 3º) se eleva al cuadrado <r1.3>: (0.80)2 = 0.64
Paso 4º) Se resta de la unidad (1) el cuadrado de <r 1.3> hallado en el paso 3º: 1 – 0.64 = 0.36.
Paso 5º) Se halla el cuadrado de 0.36 (0.64)
Paso 6º) Se extrae la raíz cuadrada de la diferencia entre <1> y el cuadrado de <r 1.3> ( hallada en el paso 4º: = 0.36
Paso 6º) Se eleva al cuadrado <r2.3>.
Paso 7º) Se halla la diferencia entre <1> y el cuadrado de< r 2.3: 1 -
Paso 8º) Se halla la raíz cuadrada de la diferencia calculada en el paso 7º.
Paso 9º) Se halla el producto de lo calculado en los pasos 5º y 8º.
Paso 10º) Trasladamos los datos de la tabla de correlaciones a la fórmula:
R12.3 R12. .3
== 0.042

CUADRO Nº 41: COEFICIENTE DE CORRELACIÓN ORDINAL (r) DE SPEARMAN
1. INTRODUCCIÓN:
El coeficiente <r > (rro, letra griega minúscula) de Spearman permite calcular el grado de correlación entre dos variables cuantitativas
medidos en escala ordinal. Las puntuaciones de cada variable han sido ordenadas de menor a mayor (o viceversa) resultando, por tanto dos
series ordenadas por rangos. O sea, <r> mide la relación entre la ordenación de <n> sujetos en una variable y la ordenación de los mismos
sujetos en la otra variable.
Los símbolos del coeficiente de Spearman son: <rs> (una <r> minúscula con una <s> como subíndice) o <r > (letra griega minúscula <rro>)
a. FÓRMULA
Rs =
(Esta fórmula sólo es válida si no hay empates o si estos son pocos. Existe <empate> cuando dos o más sujetos han obtenido la misma
puntuación, lo que se crea un problema de la asignación de rangos. Si hay empates, se necesita hallar la media aritmética de los rangos que
podrían ocupar si no hubiese empate.
b. SIMBOLOGÍA DE LA FÓRMULA
<∑>: sumatorio
<d>: diferencia entre el rango obtenido por el sujeto en la primera variable (X) y el rango del mismo sujeto en la segunda variable (Y).
<d 2>: la diferencia anterior elevada al cuadrado.
<∑d2 >: suma de los cuadrados de las diferencias.
<n>: número de sujetos
2. EJEMPLO DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ORDINAL DE SPEARMAN <r>
Hallar el coeficiente de correlación ordinal de Spearman de las puntuaciones en Matemáticas y en Física de 8 estudiantes. Las puntuaciones
aparecen en la Tabla I
Paso 1º) En la Tabla I solamente presentamos rellenas la columna de sujetos, de puntuaciones y de rangos de la variable <X>:
Tabla I
SUJETOS PUNTUACIÓN RANGO EN PUNTUACIÓN RANGO DIFERENCIAS CUADRADOS
EN MATEMÁTICAS EN FÍSICA EN FÍSICA ENTRE RANGOS DE LAS
MATEMÁTICAS DIFERENCIAS
ENTRE RANGOS
Olga 7 3º
Sergio 6 5º
Carmen 7 3º
Paula 5 6º
Pedro 4 7º
Roque 7 3º
Ángela 8 1º
Manuela 3 8º
n= 8
Paso 2º) En la tabla II se ofrecen ya rellenas las columnas de sujetos, de puntuaciones y de rangos de la variable <X>, de puntuaciones y de
rangos de la variable <Y>.
Tabla II
SUJETOS PUNTUACIÓN RANGO EN PUNTUACIÓN RANGO DIFERENCIAS CUADRADOS
EN MATEMÁTICAS EN FÍSICA <Y> EN FÍSICA ENTRE RANGOS DE LAS
MATEMÁTICAS <Rx> <Ry> <d> DIFERENCIAS
<X> ENTRE RANGOS
<d2>
Olga 7 3º 15 3º
Sergio 6 5º 10 6º
Carmen 7 3º 12 4º
Paula 5 6º 11 5º
Pedro 4 7º 7 8º

Roque 7 3º 16 2º
Ángela 8 1º 19 1º
Manuela 3 8º 9 7º
n=
En la tabla III completamos los datos:

Paso 3º) Hallamos las diferencias entre rangos:
Paso 4º) Elevamos al cuadrado las diferencias:
Paso 5º) Sumamos los cuadrados de las diferencias:

Tabla III
ESTUDIANTES PUNTUACIÓN RANGO EN PUNTUACIÓN RANGO DIFERENCIAS CUADRADOS
EN MATEMÁTICAS EN FÍSICA <Y> EN FÍSICA ENTRE RANGOS DE LAS
MATEMÁTICAS <Rx> <Ry> <d> DIFERENCIAS
<X> ENTRE RANGOS
<d2>
Olga 7 3º 15 3º 0 0
Sergio 6 5º 10 6º -1 1
Carmen 7 3º 12 4º -1 1
Paula 5 6º 11 5º +1 1
Pedro 4 7º 7 8º -1 1
Roque 7 3º 16 2º +1 1
Ángela 8 1º 19 1º 0 0
Manuela 3 8º 9 7º +1 1
n= 8 ∑ d2 = 6
Paso 6º) Trasladamos las sumas que aparecen en la tabla III a la fórmula:
r = 1- ; r = : r = = 1 – 0.07 = 0.93.
La correlación hallada es muy alta.
3. UN EJEMPLO DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN ORDINAL DE SPEARMAN <r> EN EL QUE APARECEN <EMPATES>
Problema
Calcular el coeficiente de correlación de Spearman sobre las puntuaciones obtenidas por diez sujetos en dos pruebas, una de ellas sobre
la variable <X> y la otra sobre la variable <Y>, tal como se presenta en la tabla IV
Paso 1º) Tenemos en la Tabla IV rellenadas las columnas de <sujetos>, de <puntuaciones en la variable X> y <puntuaciones en la variable Y>:
Tabla IV
SUJETOS PUNTUACIÓN PUNTUACIÓN RANGO RANGO DIFERENCIA CUADRADO
EN VARIABLE X EN VARIABLE Y EN EN DE RANGOS DE LA
VARIABLE VARIABLE (d) DIFERENCIA
X Y DE RANGOS
2
(d )
LUIS 10 5
MARÍA 9 9
OSCAR 4 6
PILAR 6 7
RAMÓN 2 4
SANTIAGO 3 2
TELMA 1 3
VICTORIA 7 8
YAGO 2 1
ZENOBIA 8 10
TOTAL
Paso 2º) En la tabla V, vamos a rellenar las columnas de rangos de ambas variables. Comenzamos a asignar rangos a las puntuaciones
en la variable <X>: la puntuación más alta es un <10> y por tanto le corresponde el rango <1º>, la puntuación inferior a <10> es un <9>, por tanto
le corresponderá el rango <2º>,… seguimos asignando rangos, pero descubrimos que hay un empate entre dos puntuaciones (un <2>, Ramón y
un <2>, Yago). No sabríamos a quién asignarle el rango 8º y a quién asignarle el rango 9º. Esto es muy relevante porque si asignamos el rango 8º a
Ramón y no a Yago en la variable <X>, puede que no haya empate en la variable <Y>. Pues bien, como sería equivocado conceder a los dos el
rango <8º> o a los dos el rango <9º>, lo correcto es hallar la media aritmética de los dos rangos: se suman estos dos rangos (8+9 = 17) y lo
dividimos entre 2: ( = 8.5). Se coloca 8.5 en las casillas de la variable <X> que tienen un 2 de puntuación.
Paso 3º) Hacemos lo mismo con la segunda variable <Y>. Pero en este caso, como hemos dicho, no hay <empates>.
Tabla V
EN VARIABLE X EN VARIABLE Y EN EN DE RANGOS DE LA
VARIABLE VARIABLE (d) DIFERENCIA
X Y DE RANGOS
2
(d )
LUIS 10 5 1 6
MARÍA 9 9 2 2

OSCAR 4 6 7 5
PILAR 6 7 5 4
RAMÓN 2 4 8.5 7
SANTIAGO 3 2 8 9
TELMA 1 3 10 8
VICTORIA 7 8 4 3
YAGO 2 1 8.5 10
ZENOBIA 8 10 3 1
TOTAL
Paso 4º) Hallamos las diferencias entre los rangos de la variable <X> y los rangos de la variable <Y>.
Paso 5º) Elevamos al cuadrado esas diferencias.
Paso 6º) Sumamos los cuadrados de las diferencias.
En la Tabla VI se recogen los resultados de las operaciones aritméticas prescritas en los tres últimos pasos.

Tabla VI
EN VARIABLE X EN VARIABLE Y EN EN DE RANGOS DE LA DIFE-
VARIABLE VARIABLE (d) RENCIA DE
X Y RANGOS (d2)
LUIS 10 5 1 6 -5 25
MARÍA 9 9 2 2 0 0
OSCAR 4 6 7 5 +2 4
PILAR 6 7 5 4 +1 1
RAMÓN 2 4 8.5 7 +1.5 2.25
SANTIAGO 3 2 8 9 -1 1
TELMA 1 3 10 8 +2 4
VICTORIA 7 8 4 3 +1 1
YAGO 2 1 8.5 10 -1.5 2.25
ZENOBIA 8 10 3 1 +2 4
TOTAL =
44.50
Paso 7º) Trasladamos los valores obtenidos a la fórmula:

r= ; r=1 - = 1 - 0.26 = 0.74
La correlación hallada es alta.

CUADRO Nº 42: COEFICIENTE DE CORRELACIÓN t (tau) DE KENDALL ENTRE
VARIABLES MEDIDAS EN ESCALA ORDINAL
1. INTRODUCCIÓN
Ya hemos visto el coeficiente de correlación ordinal de uso más frecuente, el coeficiente de Spearman simbolizado por <r > (letra del alfabeto
griego <rro>) o por <rs> (r minúscula con una <s> como subíndice). Ahora vamos a presentar otro coeficiente para datos ordinales: el coeficiente
t (tau, letra minúscula del alfabeto griego que se corresponde a la <t> del alfabeto latino) de Kendall.
Este coeficiente de correlación atiende a la posición (rango) que cada uno de los individuos ocupa en una serie ordenada de puntuaciones en
una variable y la posición (rango) que ocupa el mismo individuo en la serie ordenada de puntuaciones en la otra variable. Este coeficiente
pretende medir el grado de correspondencia entre las dos ordenaciones
a. Fórmulas:
Disponemos de tres fórmulas (las dos primeras son la misma, pero con un desarrollo algebraico distinto):
Fórmula <A>: t (tau) = Fórmula . t =
y Fórmula <C>: t =
b. Simbología:
P: número de sujetos que no invierten sus rangos.
Q: número de sujetos que invierten sus rangos.
3. LA <INVERSIÓN> O LA <NO INVERSIÓN> ENTRE RANGOS
El concepto básico del cálculo del coeficiente <t> es el de <inversión>.
Supongamos <n> personas (A, B, C, D,….N) y dos variables (<X> e <Y>). Cada sujeto ocupa un rango en la serie de puntuaciones en la variable
<X> y otro rango en la serie de puntuaciones en la variable <Y>.
Cuando comparamos el rango del sujeto <A> en la variable <X> con el rango del sujeto en la misma variable <X>, puede suceder que el
rango del sujeto sea inferior o superior al rango del sujeto <A> en la misma variable <X>.
Si el rango de <A> es superior al rango de en la variable <X> e inferior a en la variable <Y>, se dice que ha habido una <inversión>.
Otro tanto si <A> es inferior a en <X> y es superior a <A> en <Y>.
Si el rango del sujeto <A> es superior al rango del sujeto en la variable <X> y también el rango de sujeto <A> es superior al rango del
sujeto en la variable <Y>, se dice que hay una <no inversión>.
Esta tabla puede facilitar la comprensión del concepto de <inversión> (los números elegidos para los rangos son arbitrarios y su elección sólo
busca que sirvan como ejemplos):
Tabla I
VARIABLE <X> VARIABLE <Y>
Si el sujeto <A> Si el sujeto Si el sujeto <A> Si el sujeto El resultado es la:
obtiene el: obtiene el: obtiene el: obtiene el:
Rango 3º Rango 2º Rango 6º Rango 4º No inversión
Rango 5º Rango 8º Rango 6º Rango 4º Inversión
Si, por ejemplo, los sujetos fueran cinco (A, B, C, D, y E), habría que realizar diez (10) comparaciones:
<A> con , <A> con <C>, <A> con <D>, <A> con <E>, con <C>, con <D>, con <E>, <C> con <D>, <C> con <E>, <D> con<E>.
4. UN EJEMPLO DEL CÁLCULO DEL COEFICIENTE <t>
Problema:
Hallar el coeficiente < t > (tau) de Kendal sobre las puntuaciones obtenidas por cinco sujetos en dos variables (X e <Y>), tal como se presenta
en la Tabla II.
Paso 1º) Para poder determinar cuántas inversiones se dan entre los rangos de una variable con los rangos de la otra y así poder cuantificar el
valor y el valor <Q>, creemos muy conveniente ordenar la serie de rangos del 1º al 5º en una de las dos variables, en nuestro ejemplo será la
variable <X>. Veamos la Tabla II, donde se presentan las puntuaciones y los rangos de cada uno de los cinco sujetos en la variable <X> y en la
variable <Y>:

Tabla II
Sujetos PUNTUACIÓN RANGO PUNTUACIÓN RANGO
EN EN EN
EN
VARIABLE VARIABLE
VARIABLE X VARIABLE <Y>
<Y>
<X>
Antonio 9 1º 6 3º
Benito 8 2º 10 1º
Carlota 6 3º 8 2º
Daniel 4 4º 4 5º
Enrique 2 5º 5 4º
Paso 2º Comparamos:
1) Si los rangos de dos sujetos muestran un orden progresivo en una variable, y uno regresivo en la otra variable, hablamos de
<inversión.
2) Si, por el contrario, las comparaciones entre los rangos de ambos sujetos en una y otra variables coinciden en progresividad o
regresividad, estamos ante una <no inversión>:
Tabla III
SUJETOS VARIABLE <X> VARIABLE <Y> RESULTADO
COMPARADOS
ANTONIO Y BENITO 1º 2º 3º 1º Inversión
ANTONIO Y CARLOTA 1º 3º 3º 2º Inversión
ANTONIO Y DANIEL 1º 4º 3º 5º No inversión
ANTONIO Y ENRIQUE 1º 5º 3º 4º No inversión
BENITO Y CARLOTA 2º 3º 1º 2º No inversión
BENITO Y DANIEL 2º 4º 1º 5º No inversión
BENITO Y ENRIQUE 2º 5º 1º 4º No inversión
CARLOTA Y DANIEL 3º 4º 2º 5º No inversión
CARLOTA Y ENRIQUE 3º 5º 2º 4º No inversión
DANIEL Y ENRIQUE 4º 5ºe 5º 4º Inversión
Hay 3 <inversiones> y 7 <no inversiones>.

Paso 3º) Trasladamos estos datos a la fórmula:
t (tau) = = = +0.40
t (tau) = = = = 0.40
Con la otra fórmula:

t (tau) = = = = +0.40
Se puede interpretar este resultado como una correlación discreta entre las dos variables.

CUADRO Nº 43: COEFICIENTE DE CORRELACIÓN <W> DE CONCORDANCIA DE
KENDALL
1. INTRODUCCIÓN
En los dos <cuadros> precedentes (40º y 41º) hemos presentado dos coeficientes de correlación para datos ordinales (coeficiente <r > y
coeficiente <t >), en el presente vamos a exponer el coeficiente de correlación <W> de Kendall para datos ordinales.
2. DEFINICIÓN
El coeficiente de concordancia <W> de Kendall pretende medir el grado de acuerdo o concordancia entre varios jueces o la asociación entre
tres o más variables.
a. FÓRMULAS:
W=
Siendo la fórmula para calculas <S>:

S = (a - )2 + (b -2 + (c -)2 + …
El promedio se calcula con esta fórmula:

Prom =
Para calcular la suma de <li> (∑ li), la fórmula es:

∑li =: ∑
b. SIMBOLOGÍA:
n: número de sujetos que reciben los rangos otorgados por los calificadores
S: suma de los cuadrados de las diferencias entre la suma de rangos otorgados a cada sujeto menos el promedio de todas las sumas parciales
de rangos de cada sujeto: (a- prom)2 + (b – prom)2 + (c – prom)2+ …….. (n – prom)2.
k: número de calificadores, los que otorgan los rangos a los sujetos.
∑Rk : suma total de las sumas parciales de los rangos otorgados a cada sujeto: (a + b + c + + …..)
li: número de empates.
∑li : ∑
a : suma de los rangos otorgados al sujeto <a>.
b: ídem del sujeto ….Otro tanto se puede decir respecto de <c>, <d>, <e>, etc.
3. EJEMPLO DE PROCEDIMIENTO DE CÁLCULO
Pueden presentarse dos casos:
a. No hay ninguna puntuación repetida entre las puntuaciones otorgadas por los calificadores. No hay empates y, por tanto, es sencillo
asignar los rangos.
b. Hay, al menos, dos puntuaciones otorgadas por el mismo calificador que coinciden en el mismo valor, o sea, hay empate.
Comenzamos con el primer caso, si bien las fórmulas son las mismas, pero el procedimiento varía; es más sencillo si no hay empates.
Para una mejor comprensión del proceso de cálculo del coeficiente <W>, supongamos un problema como ejemplo:
Hallar el grado de concordancia entre las calificaciones otorgadas por tres calificadores de las redacciones compuestas por seis alumnos. En
la Tabla ya aparecen los rangos asignados a las puntuaciones otorgadas por los tres calificadores.
Paso 1º) Ordenamos, en una serie creciente, las puntuaciones otorgadas a los seis alumnos por cada uno de los tres calificadores. Se
comprueba que no hay empates en ninguna de las tres series.
Paso 2º) Asignamos rangos correlativos a cada puntuación otorgada por cada uno de los calificadores.
Paso 3º) En la tabla I, hemos dado por realizados los dos pasos anteriores y, por tanto, únicamente hemos anotado los rangos asignados a
cada una de las puntuaciones otorgadas por cada uno de los tres calificadores:
Tabla I
SUJETOS RANGOS RANGOS RANGOS SUMA DE

OTORGADOS OTORGADOS OTORGADOS RANGOS Rk
POR EL POR EL POR EL
CALIFICADOR CALIFICADOR CALIFICADOR
<A> <C>
Pedro 6º 5º 5º
Héctor 2º 3º 2º
Esther 5º 4º 4º
Nuria 1º 2º 3º
Esteban 4º 6º 6º
Laura 3º 1º 1º
n=6 ∑Rk =
a+b+c+d+e+f
Paso 4º) Sumamos los rangos otorgados por los tres calificadores a cada uno de los seis individuos. Colocamos los totales de las sumas
horizontales en la columna encabezada por <suma de rangos> de la Tabla II.
Paso 5º) Sumamos verticalmente los resultados de las sumas horizontales colocadas en la columna <suma de rangos> de la Tabla II (∑ Rk).
Tabla II
SUJETOS RANGOS RANGOS RANGOS SUMA DE RANGOS
OTORGADOS OTORGADOS OTORGADOS RJ
POR EL POR EL POR EL
CALIFICADOR CALIFICADOR CALIFICADOR
<A> <C>
Pedro 6º 5º 5º a = 16
Héctor 2º 3º 2º b=7
Esther 5º 4º 4º c= 13
Nuria 1º 2º 3º d=6
Esteban 4º 6º 6º e = 16
Laura 3º 1º 1º f=5
n=6 ∑Rk =
a+b+c+d+e+f = 63
Paso 6º) Se halla el valor de la media aritmética de ∑Rk : = = = 10.5

Paso 7º) Calculamos el valor de <S>:
S = (a - )2 + (b - )2 + (c - )2 + (d - )2 + (e - )2 +(f - )2
a. Calculamos el valor de cada diferencia:
S = (16 - )2 + (7 - )2 + (13 - )2+ (6 –10.5)2 + (16 – 10.5)2 + (5 – 10.5)2
b. Elevamos al cuadrado las diferencias indicadas en la fórmula anterior:
S = (5.5)2 + ( -3.5)2 +(2.5)2 + (- 4.5)2 + (5.5)2 + (- 5.5)2
c. Sumamos esos cuadrados:
S = 30.25 + 12.25 + 6.25 + 20.25 + 30.25 + 30.25 = 129.50
Paso 8º) Trasladamos a la fórmula de <W> los valores que resultaron en las operaciones aritméticas indicadas en los <pasos> anteriores:
W= W= W = = = = 0.82
La correlación 0.82 puede considerarse alta
(Hemos suprimido la expresión <>, porque hemos supuesto que no hay puntuaciones repetidas entre las otorgadas por cada calificador: la
Tabla I sólo muestra los rangos que corresponderían a cada puntuación).

CUADRO Nº 44: COEFICIENTE DE CORRELACIÓN BISERIAL
1. COEFICIENTES DE CORRELACIÓN Y ASOCIACIÓN DERIVADOS DEL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON
Los coeficientes de correlación o de asociación relacionados con el coeficiente de correlación lineal de Pearson son estos cuatro:
Son estimaciones del coeficiente de correlación lineal de Pearson:
1º) El coeficiente biserial
2º) El coeficiente tetracórico
Son aplicaciones, casos particulares, del coeficiente de correlación lineal de Pearson:
3º) El coeficiente biserial puntual
4º) El coeficiente <f> (phi, fi)
2. DEFINICIÓN DEL COEFICIENTE DE CORRELACIÓN BISERIAL
El coeficiente de correlación biserial pretende hallar el grado de la posible relación existente entre dos variables:
a. Una variable cuantitativa continua.
b. Una variable cuantitativa continua, pero dicotomizada, o sea, dividida en dos partes, como si fuera una variable cualitativa (atributo) con
dos únicas modalidades/ categorías.
Cuando una variables es realmente cualitativa dicotómica (no continua dicotomizada), se aplica el coeficiente de correlación biserial puntual
(rbp)
3. REQUISITOS:
Para poder aplicar la correlación biserial, es preciso que se cumplan estas condiciones:
a. Continuidad de la variable cuantitativa dicotomizada.

b. La variable cuantitativa dicotomizada debe tener una distribución normal.
c. El número de sujetos tiene que ser superior a cincuenta (n 50).
d. Las proporciones y <q> deben ser cercanas a 0.50 (p. ej., 0.60 y 0.40 o 065 y 0.35).
a. FÓRMULAS
Disponemos de dos fórmulas:

Fórmula <A> rb= (() Fórmula Rb = ( )( )
Observamos que en la fórmula , la expresión (media aritmética de los sujetos del grupo <Q>) de la fórmula <A> ha sido sustituido por la
expresión <> (media aritmética total). También cambia el segundo factor del producto.
b. SIMBOLOGÍA:
nt: número de sujetos de todo el grupo.

np: número de sujetos del subgrupo (∑fp).
nq: número de sujetos del subgrupo <q>(∑fq).
p: proporción de sujetos de la modalidad , su fórmula es: 
q: proporción de sujetos de la modalidad <q>; su fórmula es: <q = 1 – p>
: media aritmética de las puntuaciones en la variable continua de los individuos de la modalidad/categoría .
: media aritmética de las puntuaciones en la variable continua de los individuos de la modalidad/categoría <q>.
media aritmética de todas las puntuaciones
St : desviación estándar de todas las puntuaciones.
y : es la ordenada de una distribución normal que divide el área total bajo la curva en dos mitades proporcionales a y <q>. Para conocer
el valor de <y>, se consulta la tabla de valores de la correlación biserial (rb). También puede encontrarse el valor de la razón en la tabla
correspondiente.
UN EJEMPLO DE CÁLCULO
Veamos un problema:
Cuarenta alumnos han sido evaluados por un test de inteligencia espacial (variable cuantitativa continua) y calificados por su profesor como
poseedores o no poseedores de la habilidad de coordinación visomotora (variable cuantitativa continua dicotomizada). Se desea conocer el grado

de relación entre ambas variables.
(Advertimos que para simplificar los cálculos, el ejemplo de problema enunciado incumple el requisito de un número de sujetos mayor de
<50>, lo que no impide nos sea útil para la comprensión del procedimiento.)
Paso 1º) Colocamos las marcas de los intervalos y del punto central de cada intervalo en las columnas <A> y respectivamente de la Tabla
I.
Paso 2º) Llenamos las casillas de las columnas <C>, <D> y <E> de la tabla I con las frecuencias de las puntuaciones de los sujetos del
subgrupo , del subgrupo <q> y del grupo total (p+q = n) respectivamente.
Paso 3º) Sumamos las frecuencias de cada una de esas columnas y colocamos sus resultados en la casilla inferior de su respectiva columna
(<C>, <D> y <E>).
Paso 4º) Colocamos en la columna <F> de la tabla II los resultados de multiplicar los puntos medios de cada intervalo por las frecuencias del
grupo .
Paso 5º) Sumamos esos productos y colocamos el resultado en la casilla inferior de la columna <F>.
Tabla I
A B C D E F G H I J
Paso 6º) Ponemos en la
INTERVALOS Punto Frecuencia Frecuencia Frecuencia Producto Producto Producto Cuadrado Producto
medio del intervalo del intervalo total del del punto del punto del punto del punto del
columna <G> de la tabla II los
de cada en fp En <q> fq intervalo ft medio de medio de medio del medio de cuadrado resultados de multiplicar los
intervalo cada cada intervalo cada del Punto puntos medios de cada
Xi intervalo intervalo por su intervalo Xj2 medio por
intervalo por las frecuencias
por su por su frecuencia su
frecuencia frecuencia total Xj)(ft) frecuencia del grupo <q>.
en (Xj) en <q> (Xj) total Xj)2 (ft)
(fp) (fq) Paso 7º) Sumamos esos
productos y situamos los
1-3 2 3 2 5 resultado en la casilla inferior
4-6 5 4 3 7
de la columna <G>.
Paso 8º) Multiplicamos los
7-9 8 10 8 18
puntos medios de cada
10-12 11 2 5 7 intervalo por las frecuencias
del grupo total (<ft>)
13-15 14 1 2 3
(columna <H> de la tabla II)
∑fp = 20 ∑f q = 20 ∑Xt = 40 ∑ (Xj)(fp) ∑(Xj) (fq) ∑(Xj)(ft) ∑
Paso 9º) Sumamos esos
productos y el resultado lo
colocamos en la casilla inferior de la columna <H>.
Tabla II
A B C D E F G H I J
INTERVALOS punto frecuencia Frecuencia Frecuencia Producto Producto Producto Cuadrado Producto
medio de del intervalo del intervalo total del del punto del punto del punto del punto del cuadrado
cada en fp En <q> fq intervalo ft medio de medio de medio del medio de del Punto
intervalo cada cada intervalo por cada medio por su
xi intervalo por intervalo por su intervalo Xj2 frecuencia
su su frecuencia total Xj)2 (ft)
frecuencia frecuencia total
en (Xj) en <q> (Xj)
Xj)(ft)
(fp) (fq)
1-3 2 3 2 5 6 4 10
4-6 5 4 3 7 10 15 35
7-9 8 10 8 18 80 64 144
10-12 11 2 5 7 22 55 77
13-15 14 1 2 3 14 28 42
∑fp = 20 ∑f q = 20 ∑Xt = 40 ∑(Xj) ∑(Xj) ∑(Xj) ∑ (Xj)2

(fp)=132 (fq)=166 (ft)=308
Paso 10º) Hallar las medias aritméticas de las puntuaciones de los sujetos del grupo , del grupo <q> y del grupo total <t>:
= 6.6
= = = 8.3
= = = 7.70
Paso 11º) Elevamos al cuadrado los puntos medios de cada intervalo (columna de la Tabla III).

Paso 12º) Multiplicamos el cuadrado del punto medio de cada intervalo por su frecuencia total o sea, la suma de las frecuencias de ambos
grupos (fp + fq = ft). Lo colocamos en la columna <J> de la tabla III.
Paso 13º) Sumamos esos productos y colocamos el resultado en la casilla inferior de la columna <J>.
Paso 14º) Calculamos la desviación estándar de todo el grupo (<St>):
St = ; St = St = St = =3.20
Tabla III
B C D E F G H I J
INTERVALOS PUNTO Frecuencia Frecuencia Frecuencia ft Producto Producto Cuadrado Producto

MEDIO DE DEL del intervalo total del del punto del punto del punto del
CADA INTERVALO En <q> fq intervalo Producto medio de medio del medio de cuadrado
INTERVALO EN fp del punto cada intervalo cada del Punto
medio de
Xi intervalo por su intervalo Xj2 medio por
cada por su frecuencia su
intervalo frecuencia total Xj)(ft) frecuencia
por su en <q> (Xj) total Xj)2 (ft)
frecuencia (fq)
en (Xj)
(fp)
1-3 2 3 2 5 6 4 10 4 20
2204-6 5 4 3 7 20 15 35 25 175
7-9 8 10 8 18 80 64 144 1152
10-12 11 2 5 7 22 55 77 121 847
13-15 14 1 2 3 14 28 42 196 588
∑fp = 20 ∑f q = 20 ∑Xt = 40 ∑(Xj) ∑(Xj) ∑(Xj) ∑(Xj)2 = ∑(Xj)2(ft)

(fp)=132 (fq)=166 (ft)=308 410 =2782
Paso 15º) Trasladamos los resultados obtenidos en las operaciones aritméticas de los pasos anteriores a la fórmula <A> del coeficiente de
correlación biserial:
rb= (() ; rb= (() = (-0.53() =

Paso 16º) Buscamos en la Tabla de valores de <y>, el valor correspondiente a p= 0.50 y q = 0.50. Encontramos 0.3989. Integramos el valor de y
= 0.3989 en la fórmula:
rb= = - 0.32
CUADRO Nº 45: COEFICIENTE DE CORRELACIÓN BISERIAL PUNTUAL

1. DEFINICIÓN
El coeficiente de correlación biserial puntual es una mera aplicación del coeficiente de correlación lineal de Pearson <rxy> a una variable
cuantitativa continua y a una variable cualitativa dicotómica o sea, que solamente tiene dos modalidades (no una variable cuantitativa continua
dicotomizada, como sucedía con el coeficiente de correlación biserial).
2. FÓRMULAS
Disponemos de dos fórmulas para el cálculo del coeficiente de correlación biserial puntual:
Fórmula A:
rbp= (( ) Fórmula B rbp= ( ) )
SIMBOLOGÍA:
p: proporción de individuos de la categoría superior de la variable cualitativa dicotómica.
q: proporción de individuos de la categoría inferior de la variable cualitativa dicotómica.
Xp: puntuaciones directas del grupo .
Xq: puntuaciones directas del grupo <q>.
Xt: puntuaciones directas de todo el grupo.
: media aritmética de las puntuaciones en la variable cuantitativa <X> obtenidos por los sujetos pertenecientes al grupo que portan la
modalidad de la variable cualitativa dicotómica <Y>.
: media aritmética de las puntuaciones en la variable cuantitativa <X> obtenidos por los sujetos pertenecientes al grupo que porta la modalidad
<q> de la variable cualitativa dicotómica <Y>.
St: desviación estándar de las puntuaciones obtenías por todos los sujetos de la muestra.
UN EJEMPLO DE CÁLCULO:
Se desea conocer el grado de correlación existente entre la variable cualitativa dicotómica <sexo> y la variable cuantitativa continua
<inteligencia espacial> de una muestra de 60 varones y 40 mujeres de un taller mecánico.
Paso 1º) Hallamos los valores de y de <q>

p= q=
Paso 2º) Situamos los valores de los intervalos en la columna <A> de la Tabla I.
Paso 3º) Determinamos los puntos medios de cada intervalo en la columna .
Paso 4º) Colocamos las frecuencias de (varones) en la columna <C>.
Paso 5º) Hacemos lo mismo con las frecuencias de <q> (mujeres) en la columna <D>.
Paso 6º) Hallamos las frecuencias totales de cada intervalo, sumando la frecuencia de con la frecuencia de <q> en cada intervalo; se
sitúan los resultados en la columna <E>.
Tabla I
A B C D E F G H I J
INTERVALOS PUNTO FRECUENCIA FRECUENCIA FRECUENCIA Producto Producto Producto Cuadrado Producto
CENTRAL DE DE <q> TOTAL de de la de la de los puntos de los
DEL frecuencia frecuencia frecuencia medios cuadrados
INTERVALO de <q> por el total por el de los
por punto punto medio Punto medio puntos
central del de cada del intervalo medios de
intervalo clase del cada
intervalo intervalo por
la frecuencia
total del
intervalo
1-3 2 6 5 11
4-6 5 10 7 17
7-9 8 18 12 30
10-12 11 16 10 26
13-15 14 10 6 16
Np = 60 Nq = 40 Nt = 100
Paso 7º) Multiplicamos la frecuencia de de cada intervalo por el punto central de ese intervalo (columna <F> de la Tabla II).
Paso 8º) Multiplicamos la frecuencia de <q> de cada intervalo por el punto medio del intervalo (columna <G>).
Paso 9º) Así mismo, multiplicamos la frecuencia total de cada intervalo por el punto medio de cada intervalo (columna <H>).

Tabla II
A B C D E F G H I J
Intervalos Punto Frecuencia Frecuencia Frecuencia Producto Producto Producto Cuadrados Producto
central de E de <q> Total de de la de la de los de los
de cada frecuencia frecuencia frecuencia puntos cuadrados
intervalo de por <q> por el total de medios de de los
punto punto cada cada intervalo Puntos
central del medio del intervalo medios de
intervalo intervalo por el punto cada
medio de intervalo
cada por la
intervalo frecuencia
total de
cada
intervalo
1-3 2 6 5 11 12 16 22
4-6 5 10 7 17 50 35 85
7-9 8 18 12 30 144 96 240
10-12 11 16 10 26 176 110 280
13-15 14 10 6 16 140 84 224
60 40 100 522 335 857
Paso 10º) Sumamos los resultados de los productos de las frecuencias de por el punto medio de cada intervalo (columna <F>).
Paso 11º) Sumamos los resultados de los productos de las frecuencias de <q> por el punto medio de cada intervalo (columna <G>).
Paso 12º) Así mismo sumamos los resultados de los productos de las frecuencias totales por sus respectivos puntos medios de cada intervalo
(columna <H>).
Paso 13º) Calculamos la media aritmética de las puntuaciones :
= ; = = 8.7
Paso 14º) Del mismo modo, calculamos la media aritmética de las puntuaciones <q>:
= ; = = 8.37
Paso 15º) Así mismo, calculamos la media aritmética de todas las puntuaciones:
= ; = = 5.22
Paso 16º) Elevamos al cuadrado los puntos medios de cada intervalo (columna de la tabla III).
Paso 17) Multiplicamos cada cuadrado de los puntos medios de cada intervalo por la frecuencia total de cada intervalo (columna <J> de la
Tabla III).
Paso 18º) Sumamos los valores numéricos de la columna <J> de la tabla III.
Tabla III
A B C D E F G H I J
INTERVALOS PUNTO FRECUENCIA FRECUENCIA FRECUENCIA Producto Producto Producto Cuadrado Producto
CENTRAL DE DE <q> TOTAL de de la de la del punto del Paso 19º) Calculamos la
DEL frecuencia frecuencia frecuencia medio cuadrado del
INTERVALO de por <q> por el total por el punto medio desviación estándar (St) de todas las
punto central punto medio punto central del intervalo
del intervalo del intervalo del intervalo por la puntuaciones, utilizando para ello la
frecuencia
total del siguiente fórmula:
intervalo
1-3 2 6 5 11 12 10 22 4 44
St = ; St = St = = =
4-6 5 10 7 17 50 35 85 25 425 7.71
7-9 8 18 12 30 144 96 240 64 1920 Paso 20º) Trasladamos los
10-12 11 16 10 26 176 110 280 121 3146 valores obtenidos en las
operaciones aritméticas de los
13-15 14 10 6 16 140 84 224 196 3136
<pasos> anteriores a la fórmula<A>
60 40 100 522 335 857 8671 del coeficiente de correlación
biserial puntual <rbp>:
rbp= (( )
rbp= (( ) ;
rbp= (( ) = (0.04)(0.48) = 0.0192
El valor obtenido (0.0192) es cercano a 0; ambas series de puntuaciones son totalmente independientes: La inteligencia espacial no está
vinculada al sexo anatómico.

CUADRO Nº 46: COEFICIENTES DE ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS
1. TIPOLOGÍAS DE LOS COEFICIENTES DE ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS
Los coeficientes de asociación entre variables cualitativas/atributos pueden ser clasificados según dos criterios:
a. Por el tipo de variable cualitativa/atributo:
1) Las variables cualitativas dicotómicas (sólo dos modalidades/categorías) o dicotomizadas (por convención, se las trata como si
fueran dicotómicas) pueden ser objeto de cualquiera de los coeficientes de asociación.
2) Los coeficientes de asociación que sirven tanto para las variables cualitativas, dicotómicas (tienen sólo dos
modalidades/categorías) o policotómicas (tienen más de dos modalidades/categorías ) son sólo dos: el coeficiente <c2 > (<ji
cuadrado>) y el coeficiente de contingencia <C> .
b. Por las propiedades de los coeficientes
VARIABLE INFORMAN COEFICIENTE DE

SOBRE:
ASOCIACIÓN
CUALITATIVA LA Coeficiente c2 (ji

EXISTENCIA cuadrado)
DICOTÓMICA
DE LA
RELACIÓN
LA EXISTENCIA DE Coeficiente
LA RELACIÓN Y LA T2 de
MAGNITUD Tschuprow
Coeficiente
V de Cramer
Por LA EXISTENCIA DE Coeficiente
LA RELACIÓN, LA Q de Yule
c. La relación que algunos coeficientes mantienen con otros coeficientes:
MAGNITUD Y EL Coeficiente
SENTIDO f (Phi)
Distinguimos tres grupos: CUALITATIVA LA Coeficiente c2 (ji
POLICOTÓMICAS EXISTENCIA cuadrado)
DE LA
RELACIÓN Coeficiente f2 (phi
I) Coeficientes de asociación que dependen del coeficiente <c2> (ji cuadrado)
cuadrado):
LA EXISTENCIA DE Coeficiente
LA RELACIÓN Y LA T2 de
1º) Coeficiente de contingencia <C> MAGNITUD Tschuprow
Coeficiente
2º) Coeficiente de contingencia máximo <Cmax >> V de Cramer
3º) Coeficiente de contingencia corregido <Ckor> Coeficiente
C de
contingencia
4º) Coeficiente <V> de Cramer de Pearson
5º) Coeficiente <T2> de Tschuprow
II) Coeficientes relacionados con el coeficiente de correlación lineal de Pearson <rXY>:
1º) Coeficiente phi <f>

2º) Coeficiente phi cuadrado <f2>
3º) Coeficiente tetracórico
4º) Coeficiente de correlación biserial
5º) Coeficiente de correlación biserial puntual. Estos dos últimos no son coeficientes de asociación, sino de correlación, pues,
al menos, una de las dos variables es cuantitativa; por ello, han sido expuestas entre los coeficientes de correlación: <Cuadro nº
43> y <Cuadro nº 44>, respectivamente.
1) OTROS COEFICIENTES DE ASOCIACIÓN:
1º) Coeficiente de asociación < c2> (ji cuadrado).

2º) Coeficiente <Q> de Yule
3º) Coeficiente de coligación <w> (omega minúscula)
En el presente <cuadro> se tratan los coeficientes :

a. Coeficiente <Q> de Yule
b. Coeficiente de coligación <w> (omega minúscula)
2. COEFICIENTE <Q> DE YULE DE ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS DICOTÓMICAS O DICOTOMIZADAS

El coeficiente de asociación <Q> de Yule busca hallar el grado de asociación entre dos variables cualitativas/atributos dicotómicas o sea, cada
una de ellas con dos modalidades/categorías o dicotomizadas (tratadas como si tuvieran dos modalidades).
Los valores que puede tomar el coeficiente <Q> van desde el <0> a <+1>.
a. TABLA DE CONTINGENCIA
La tabla de contingencia está formada de dos columnas y dos filas. Una variable se sitúa en las columnas y la otra variable en las filas.
Dos columnas X dos filas resultan cuatro casillas:
TABLA I
VARIABLE <Y> VARIABLE <X>
CATEGORÍA <A> CATEGORÍA


CATEGORÍA <A> a B
CATEGORÍA c D
b. FÓRMULA:
Q=
c. SIMBOLOGÍA:
a: casilla que acoge al número de sujetos que pertenecen a la categoría <A> de la variable <X> y a la categoría <A> de la variable <Y>.
b: casilla que acoge al número de sujetos que pertenecen a la categoría de la variable <X> y a la categoría <A> de la variable <Y>.
c: casilla que acoge al número de sujetos que pertenecen a la categoría <A> de la variable <X> y a la categoría de la variable <Y>.
d: casilla que acoge al número de sujetos que pertenecen a la categoría de la variable <X> y a la categoría de la variable <Y>.
3. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO DE <Q>:
Problema:
Hallar el coeficiente <Q> para conocer el grado de asociación entre dos variables: <X> <sexo anatómico> (hombres y mujeres) e <Y>
<predominancia lateralidad> (diestros y zurdos).
Paso 1º) Situamos los datos en la tabla de contingencia:
VARIABLE VARIABLE <X>

<Y>
HOMBRES MUJERES
DIESTROS 50 35
ZURDOS 10 5
Q= = = = = 0.16
El coeficiente obtenido puede estimarse como muy bajo: ambas variables son independientes entre sí.
4. COEFICIENTE DE COALIGACIÓN <w> (OMEGA MINÚSCULA)

El coeficiente de coaligación < > omega es muy parecido al coeficiente <Q>. Veamos su fórmula.
a. FÓRMULA:
w=
b. SIMBOLOGÍA:
Las casillas <a>, , <c> y <d> tienen idénticos significados que en el coeficiente <Q>, arriba expuesto.
Problema:
Hallar el valor del coeficiente de coaligación <w> omega entre dos variables nominales, <X> e <Y>, con los siguientes datos:

Variable <X> (Partido político) con dos modalidades: partido <A> y partido 
Variable <Y>: <Abono de cuotas de militancia>, con dos modalidades: < los que pagan las cuotas>) y< los que no pagan las cuotas>.
Paso 1º) En la Tabla II se han situado los valores en sus casilla: <a>,, <c>, y <d>.
Tabla I
VARIABLE <Y> VARIABLE <X>
CATEGORÍA <A> CATEGORÍA


CATEGORÍA <A> a b
CATEGORÍA c d
Tampoco es necesario calcular las frecuencias marginales de filas y columnas

Tabla II
VARIABLE <Y>: VARIABLE <X>: PARTIDO POLÍTICO
ABONO DE CUOTAS
PARTIDO <A> PARTIDO 
ABONAN LA CUOTA 40 30
NO ABONAN LA CUOTA 10 5
Paso 2º) Se trasladan esas frecuencias a la fórmula del coeficiente <w>.
w= w= w = = = = 0.10
El coeficiente w> hallado es despreciable: ambas muestras son independientes entre sí.
CUADRO Nº 47: COEFICIENTE DE ASOCIACIÓN c2 (JI CUADRADO) CON

VARIABLES CUALITATIVAS DICOTÓMICAS
1. DEFINICIÓN
La prueba c2 (ji cuadrado) de Pearson es también un coeficiente de asociación entre variables cualitativas/atributos medidas en escala
nominal. Al carecer la lengua inglesa del sonido de la <c> griega, idéntico al de la <j> del castellano, el mundo anglófono no denomina a este
coeficiente de asociación como <ji cuadrado>, sino como <chi cuadrado> (<chi squared>); la expresión <chi cuadrado> también es usada en
muchos textos de Estadística escritos en lengua castellana; nosotros hemos preferido la expresión <ji cuadrado>.
Se utiliza tanto con variables cualitativas de dos modalidades (variables dicotómicas), como con variables cualitativas policotómicas (tienen
más de dos modalidades).
2. LAS DOS FÓRMULAS DEL <JI CUADRADO>
Se dispone de dos fórmulas para calcular el coeficiente ji cuadrado, si bien en este <cuadro> sólo utilizaremos la más sencilla (fórmula <A>), la
que puede aplicarse solamente a las variables cualitativas dicotómicas; la segunda (fórmula ) puede aplicarse a variables cualitativas
dicotómicas o policotómicas:
Fórmula <A>:
c2=
Fórmula :
c2 = ∑
SIMBOLOGÍA DE LA FÓRMULA <A>
n: Número de sujetos.
a: número de sujetos que pertenecen a la modalidad (L) de la variable <X> y a la modalidad (L) de la variable <Y>.
b: número de sujetos que pertenecen a la modalidad (L) en la variable <X> y a la modalidad (R) de la variable <Y>.
c: número de sujetos que pertenecen a la modalidad (R) de la variable <X> y a la modalidad (L) de la variable <Y>.
d: número de sujetos que pertenecen a la modalidad (R) de la variable <X> y a la modalidad (R) de la variable <Y>

ad: producto de la frecuencia de la casilla <a> por la frecuencia de la casilla <d>.
cb: producto de la frecuencia de la casilla <c> por la frecuencia de la casilla .
(a+b): suma de la frecuencia de la casilla <a> con la frecuencia de la casilla .
(d+c): suma de la frecuencia de la casilla <d> con la frecuencia de la casilla <c>.
(b+d): suma de la frecuencia de la casilla con la frecuencia de la casilla <d>.
(a+c): suma de la frecuencia de la casilla <a> con la frecuencia de la casilla <c>.
(a+b+c+d): suma de las frecuencias de las cuatro casillas, o sea suma de los valores marginales de las filas o, lo que es lo mismo, suma de los
valores marginales de las columnas.
a. TABLA
Aquí tenemos la tabla de contingencia que acoge las frecuencias de cada una de las dos modalidades de cada una de las dos variables;
tenemos una tabla de contingencia de 2 por 2, o sea de cuatro casillas para las frecuencias y cinco más para la suma de cada fila, la suma de cada
columna y la suma total (frecuencias marginales):
Tabla I
VARIABLE <X> Totales filas
Mod. <L> Mod. <R>
VARIABLE Mod. <L> a b a+b

<Y>
Mod. <R > c d c+d
Totales a+c b+d a+b+c+d

columnas
3. UN PROBLEMA PARA EJEMPLIFICAR EL PROCEDIMIENTO DE CÁLCULO:
Veamos un problema:
Averiguar si existe asociación entre la variable <estudios veterinarios> y la variable <tener un gato como mascota> entre los
estudiantes, tal como aparecen en Tabla II:
Tabla II
Gato: sí Gato: no Totales
filas
Estudiantes 38 84 a+b
de veterinaria
Estudiantes de otras 22 96 c+d

facultades
Totales a+c b+d

columnas
Paso 1º) Se obtienen los valores marginales sumando las frecuencias de las casillas de cada fila y de cada columna:
Tabla III
Gato: sí Gato: no Totales
filas
Estudiantes 38 84 122
de veterinaria
Estudiantes de otras 22 96 118

facultades
Totales 60 180 240

columnas
Paso 2º): Trasladamos los datos a la fórmula:
c2 = = = = = 5.00
5.00
Más importante que hallar el valor del <c2>, que en nuestro ejemplo vale 5.00, es hallar la significación del mismo, comparando ese valor con
los valores de la tabla de valores críticos de ji cuadrado. Esa comparación nos dirás si ambas variables son independientes entre sí (hipótesis
nula: H 0)), o si, por el contrario, existe dependencia entre ellas (hipótesis alternativa: H 1)
Para poder comparar el valor hallado <5> con los valores críticos que aparecen en la tabla, necesitamos determinar el nivel de significación y
los grados de libertad (freedom degrees). Elegimos un nivel de significación del 5% y hallamos los grados de libertad (<gl>); en nuestro caso, los
grados de libertad resultan de multiplicar el número de filas menos <1> (2 – 1 = 1) por el número de columnas menos <1> (2 – 1= 1). Total: (1)(1) =
1*
Buscamos en la Tabla de valores críticos el valor correspondiente a 1 grado de libertad y a un nivel de significación del 0.05 ( o sea: que existe
un 5 % de riesgo de equivocarnos si aceptamos la hipótesis nula. Encontramos: 3.84

Como el valor de nuestro ji cuadrado (<5>) es mayor que el valor tabular al 5% y a 1 grado de libertad (<3.84>), rechazamos la hipótesis nula
<Ho>: ambas variables no son independientes una de la otra.
* Los grados de libertad (gl) son el número de valores que pueden ser asignados de forma arbitraria antes de que el resto tome un valor
automáticamente. Por ejemplo, si tenemos seis valores y conocemos su media aritmética, cinco de ellos pueden tomar cualquier valor, pero el 6º
necesariamente sólo puede ser uno. Supongamos la siguiente media aritmética: = 10. ¿Qué número es el que hemos puesto entre
interrogaciones? Este número no tiene libertad para ser uno cualquiera, sólo puede ser un <13>, ya que, si fuera otro, no podría obtenerse como
media aritmética: <10>.

TABLA DE VALORES CRÍTICOS DE JI CUADRADO
Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,52 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34.38 37,65 40,5 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17

CUADRO Nº 48: EL COEFICIENTE c2 (JI CUADRADO) PARA VARIABLES
CUALITATIVAS POLICOTÓMICAS (1ª PARTE: CÁLCULO DE LAS FRECUENCIAS
TEÓRICAS)
1. INTRODUCCIÓN
La fórmula, utilizada en el ejemplo presentado en el <cuadro> precedente, solamente es válida para calcular el coeficiente <ji cuadrado> con
variables dicotómicas. Para las variables policotómicas (aunque también válida para las dicotómicas) tenemos una fórmula más compleja y que
requiere realizar tantas diferencia, cuadrados y divisiones como casillas tiene la tabla de contingencia:
a. FÓRMULA:
c2 = ∑
En esta fórmula se distinguen las <frecuencias empíricas>, también denominadas <frecuencias reales>, las que aporta el problema y las
<frecuencias teóricas>, también conocidas como <frecuencias esperadas>; representan las frecuencias que debería tener cada casilla si las dos
variables no mantuvieran ninguna relación, fueran independientes una de la otra. Necesariamente que habrá que calcular estas frecuencias
teóricas previamente, una a una, para cada casilla.
b. SIMBOLOGÍA:
∑: sumatorio
femp: frecuencia empírica, la frecuencia real, la que aparece en los datos del problema en esa casilla de la tabla de distribución de frecuencias.
fteor: frecuencia teórica, la que debería haber sido si las frecuencias se hubieran repartido en las casillas de modo totalmente independiente
una variable respecto de la otra.
2. CÁLCULO DE LAS FRECUENCIAS TEÓRICAS DE CADA CASILLA
Se aplica la siguiente fórmula:
ft =
SIMBOLOGÍA:
ffila: frecuencia marginal de la fila en la que está la casilla de la que se quiere conocer la frecuencia teórica que se trate.
f columna : frecuencia marginal de la columna en la que está la casilla de la que se quiere conocer la frecuencia teórica.
Se entiende por frecuencia marginal de cada fila, la suma de las frecuencias empíricas de las casillas que forman la fila.
Se entiende por frecuencia marginal de cada columna, la suma de las frecuencias empíricas de todas las casillas que forman la columna.
Tabla I
Variable <X>
Mod. M Mod. N Mod. Ñ Mod. P Suma de las frecuencias empíricas de las filas
Variable Mod. <H> a b c d Marginal fila <H>

<Y>
Mod. <L> e f g h Marginal fila <L>
Mod. <J> i j k l Marginal fila <J>
Suma de las frecuencias empíricas de las Marginal Marginal Marginal Marginal

columnas columna columna columna columna <n>
<M> <N> <Ñ> 
3. TRANSCRIBIR LAS FRECUENCIAS EMPÍRICAS A LA TABLA DE CONTINGENCIA
Como podemos ver, nos encontramos con dos variables <X> e <Y>. La primera variable (<X>) con cuatro modalidades (<M>, <N>, <Ñ> y ) y
la segunda variable (<Y>) con tres modalidades (<H>, , <J>). En total, 12 casillas: (4)(3) = 12
Supongamos una tabla de contingencia con las siguientes frecuencias empíricas:
Tabla II
Variables Variable <X>
Mod. M Mod. N Mod. Ñ Mod. P Suma de

las
frecuencias
empíricas
de las filas

Variable <Y> Mod. <H> 30 15 10 5 Marginal
fila <H> 60
Mod. <L> 25 12 11 2 Marginal

fila <L> 50
Mod. <J> 60 10 12 8 Marginal

fila <J> 90
Suma de las frecuencias empíricas de las Marginal de la Marginal columna Marginal Marginal
columna<M> 115 <N> = 37 columna columna <n> 200
<Ñ> = 33 = 15
4. HALLAR LAS FRECUENCIAS MARGINALES
Comenzamos hallando las frecuencias marginales:

Paso 1º) Sumamos las casillas de cada fila.
Paso 2º) Sumamos las casillas de cada columna.
Paso 3º) Sumamos las casillas marginales de las filas o sumamos las casillas marginales de las columnas. Comprobamos que resulta es el
mismo número en los dos casos.
En total, son tantas casillas marginales como la suma del <nº de filas>, del <nº de columnas> más (+) <1>. En nuestro caso: 4 + 3 + 1= 8
5. ¿CÓMO OBTENER LAS FRECUENCIAS TEÓRICAS DE CADA CASILLA?
Paso 4º) Todas las casilla están en una fila y en una columna. Para calcular el valor que corresponde a la frecuencia teórica de cada casilla,
multiplicamos el valor marginal de la fila en el que está la casilla, por el valor marginal de la columna en la que está la casilla. Comenzamos:
La frecuencia teórica de la casilla de la fila <H> y de la columna <M> resulta demultiplicar la frecuencia marginal de la fila <H> (60), por la
frecuencia marginal de la columna <M> (115) y dividiendo ese producto entre la frecuencia total (200):
Frecuencia teórica de la casilla de la fila <H> y de la columna <M>= = 34.5

Este resultado está recogido en la Tabla III. Allí mismo pueden verse los cálculos y sus resultados para hallar las frecuencias teóricas de las
restantes casillas de la tabla de contingencia:
Tabla III
Variable
<X>
Mod. M Mod. N Mod. Ñ Mod. P Suma de

las
frecuencias
empíricas
de las filas
Variable Mod. Marginal

<Y> <H> fila <H> =
= 11.1 60
Mod. Marginal
<L> fila <L> =
9.25 = 13.25 = 3.75 50
Mod. = 6.75 Marginal

<J> fila <J> =
= = 16.65 = 14.85 90
51.75
Suma Marginal Marginal Marginal Marginal <n> =

de las 200
columna columna columna columna
frecuencias
empíricas <M> = <N> 37 <Ñ> = 33 = 15
115

CUADRO 49º: EL COEFICIENTE c2 (JI CUADRADO) PARA VARIABLES
CUALITATIVAS POLICOTÓMICAS (2ª PARTE: CÁLCULO DEL COEFICIENTE c2)
1. LAS TABLAS DE FRECUENCIAS EMPÍRIAS Y DE FRECUENCIAS TEÓRICAS
En el Cuadro nº 48, expusimos el cálculo de las frecuencias teóricas. En el presente <Cuadro> se expone el procedimiento completo de cálculo
del coeficiente c2. Para ello, traemos las dos tablas de frecuencias empíricas y de frecuencias teóricas presentadas en el <Cuadro nº 48>:
TABLA I DE LAS FRECUENCIAS EMPÍRICAS

Variable
<X>
Mod. M Mod. N Mod. Ñ Mod. P Suma de las frecuencias empíricas de las

filas
Variable Mod. <H> 30 15 10 5 Marginal fila <H> 60

<Y>
Mod. <L> 25 12 11 2 Marginal fila <L>

50
Mod. <J> 60 10 12 8 Marginal fila <J>

90
Suma de las frecuencias empíricas de Marginal de la columna<M> Marginal Marginal Marginal

las 115
columna columna columna <n> 200
<N> = 37 <Ñ> = 33 = 15
TABLA II DE LAS FRECUENCIAS

TEÓRICAS
Variable
<X>
Mod. M Mod. N Mod. Ñ Mod. P Suma de las frecuencias empíricas de las

filas
Variable Mod. = 9.9 = 4.5 Marginal fila <H> = 60

<H>
<Y>
Mod. <L> = 9.25 = 8.25 Marginal fila <L> =

50
Mod. <J> = 6.75 Marginal fila <J> =

90
Suma de las frecuencias empíricas de las Marginal Marginal Marginal Marginal

columnas columna columna columna columna <n> = 200
<M> = 115 <N> 37 <Ñ> = 33 = 15
2. CÁLCULO DEL VALOR DE CADA SUMANDO

Tenemos dos tablas: una de ellas recoge las frecuencias empíricas y la otra, las frecuencias teóricas. Ahora ya es posible calcular el
coeficiente c2 (ji cuadrado), hallando el valor numérico de cada una de las casillas. Recordemos la fórmula de c2 ji cuadrado para variables
cualitativas policotómicas:
c2 = ∑
La fórmula nos indica que el resultado es una suma de tantos sumandos como casillas. En nuestro caso, doce sumandos (3 filas por 4
columnas = 12 casillas).
También nos dice que el valor numérico de cada casilla resulta de una fracción, cuyo numerador es el cuadrado de la diferencia (resta) entre la
frecuencia empírica y la frecuencia teórica, y cuyo denominador es la frecuencia teórica.
Para una más clara presentación de las operaciones aritméticas implicadas en la fórmula y así hacer más fácil la comprensión, hemos trazado
la siguiente tabla formada por seis columnas (una por el resultado de cada una de las operaciones aritméticas que conforman la fórmula) y doce
filas (una por cada casilla de la tabla de nuestro problema), más una primera fila con los encabezamientos:
c2 = + + + + + + + + + + + =
c2 = + + + + + + + + + + + = 0.58 + 1.37 + 0.08 + 0.2 + 0.48 + 0.91 +

0.91 + 0.81 + 1.31 + 2.65 + 0.54 + 0.23 = 10.07
c2 = 10.07
La Tabla III presenta los resultados de las operaciones aritméticas intermedias:

Tabla III
A B C D E F
CASILLA FRECUENCIA FRECUENCIA DIFERENCIA Cuadrado Cociente
EMPÍRICA TEÓRICA ENTRE
FRECUENCIA
de la entre los
EMPÍRICA Y diferencia cuadrados
FRECUENCIA entre de las
TEÓRICA frecuencia diferencias
empírica y empíricas y
frecuencia las
teórica frecuencias
teóricas
divididos
entre las
frecuencias
teóricas
A 30 34.5 4.5 20.25 0.58
B 15 11.1 + 3.9 15.21 1.37
C 10 9.9 + 0.91 0.82 0.08
D 5 4.5 + 9.50 0.90 0.2
E 25 28.75 - 3.75 14.06 0.48
F 12 9.25 + 2.75 7.56 0.91
G 11 8.25 + 2.75 7.56 0.91
H 2 3.75 - 1.75 3.06 0.81
I 60 51.75 + 8.25 68.06 1.31
J 10 16.65 - 6.65 44.22 2.65
K 12 14.85 - 2.85 8.12 0.54
L 8 6.75 + 1.25 1.56 0.23
Total:
10.07
Comparamos el valor obtenido (10.07) con el valor de la Tabla de valores críticos de ji cuadrado, para un nivel del 5% (0.05) y para 2 grados de
libertad: (filas – 1) (columnas – 1) = (2 – 1 = 1) (3 – 1 = 2) = (1)(2) = 2 y encontramos un valor tabular de: <5.99>.
Comprobamos que el valor de nuestro ji cuadrado (10.07) es mayor que el valor tabular (5.99), por lo que rechazamos la hipótesis nula (Ho):
<ambas variables son independientes>) y se acepta la hipótesis alternativa (H1): <que ambas variables no son independientes una de la otra>.
CUADRO Nº 50: COEFICIENTES DE ASOCIACIÓN DERIVADOS DEL COEFICIENTE

<c2 >
1. RELACIÓN DE COEFICIENTES DE ASOCIACIÓN DERIVADOS DEL COEFICIENTE <c2> (JI CUADRADO)
Los coeficientes de asociación entre variables cualitativas dicotómicas (solamente dos modalidades/categorías por variable) o policotómicas
(más de dos modalidades/categorías por variable) derivados del coeficiente c2 son:
1) Coeficiente de contingencia <C>
2) Coeficiente de contingencia corregido: <Ckor>
III) Coeficiente de contingencia máximo: <Cmax>
IV) Coeficiente <V> de Cramer
V) Coeficiente <T2>de Tschuprow.
VI) Coeficiente <f2> (fi cuadrado).
Veamos cada uno de ellos.
2. COEFICIENTE DE CONTINGENCIA <C>
El coeficiente de contingencia <C> se mueve entre < - 1 > y < + 1 >. De la tabla de contingencia se inferirá si el resultado es negativo < - >
o positivo < +>.
a . FÓRMULA:
C=
b. SIMBOLOGÍA:

c2 : ji cuadrado.
n: número de sujetos de la muestra.
c. UN EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO:
Un problema
Calcular el valor de <C> cuando el <ji cuadrado> es 35 y el número de sujetos es 40.
C=
C = = = = 0.67
3. COEFICIENTE DE CONTINGENCIA MÁXIMO: <Cmax>.
Se utiliza para determinar el valor máximo que puede tomar <C> según las modalidades que presenta cada variable cualitativa.
a. FÓRMULA:
Cmax =
b. SIMBOLOGÍA DE LA FÓRMULA:
m: el número menor de categorías de entre las categorías de las dos variables nominales de la tabla de contingencia.
C. PROCEDIMIENTO:
Para evitar el cálculo de la raíz cuadrada del cociente de la fórmula, es más práctico consultar la tabla con los valores de Cmax a partir del
valor de <m>:
SI <m> ENTONCES
ES EL VALOR
IGUAL
MÁXIMO
A:
DE
<C> ES
IGUAL A:
2 0.707
3 0.816
4 0.866
5 0.894
6 0.913
7 0.926
8 0.935
9 0.943
10 0.949
Conocidos los valores resultantes de calcular los coeficientes de contingencia <C> y de contingencia máximo <Cmax>, se puede estimar el
valor que hubiera obtenido el coeficiente de correlación lineal, utilizando esta fórmula:
rxy
Atención: el signo < significa <parecido a…>, <próximo a..>, es distinto a < = > que significa <igual a…>.
Supongamos que C = 0.30 y Cmax = 0.913, entonces:
rxy == 0.57
4. COEFICIENTE <C> CORREGIDO:
Para precisar el valor del coeficiente de contingencia <C> en ciertos casos, puede utilizarse la versión corregida del coeficiente con la
siguiente fórmula:
a. FÓRMULA:
CKOR = ( ) ( C )
b. SIMBOLOGÍA:
k: el número menor de modalidades que presenta una variable. Puede sustituirse la <k> de la fórmula por una <m>

Hallar el valor del coeficiente de contingencia corregido con los siguientes datos:
C = 0.73
k (o <m>) = 3
CKOR = ( ) ( C ) ; CKOR = ( ) ( 0.73 ) = (1.22)(0.73)= 0.89
6. COEFICIENTE <V> DE CRAMER
a. FÓRMULA
V=
a. SIMBOLOGÍA DE LA FÓRMULA:
m: entre las dos variables, se elige aquella que tiene el menor número de modalidades; ese número es <m>. Por ejemplo, si una
variable presenta 4 modalidades y la otra variable, 3 modalidades, el valor de <m> es 3, por ser 3 el menor de los dos números de
modalidades (3 y 4)
b. PROCEDIMIENTO:
Un ejemplo de cálculo:
Hallar el valor de <v> con los siguientes datos:
c2 0.80
n 20
m 2
Sustituyendo los símbolos de la fórmula por los valores:
V=
V= ; V = ; V = = 0.20
7. COEFICIENTE T2 DE TSCHUPROW
a. FÓRMULA:
T2 =
b. SIMBOLOGÍA DE LA FÓRMULA:
n: número de casos
filas: número de filas de la tabla de contingencia.
columnas: número de columnas de la tabla de contingencia.
c. PROCEDIMIENTO.
Supongamos que tenemos los siguientes datos:
Ji cuadrado 0.80
n 20
Filas 3
Columnas 2
Sustituimos los símbolos de la fórmula por los correspondientes valores:
T2 = T2 =
T2 = T2 = T2 = T2 = = 2.82
8. COEFICIENTE < f2 > (FI CUADRADO)
El cuadrado del coeficiente < f2> es igual al cociente de <c2 > (ji cuadrado) entre número de sujetos.
a. FÓRMULA:

f2 =
b. SIMBOLOGÍA:
c. PROCEDIMIENTO DE CÁLCULO:
Supongamos que el valor de ji cuadrado es 0.80 y el número de sujetos es 60
Sustituimos los símbolos de la fórmula por los valores:
f2 = f2 = f2 = 0.01

EPÍLOGO
EL USO DE LOS PROGRAMAS INFORMÁTICOS DE ESTADÍSTICA
1. DISPOSITIVOS ELECTRÓNICOS Y PROGRAMAS INFORMÁTICOS PARA LOS ANÁLISIS ESTADÍSTICOS
Antes de considerar el uso de programas informáticos dedicados al análisis estadístico, creemos conveniente advertir al lector que
todos los cálculos de estadígrafos en el ámbito de la Estadística Descriptiva pueden realizarse con:
a. Calculadoras manuales que incluyan entre sus operaciones, la potenciación al cuadrado, la raíz cuadrada y (conveniente, pero no
indispensable) la potenciación con exponente superior a 2.
b. Calculadoras manuales científicas, que ofrecen un <modo> de Estadística. Generalmente con este <modo>, es posible introducir los
datos y recibir los cálculos sobre esos datos pulsando las teclas de <sumatorio de x> (, sumatorio de los cuadrados de x (∑x2) y la
desviación estándar (S, si bien en las calculadores esta tecla lleva la etiqueta: s2).
Estas calculadoras, a nuestro entender, son instrumentos válidos para calcular los índices de tendencia central, de variabilidad, de asimetría,
de apuntamiento, los percentiles y los coeficientes de correlación y de asociación que componen todos los contenidos de la Estadística
Descriptiva, cuando el número de datos (individuos, sujetos) no excede de treinta o cuarenta, según el tiempo y el esfuerzo que estemos
dispuestos a invertir.
Por otra parte, también son útiles para estos mismos cálculos, los programas <EXCEL> de Microsoft Office y <CALC> de Open Office.
Sin embargo, si nos encontramos con fuerzas, nuestro nivel informático es medio o alto y el volumen de datos lo aconseja, iremos a utilizar los
programas informáticos de Estadística a nuestra disposición.
Numerosos programas informáticos sirven para analizar datos estadísticos. La relación de ellos es muy larga, pero vamos a citar los más
conocidos:
SPSS, MINITAB, STATGRAPHICS, STATSOFT, SAS, SPAD, winIDAMS (gratuito, UNESCO), openEPI,…Unos son gratuitos (de código abierto),
otros pueden descargarse en ciertas condiciones y el resto son de pago.
2. EL PROGRAMA INFORMÁTICO <SPSS>
Entre os programas informáticos de aplicación en Estadística, destaca el programa de IBM SPSS (Statistic Package for Social Sciences).
Vamos a intentar describir lo que encontrará un nuevo usuario del programa cuando lo abra.
Cuenta con seis ventanas (windows):
Una ventana principal y cinco ventanas secundarias. Estas últimas llevan las siguientes etiquetas:
NEW DATA (Nuevos datos): parecen los datos que están activos (extensión: .SAV).
OUTPUT (Resultados de los análisis estadísticos (extensión: .SPO).
SYNTAX (Sintaxis): instrucciones y procedimientos de tratamiento y cómputo de los datos en los diversos análisis posibles con los datos de la
ventana <NEW DATA> y los resultados aparecen en la ventana <OUTPUT> (extensión: .SPS).
CHART CAROUSEL: contiene las representaciones gráficas de los análisis (extensión: .CHT).
CHART: editar los datos de las ventanas carousel (extensión: .CHT, la misma que en CHART CAROUSEL).
3. DESCRIPCIÓN DE LA VENTANA <NEW DATA
Es una base de datos parecida a la matriz de EXCEL

Cuenta con:
BARRA DE MENÚS
BARRA DE HERRAMIENTAS
BARRA DE ESTADO
LÍNEA DE ESTADO
BARRAS DE DESPLAZAMIENTO (No las hemos representado en la figura)
BARRA DE
MENÚS
Archivo Editar Ver
Datos Transformar
Estadísticos Gráficos
Utilidades Ventana
Ayuda

BARRA DE
HERRAMIENTAS
Nuevo Guardar Imprimir
,…etc.
Nombre Tipo Anchura Decimales Etiquetas Valores Perdidas Columnas Alineación Medida Rol
BARRA DE
ESTADO
LÍNEA DE
ESTADO
Veamos en el siguiente cuadro lo que ofrece cada uno de los diez menús:
EDICIÓN VER DATOS TRANSFORMAR ESTADÍSTICOS GRÁFICOS UTILIDADES VENTANA AYUDA
Editar el Búsqueda Definir Creación y Procedimientos Elegir entre Configurar Modificar Informa
texto de las y cambio. variables. transformar de cada análisis tipos de (crear y activar las sobre
ventanas de incluye un y cambiar Variables. estadístico. representaciones. grupos de características Funciones
resulta os menú de datos . variables, de la ventana del SPSS.
<Referencias> consultar del programa;
para Variable e presentar las
personalizar Instrucciones,… ventanas en
aspectos del mosaico o en
funciona- cascada,…
miento del
programa.
Para terminar esta brevísima incursión en el SPSS, presentamos dos cuadros, uno sobre los análisis aplicables a datos cuantitativos, y el
otro, a variables cualitativas/atributos (hemos traducido a la lengua castellana, los términos en inglés):
PARA DATOS CUANTITATIVOS En el menú ESTADÍSTICOS

(STATISTICS)
En el menú ESTADÍSTICOS (STADISTICS)
DESCRIPTIVOS (DESCRIPTIVES) Opciones:
Formato (FORMAT) Modifica el formato de la tabla
Perdidos (MISSING) INCLUDED Incluye los valores

perdidos.
LISTWISE Excluye los valores perdidos.
Estadísticos (STATISTICS) Opciones:
MEAN Media aritmética
SEMEAN Error típico de la media aritmética
STDDEV Desviación estándar
VARIANCE Varianza
KURTOSIS Apuntamiento
SKEWNESS Asimetría
RANGE Amplitud
MINIMUN Valor mínimo que toma la variable
MAXIMUN Valor máximo que toma la variable
SUM Suma
DEFAULT Media, desviación estándar, mínimo

y máximo
ALL Todos los estadísticos anteriores
Distribución (SORT) (A):Ascendente Serie ascendente
(D):Descendente Serie descendente

PARA DATOS CUALITATIVOS
Pulsar en STATISTICS/SUMARIZE Opciones:
Frecuencias (FRECUENCIES) Frecuencias, porcentajes simples, válidos y acumulados, polígono de frecuencias e histogramas
Tabulación (CROSSTABS) Opciones:
CELLS Celdillas, casillas
FORMATS Formatos
STATISTICS Opciones:
CHISQ Ji cuadrado
CORR Correlación
KAPPA Coef. Correlación KAPPA
RISK Riesgo de error en los cálculos de las tablas de contingencia 2X2
PARA DATOS CUANTITATIVOS

Como sabemos las variables cuantitativas vienen definidas por números, no por palabras. Con los datos cuantitativos se pueden hacer
análisis como:
a. Índices de tendencia central.

b. Índices de variabilidad
c. Índices de apuntamiento y de curtosis
d. Percentiles
e. Coeficientes de correlación y de asociación.
Para realizar estos análisis, pulsamos en <STATISTICS/SUMMARIZE/EXPLORE, encontramos las siguientes pestañas:
a. BOXPLOT para hacer gráficos

b. HISTOGRAM para hacer histogramas
c. STEM-AND-LEAVE (TRONCO Y HOJAS) para hacer pruebas de normalidad de la variable, si se ajusta a la distribución normal (Shapiro y
Wilks, y de Kolgoromov-Smirnov).
Pulsando en el menú STATISTICS, encontramos varias opciones:
a. FORMAT
b. MISSING, con dos opciones:
a) INCLUDED: todos los valores perdidos
b) LISTWISE: Excluye los casos que presentan uno o más valores perdidos
c. STATISTICS MEAN. Con las siguientes opciones (el significado de estas expresiones ha sido expuesto en el cuadro <para datos
cuantitativos>):
a) MEAN
b) STDDEV
c) VARIANCE
d) KURTOSIS
e) SKEWNESS
f) RANGE
g) MINIMUM

h) MAXIMUN
i) SUM
j) DEFAULT
k) ALL
d. SORT (distribución)
Valgan los anteriores párrafos de este <Epílogo> como una introducción somera y breve al uso del programa SPSS.

Síntesis de Estadística Descriptiva para Ciencias Sociales - Jesús María Nieto Gil

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Síntesis de Estadística Descriptiva para Ciencias Sociales - Jesús María Nieto Gil

Încărcat de

Drepturi de autor:

Formate disponibile

SÍNTESIS DE ESTADÍSTICA DESCRIPTIVA PARA LAS CIENCIAS

FÓRMULAS, SÍMBOLOS Y OPERACIONES EN LA RESOLUCIÓN DE PROBLEMAS PASO

Jesús María Nieto Gil

CUADRO Nº 1: LAS CIENCIAS 12

CUADRO Nº 3: TIPOS DE VARIABLES 24

6. VARIABLES CUANTITATIVAS DISCRETAS Y 26

Estadísticos e-Books & Papers

4. POSIBLES OPERACIONES ARITMÉTICAS 33

CUADRO Nº 7: CONCEPTOS BÁSICOS 42

CUADRO Nº 8: SÍMBOLOS USADOS

LETRAS GRIEGAS UTILIZADAS EN LA 46

CUADRO Nº 10. REPESENTACIONES 51

GRÁFICAS DE LOS DATOS

Estadísticos e-Books & Papers

CUADRO Nº 11: TAREAS DE LA 56

2. RECOGIDA Y ORDENACIÓN DE LOS DATOS 56

4. EJEMPLO DE TABLA PARA MUESTRAS 58

5. EJEMPLO DE TABLA DE FRECUENCIAS PARA

6. EJEMPLO DE TABLA DE FRECUENCIAS PARA

CUADRO Nº 12: ÍNDICES

2. TIPOS DE ÍNDICES DESCRIPTIVOS DE UNA 62

3. INDICES DE TENDENCIA CENTRAL 63

4. INDICES DE VARIABILIDAD O DISPERSIÓN 63

5. LOS INDICES DE ASIMETRÍA Y APUNTAMIENTO 63

CUADRO Nº 13: ÍNDICES DE

2. LA MODA ENTRE LOS ÍNDICES DE TENDENCIA 66

3. CÓMO IDENTIFICAR LA <MODA> DE UNA

6. EJEMPLOS DE IDENTIFICAR LA <MODA> DE

CUADRO Nº 14: LA MEDIANA 71

2. EL CÁLCULO DE LA MEDIANA (Md) 71

3. TIPOS DE CÁLCULOS DE LA MEDIANACON

4. CÁLCULO DE LA MEDIANA EN ESTE 72

5. EJEMPLO DE PROCEDIMIENTO PARA HALLAR

Estadísticos e-Books & Papers

2. EJEMPLO DE CÁLCULO DE LA MEDIANA DE

CUADRO Nº 16: CÁLCULO DE LA

CUADRO Nº 17: CÁLCULO DE LA

CUADRO Nº 18: DETERMINAR LA

3. LAS OPERACIONES CON PERCENTILES 82

6. HALLAR LA PUNTUACIÓN QUE LE

CUADRO Nº 19: LA MEDIA 85

2. DEFINICIÓN, SÍMBOLO, FÓRMULAS Y

3. CASOS EN EL CÁLCULO DE LA MEDIA 86

4. CASO <a>: CÁLCULO DE LA MEDIA

5. CASO <b>: CÁLCULO DE LA MEDIA

CUADRO Nº 20: CÁLCULO DE LA

2. PROCEDIMIENTOS PARA AGRUPAR VALORES 91

4. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO

CUADRO Nº 21: LA MEDIA 95

CUADRO Nº 22: LA MEDIA 97

2. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO 97

3. DEFINICIÓN, SÍMBOLO, FÓRMULA Y

4. EJEMPLO DEL PROCEDIMIENTO DE CÁLCULO 99

CUADRO Nº 23: LOS ÍNDICES DE 101

2. RELACIÓN DE LOS ÍNDICES DE

3. ADECUACIÓN DEL ÍNDICE DE VARIABILIDAD

4. PUNTUACIONES DIRECTAS Y PUNTUACIONES 104

5. ADVERTENCIA SOBRE LOS SÍMBOLOS DE LA

6. CUADRO CON LAS RELACIONES ENTRE

CUADRO Nº 24: AMPLITUD TOTAL Y

5. UN EJEMPLO DEL PROCEDIMIENTO DE 108

CUADRO Nº 25: LA DESVIACIÓN 110

2. RECORDAMOS LO QUE SON LAS 110