Sunteți pe pagina 1din 74

ESTADÍSTICA APLICADA A LA PSICOLOGÍA

GUIA PRÁCTICA E
INSTRUCTIVOS DEL INFOSTAT

PROF: LIC. STELLA MARIS DIEZ


(v.2015)
INDICE

Página
PRÁCTICO 1: CONCEPTOS INTRODUCTORIOS
Comunicación de una investigación científica 3
Recopilación de datos 6
Tipos de investigación 6
Variables y escalas de medición 6
Práctica propuesta 7
Procesos en el Infostat: operaciones sobre variables 11
PRÁCTICO 2: PRESENTACIÓN GRÁFICA Y TABULAR DE DATOS 13
Procesos en el Infostat: tablas de frecuencia y contingencia 15
PRÁCTICO 3: ANÁLISIS DESCRIPTIVO UNIVARIADO 21
Procesos en el Infostat: medidas resumen 23
PRÁCTICO 4: PROBABILIDADES 29
Aplicación de probabilidades en la evaluación de métodos diagnósticos 33
PRÁCTICO 5: MODELOS PROBABILÍSTICOS 34
Distribución normal y normal estandarizada 34
Procesos en el Infostat: probabilidades y fractiles bajo la normal 36
Suma de variables aleatorias y teorema central del límite 40
PRÁCTICO 6: PRUEBAS DE HIPÓTESIS SELECCIONADAS 41
Prueba T para dos muestras independientes 42
Prueba T apareada para dos muestras dependientes 44
Prueba Chi (de homogeneidad y de independencia) 45
Práctica propuesta 48
PRÁCTICO 7: ANALISIS DE CORRELACIÓN 55
PRÁCTICO 8: ANALISIS DE REGRESIÓN 61
ANEXO I: RESPUESTAS ABREVIADAS DE LA PRACTICA PROPUESTA 66
PRÁCTICO 1: CONCEPTOS INTRODUCTORIOS

COMUNICACIÓN DE UNA INVESTIGACIÓN CIENTÍFICA

INTRODUCCION

- Define el fenómeno o problemática de interés y su relevancia.


- Plantea la hipótesis, conjeturas, predicciones que se esperan responder o poner a prueba.

MARCO TEORICO – ESTADO DEL ARTE

- Detalla lo que se conoce hasta el momento acerca del fenómeno objeto de estudio.
- Define la línea teórica que siguen los autores de la investigación.

METODOLOGIA DE LA INVESTIGACION O MATERIALES Y METODOS

- Sobre la metodología de la investigación se deben identificar las siguientes cuestiones:


o Población, unidad de análisis
o Forma de recopilación de datos: censo, muestreo/experimentación
 Plan de muestreo: detalla el procedimiento seguido para la selección de las unidades
de análisis.
 Diseño experimental: identifica el/los tratamientos y cómo fueron aplicados, detalla la
forma en que se asignaron las unidades experimentales a los tratamientos.
o Instrumentos de medición
o Indicadores: a) variables dependientes (observadas o respuesta) y su escala y b) variables
independientes o explicativas.

- Sobre la metodología estadística


o conjunto de técnicas estadísticas aplicadas en el análisis de los datos e información adicional
como el nivel de significación de las pruebas de hipótesis.
o Software utilizado para el análisis estadístico de los datos.

RESULTADOS

- Tipo de estudio realizado.


- Conformación y tamaño de la/s muestra/s, descripción sociodemográfica si corresponde.
- Incluye los resultados de los análisis estadísticos en forma tabular, gráfica, numérica, probabilidades,
etc.

CONCLUSIONES

- Interpretación de los resultados estadísticos en términos de las hipótesis planteadas.


- Recomendaciones.
- Limitaciones de la investigación y/o sus resultados.
- Nuevas líneas de investigación sugeridas.
EJEMPLO: Descripción de los conocimientos, actitudes, susceptibilidad y
autoeficacia frente al VIH/SIDA en un grupo de adolescentes colombianos1

INTRODUCCION. Durante los últimos años el número de personas infectadas por el VIH FENOMENO
/SIDA a nivel mundial, ha aumentado alarmantemente, específicamente se ha encontrado POBLACION OBJETIVO
que los adolescentes son unos de los grupos con mayor vulnerabilidad de adquirirlo por la
presencia de múltiples conductas de riesgo. Por esta razón, diversos profesionales de la
salud han encaminado sus esfuerzos en generar estrategias que permitan disminuir la tasa
de adolescentes infectados, interviniendo en el desarrollo de habilidades que le permitan al
adolescente hacer frente a las diversas situaciones psicosociales que enfrentan
continuamente en esta etapa.
De esta manera, la presente investigación tiene como objetivo describir los
conocimientos correctos y erróneos, las actitudes, la susceptibilidad y la autoeficacia OBJETIVOS/HIPÓTESIS
frente al VIH/ SIDA de un grupo de adolescentes colombianos. Asimismo, se pretende
establecer las diferencias en función de la edad, la escolaridad y el sexo de los
adolescentes evaluados.

METODOLOGIA. La investigación realizada es de tipo descriptivo, correlacional y


TIPO DE ESTUDIO
transversal.
La muestra estuvo conformada por 222 adolescentes, entre los 10 y 18 años,
UNID. DE ANALISIS
pertenecientes a dos instituciones públicas de la ciudad de Cali.
RECOPILACION DE
Para medir conocimientos, actitudes, susceptibilidad y autoeficacia frente al VIH/SIDA se
DATOS
utilizó la Adaptación Colombiana de la Escala de VIH/SIDA – 65 de Paniagua (1998),
realizada por Bermúdez, Buela-Casal y Uribe (2005), constituida por 65 ítems que
VARIABLES E
evalúan conocimiento correcto (20 ítems), ideas erróneas sobre prevención y
INSTRUMENTO
transmisión del VIH/SIDA (20 ítems), actitudes negativas hacia personas con SIDA (5
ítems), actitudes positivas sobre aspectos relacionados con el VIH/SIDA (5 ítems),
actitudes negativas hacia los preservativos (5 ítems), percepción de susceptibilidad para
la infección por el VIH (5 ítems) y percepción de autoeficacia en el uso del preservativo
(5 ítems) (*).
Para el análisis estadístico de datos se aplicaron resumen tabular y descriptivo de datos
METODOLOGIA
y la Prueba T para muestras independientes. Se fijó un nivel de significación de 0,05.
ESTADÍSTICA
Para el procesamiento de los datos se utilizó Infostat v.2009 (Universidad Nacional de
APLICADA
Córdoba, Argentina).

(*)Muestra de LA ESCALA DE VIH/SIDA-65 (Paniagua et al., 1994, 1997a, 1997b)


1ra Parte: conocimientos
Instrucciones: De los siguientes items unos son verdaderos y otros falsos. Lea cada item y rodee con un
círculo la letra que aparece a la izquierda de la respuesta que considere correcta.
1. Las prostitutas tienen riesgo de contraer el virus del SIDA
a) Verdadero b) Falso c) No lo sé
2. Vd. puede contraer el SIDA compartiendo jeringuillas con una persona adicta a las drogas y que tenga
la enfermedad.
a) Verdadero b) Falso c) No lo sé
2da Parte: Opiniones personales
Instrucciones: A través de los siguientes items Vd. podrá expresar sus opiniones sobre los diferentes
aspectos del VIH/SIDA.
91. Vd. puede pedirle a su compañero sexual que utilice el preservativo.
a) De acuerdo b) No estoy de acuerdo c) No lo sé/No puedo responder
94. Me negaría a sentarme junto a una persona con SIDA.
a) De acuerdo b) No estoy de acuerdo c) No lo sé/No puedo responder

1
Recreado a partir del artículo publicado en:
http://portales.puj.edu.co/psicorevista/components/com_joomlib/ebooks/PS12-2.pdf

4
RESULTADOS. La muestra se conformó por 222 adolescentes (55,4% mujeres) de TAMAÑO DE MUESTRA
entre 10 y 18 años, con una edad promedio de 14,1 años y una desviación típica de 1,9 FREC. RELATIVA
años. MINIMO-MÁXIMO
TABLA 1. Características Sociodemográficas de la muestra PROMEDIO, D.E.
Frecuencia %
Edad 10 a 12 años 50 22,5 TABLAS DE
13 a 15 años 115 51,8 FRECUENCIAS
16 a 18 años 57 25,7
Sexo Mujeres 123 55,4
Hombres 99 44,6

La tabla 2 incluye un estudio descriptivo de las subescalas de la Escala VIH/SIDA-65.

TABLA 2. Resumen descriptivo de los conocimientos y actitudes frente a la infección por


el VIH/SIDA
Subescala Mínimo Máximo Media D.E. CV
Conocim correcto 21 56 32,9 6,9 21,0%
Conocim erróneo 22 60 44,4 6,34 14,3% RESUMEN
Actitud positiva 5 15 9,6 2,7 28,1% DESCRIPTIVO
Actitud negativa 5 15 10,1 2,3 22,8%
Actitud neutra 5 15 10,6 2,4 22,6%
Susceptibilidad 5 15 10,2 2,1 20,6%
Autoeficacia 5 15 8,5 2,5 29,4%

Se puede observar que la mayor puntuación media corresponde a la subescala de


conocimiento erróneo, que por otra parte resulta con una distribución de puntuaciones
más homogénea. Puede decirse entonces que, en general, en los adolescentes aún INTERPRETACIÓN
persisten conceptos errados que podrían interferir en sus comportamientos frente a la
sexualidad.

La tabla 3 resume los resultados de las pruebas de comparación de promedios de las


subescalas en función del sexo. En la única subescala en que se evidencia una
diferencia significativa es en actitud neutra con una mayor tendencia en el grupo de las
mujeres, es decir que logran mayor asertividad ante las personas diagnosticadas.

TABLA 3: Comparación de las medias de las subescalas según el sexo. Se muestran


promedios y D.E.
Subescala Hombres Mujeres p RESULTADO DE LA
Conocim correcto 32 (7,4) 33,5 (6,5) 0,14 PRUEBA T
Conocim erróneo 43,9 (6,7) 44,9 (6,1) 0,29 (COMPARACIÓN DE
Actitud positiva 9,9 (2,7) 9,4 (2,7) 0,10 PROMEDIOS PARA DOS
Actitud negativa 10 (2,3) 10,1 (2,2) 0,84 MUESTRAS
Actitud neutra 10,1 (2,7) 10,9 (2,1) 0,02*
INDEPENDIENTES)
Susceptibilidad 10,3 (2,4) 10 (1,9) 0,39
Autoeficacia 8,6 (2,8) 8,4 (2,3) 0,64
* Significativo a un nivel de significación de 0,05

5
RECOPILACION DE DATOS
Las formas básicas de recopilación de datos son a través de:
 Censos, cuando se observa el conjunto completo de unidades de análisis.
 Muestreos / Experimentación, cuando se observa un subconjunto de unidades de análisis
 Para que las muestras sean representativas de la población deberá realizarse previamente un detallado
plan de muestreo.
 Para que los datos generados en un experimento sean de utilidad se deberá definir previamente y en
forma detallada el diseño experimental.

TIPOS DE INVESTIGACION

Según sean recopilados los datos Observacional – experimental


Según el objetivo del estudio Exploratorio - confirmatorio
Según el número de variables Univariado – bi o multivariado
Según el momento de recopilación Transversal - longitudinal
Según el alcance de las conclusiones Descriptivo – inferencial
También pueden ser correlacionales.
Puede ampliar el tema con el texto publicado en http://www.dre-learning.com.mx/mdli/parte_4.htm

VARIABLES Y ESCALAS DE MEDICIÓN

Cualquier característica observable sobre las unidades de análisis se denomina variable o dicho de otro modo,
es una propiedad que puede variar (tomar diversos valores) y cuya variación es susceptible de medirse.
Las variables pueden clasificarse en:
 Cualitativa o categórica: no toman valores numéricos.
 Cuantitativa o métrica: toman valores numéricos. Se subclasifican en discretas o continuas según
puedan particionarse o no dentro de un intervalo.
Los niveles de medición de las variables son:
 Nominal: los números sólo representan las categorías de las variables, su función es distinguir entre
distintos valores.
 Ordinal: además de distinguir entre diferentes valores, establecen un orden entre ellos. Este orden no
implica magnitud.
 Escalar: además de distinción y orden, la distancia entre dos valores consecutivos cualesquiera es
siempre la misma. Pueden ser de intervalo o de razón. En la escala de intervalo el cero es arbitrario, en
cambio en la escala de razón el cero es absoluto.
De acuerdo al tipo de variable y su escala de medición se aplican distintos recursos estadísticos para su análisis.

6
La variable de interés se denomina variable dependiente y en la mayoría de investigaciones se trata de conocer
cómo ésta se comporta en función de otra variable denominada independiente o factor o también variable de
clasificación. Puede tanto ser categórica como cuantitativa. Los valores o categorías que toma la variable
independiente se denominan niveles.
LETURAS RECOMENDADAS DE PROFUNDIZACION:
http://personal.ua.es/es/francisco-frances/materiales/tema3/operacionalizacin_dimensiones_indicadores_y_variables.html
y páginas subsiguientes

PRACTICA PROPUESTA

1- A continuación enunciamos diversos temas de investigación. Su misión es determinar qué tipo/s de estudio/s
debería/n realizarse y la forma de recopilación de datos.

a- Un investigador se propone probar si mayores niveles de dosis de cierto medicamento suministrado a


pacientes que sufren depresión leve tienen un efecto inmediato negativo sobre la presión arterial en
hombres de entre 60 y 70 años. Para cada uno de sus pacientes registrará la cantidad de miligramos en que
aumenta la dosis del medicamento y la presión arterial a las 24 hs.

b- La encuesta permanente de hogares que el INDEC regularmente lleva a cabo relevando información sobre
nivel de empleo de alrededor de 10.000 familias urbanas y rurales.

c- Las encuestas de opinión que se proponen diariamente en la página web del diario Clarín.

d- Una investigación llevada a cabo por la Universidad Austral analizó hábitos, valores y prioridades a la hora
de buscar un equilibrio entre la vida personal y laboral de ejecutivos de los dos sexos. Alcanzó a 182
directivos y gerentes de empresas y se realizó entre noviembre de 2005 y enero del 2006.

e- Un psicólogo se propone probar si un cierto entrenamiento en técnicas de autocontrol y relajación mejora la


capacidad de atención de estudiantes universitarios. Planea medir la capacidad de atención de los
estudiantes de un curso luego realizará el entrenamiento durante 8 semanas y finalmente volverá a medir la
capacidad de atención de cada participante.

2- En esta actividad su misión consiste en clasificar cada una de las variables que se listan e indicar su unidad
de medida, qué valores toma la variable y en qué escala se presenta.
a- Tiempo (en segundos) de reacción frente a un imprevisto.
b- Número de materias recursadas por alumnos del último año de psicología.
c- Máximo nivel educativo materno.
d- Actitud (positiva – negativa) hacia el último aumento de tarifas del servicio de gas.
e- Nivel de ansiedad medido con cierto inventario que puntúa entre 20 y 50.

3- A continuación presentamos una breve introducción de investigaciones seleccionadas. Su tarea es identificar


el fenómeno de interés; población objetivo, marco muestral, unidad de análisis; forma de recopilación de datos,
cantidad de observaciones, indicador o variable dependiente, clasificación y escala, variable/s independientes o
factor/es y sus niveles, instrumento de medición, tipo de investigación
3.1- El incremento en el número de trasplantes de órganos ha permitido identificar algunas repercusiones
psicológicas asociadas a los mismos como es el caso de la salud mental de los familiares de trasplantados.

7
Con el objetivo de estudiar cómo afecta la duración de la internación (“corta” = menos de 12 días o “larga” = 12
días o más) a la salud mental de los familiares se llevó a cabo una investigación en el Hospital Universitario
Virgen del Rocío de Sevilla, España, en la que se midió la sintomatología ansiosa y depresiva de 148 familiares
de trasplantados en los últimos 6 meses. Para ello se aplicaron las Escalas de Ansiedad y Depresión de Leeds
(Snaith, Bridge y Hamilton, 1976).
Ambas escalas toman valores numéricos y se interpreta que mayores valores son indicadores de mayor
ansiedad o depresión respectivamente.

3.2- Conforme el tratamiento farmacológico de pacientes esquizofrénicos mejora día a día y se reconocen las
bases biológicas de la esquizofrenia, va aumentando el interés en los factores psicosociales que participan,
sobre todo en aquéllos que influyen en los distintos enfoques terapéuticos, incluyendo la psicoterapia.
Con el objetivo de analizar la importancia de la crianza en la evolución de pacientes con esquizofrenia se llevó a
cabo una investigación en la que participaron 23 esquizofrénicos y un grupo control de 50 sujetos mentalmente
sanos con características similares en variables como sexo, edad, nivel educativo y socioeconómico.
En todos los casos se administró el Inventario de Evaluación del Vínculo Parental que evalúa entre otras cosas
la distancia y frialdad emocional percibida por el sujeto respecto del padre y de la madre. Puede tomar valores
entre 0 y 3 y se interpreta que valores mayores indican mayor distancia o mayor frialdad emocional percibidas.

3.3- En 1936, Selyer describió como estrés el conjunto de cambios orgánicos que se producen como respuesta
del organismo a una gran variedad de estímulos nocivos. A los estímulos o agentes nocivos, Selyer los definió
como estresantes, y pueden ser de naturaleza orgánica, psicológica o social.
Se realizó una investigación con el objetivo de observar si los exámenes orales son estresantes. Para ello se
tomó la presión arterial de estudiantes en dos situaciones diferentes: durante el desarrollo de un trabajo práctico
(situación común para el estudiante) y momentos previos a rendir un examen final en forma oral.
Participaron de la experiencia una muestra de alumnos de segundo año de la Facultad de Odontología de la
Universidad Nacional de Tucumán que cursaban la materia Fisiología, cuyas edades oscilaban entre 18 y 32
años, sin antecedentes hereditarios de hipertensión arterial. También se registró la nota (de 0 a 10) que
obtuvieron en el examen de tipo múltiple choice.

3.4- La tolerancia es una dimensión que pertenece a la categoría de las actitudes y puede definirse como una
actitud de respeto a la libertad de los demás y sus formas de pensar y actuar. Con el objetivo de investigar en
qué medida la edad y el género intervienen en el nivel de actitud tolerante de los adolescentes se llevó a cabo
una encuesta a adolescentes porteños. El nivel de tolerancia se determinó a través de la adaptación del “Test de
tolerancia” de la A.C.P.P. que puntúa en una escala de 0 a 100 y se interpreta que valores mayores indican
actitud más tolerante.

3.5- COMPARACION DE LAS REACCIONES DE ESTRÉS POST-TRAUMÁTICO EN NIÑOS TURCOS


EXPUESTOS Y NO EXPUESTOS A TERREMOTO2
Desafortunadamente, Turquía se encuentra en una zona propensa a terremotos; por consiguiente, los niños
turcos tienen riesgo de desarrollar trastornos de estrés post-traumático (TEPT) causado por la exposición a
terremotos, tanto en la amenaza anticipada de terremoto como en sus réplicas.
Se llevó a cabo un estudio con el objetivo de identificar las reacciones de TEPT al desastre de niños turcos
expuestos y no expuestos al gran terremoto de 1999 en las dos ciudades turcas de Sakarya (epicentro del
terremoto) y Edurne (no afectada por el terremoto). Los datos de ambos grupos, control y trauma, fueron
recogidos once meses después de producido el terremoto. Participaron 400 alumnos de 4to y 5to grado, 200 de
cada ciudad. Se utilizó el OSU-Child PTSD Inventory para evaluar los síntomas TEPT. Este instrumento consta
de 31 ítems en escala Likert con opciones de respuesta de 0 a 4 y la puntuación global se obtiene a través de la
suma. Luego se clasificó a los sujetos según estuvieran afectados por PEPT en las categorías débil, moderado,
severo y muy severo.

2
Fuente: http://www.um.es/analesps/v22/v22_1/04-22_1.pdf

8
3.6- EFECTO ANSIOLÍTICO DEL MASAJE CON AROMATERAPIA EN PACIENTES CON CANCER DE MAMA3
La aromaterapia es uno de los tratamientos utilizados por la Medicina alternativa y complementaria para tratar
diferentes enfermedades y síntomas, debido a que los aceites esenciales tienen muchos tipos de efectos
farmacológicos entre los que se encuentran un efecto antibiótico, sedativo, analgésico y espasmolítico.
Se realizó un ensayo con el objetivo de estudiar las propiedades del masaje con aromaterapia para modificar
ciertos parámetros psicológicos e inmunológicos en una muestra de 15 pacientes con cáncer de mama que
habían sido tratados con cirugía o quimioterapia, de entre 45 y 58 años. Se procedió a evaluar el nivel de
ansiedad de los pacientes un mes antes del tratamiento y cuando finalizó. Se utilizó el inventario de ansiedad
(STAI) que puntúa de 0 a 18 y se interpreta que valores mayores se relacionan con mayor grado de ansiedad.
Los pacientes recibieron un masaje con aromaterapia de 30 minutos, dos veces a la semana durante 4 semanas
con una combinación de aceites de jojoba, naranja dulce, lavanda y sándalo.

3.7- TOLERANCIA Y ADOLESCENCIA. EDAD, GÉNERO Y NACIONALIDAD: ANÁLISIS COMPARATIVO4


INTRODUCCION. La tolerancia es una dimensión que pertenece a la categoría de las actitudes y puede
definirse como una actitud de respeto a la libertad de los demás y sus formas de pensar y actuar.
Con el objetivo de investigar en qué medida la edad, el género y la nacionalidad intervienen en el nivel de actitud
tolerante de los adolescentes se llevó a cabo la presente investigación.

METODOLOGIA. En la primavera de 2004 se llevó a cabo una encuesta a 204 estudiantes de secundaria del
instituto IES de la ciudad de Madrid, España, seleccionados mediante muestreo no probabilístico.
Se registró información sociodemográfica como la edad, género y nacionalidad.
El nivel de tolerancia se determinó a través de la adaptación del “Test de tolerancia” de la A.C.P.P. que consta
de 10 ítems. Cada ítem enuncia una situación a partir de la que el encuestado debe elegir una de las tres
opciones de respuesta valorizadas con 0, 5 y 10 respectivamente. La puntuación final se define por la suma
tomando valores entre 0 y 100.

4- A continuación se transcribe parte del instrumento utilizado en la investigación citada en el ítem 3.7 –
TOLERANCIA Y ADOLESCENCIA. EDAD, GÉNERO Y NACIONALIDAD: ANÁLISIS COMPARATIVO
El cuadriculado que sigue recrea una planilla de cálculo, en ella diseñe la base de datos para el procesamiento
de los cuestionarios de encuesta

TEST DE TOLERANCIA

A continuación vas a encontrar una serie de situaciones que podrían suceder en tu vida.
Cada situación tiene tres opciones diferentes y se trata de que elijas la que más se ajuste a lo que tú piensas, sientes o
harías. Para ello marca con una cruz en el recuadro que hay a la izquierda de las opciones.
Recuerda que el cuestionario es anónimo y, por tanto, puedes ser completamente sincero

1- Vas a tomar el autobús y te encuentras con que el conductor es una chica ¿qué haces?

3
Fuente: http://www.e-digitalis.com/pdf/Digitalis_n27_CAM_aromaterapia.pdf

4 El caso se recreo con base en el artículo publicado en https://4056512689758863468-a-1802744773732722657-s-


sites.googlegroups.com/site/plandeacciontutorial2009/home/accin-tutorial-contra-la-
intolerancia/cuestionarioadaptadoacpptolerancia.pdf?attachauth=ANoY7colBLUYcBag1cD_7mlm6yryCRoJTY_jUf6zF9_le5RynCxSJCbJC
kpAkd-8SkI1PiQ_khthQogkBZHqc_EumGI--qItpB_BwsW65XFpSgrHrNpreUDj1fwiw6n4qN3xfvCM4_HJlQo-
_0trEpSCOOiP3_dEK8SCkJ8CKM8oxAw8dOYS-7I5wKbvSqQ3Voob3WmM4rDLjKPSRij2Z3KOU7zocG7TKWaEmp3J8-
wJWf9VOT4iRi6iOqBtQBinZqXcTDwgExJM6x_O1kNrRDbyKBXAQX0GXh4i9xalz1LXTX3dC9oZ8J2S0lovA3QRaVh1PRPzY66S&attredire
cts=1

9
a. Ni se me ocurre tomar el autobús, seguro que tenemos un accidente
b. Supongo que lo tomaría, no lo tengo muy claro
c. Subo al autobús sin pensarlo, seguro que conduce muy bien

2- Paseas por tu ciudad y ves que unos vecinos del barrio están pegando a un ladrón ¿qué haces?
a. Me uno a los atacantes, hay que dar una lección a los que roban
b. Sigo andando, no va conmigo
c. Aviso a la policía

3- Durante una excursión una compañera minusválida no puede entrar en un restaurante porque no hay
acceso para la silla de ruedas ¿qué haces?
a. Peor para la compañera. Yo entro en el restaurante
b. Yo no entro tampoco
c. Entro y busco a alguien para hacer llegar una queja o protesta

4- Tu primo te cuenta un chiste insultante sobre negros en una fiesta de cumpleaños ¿qué haces?
a. Me río, no me parece mal
b. Salgo de la habitación para buscar una bebida
c. Le hago ver que su chiste es ofensivo

5- Acudes a la piscina para aprender a nadar y observas que el guardavidas es gitano ¿qué haces?
a. Pido que me cambien a otro grupo con distinto guardavidas
b. No lo sé, me siento confuso
c. Me da igual, seguiré contada normalidad

……

¿Cuántos años tienes? _______


¿Cuál es tu sexo? ____ 1- Mujer ____ 2- Hombre
¿Dónde has nacido? ____ 1- En España ____ 2- En otro país que no es España

10
PROCESOS EN EL INFOSTAT: OPERACIONES SOBRE VARIABLES
5- Los siguientes datos corresponden a las calificaciones de la evaluación práctica y teórica en cierta materia de
un grupo de alumnos universitarios:

ALUMNO Nota_Práctico Nota_Teórico


1 4 6
2 6 6
3 7 8
4 2 4
5 10 8
6 6 7
7 7 6
8 2 2
9 8 9
10 5 6

1- Cargue la base de datos en el Infostat:


Archivo/Nueva tabla
Datos/Acciones sobre columnas/Insertar columna
2- Generar la variable “Nota_Final” como promedio de las calificaciones:
Datos/Transformar
Seleccione las variables/Aceptar
Tilde la opción “Media”/Aceptar
Cambie el nombre de la nueva variable por “Nota_Final”
3- Categorización de las notas finales según el siguiente criterio: “Desaprobado” si la nota final es menor
a 4; “Satisfactorio” si la nota está entre 4 y menos de 7; “Sobresaliente” si la nota es 7 o más.
Seleccionar la columna de la variable “Nota_Final”
Datos/Acciones sobre columnas/Categorizar/Asignar categorías por intervalos/Personalizar
Clases = 3; LS1 = 3,999; LS2 = 6,999 / Aplicar
Sobrescribir C1 = Desaprobado/enter
C2 = Satisfactorio/enter
C3 = Sobresaliente/Aceptar/Aceptar

6- Se realizó una encuesta a una muestra de alumnos para determinar el grado de satisfacción con el servicio de
biblioteca de la universidad. Se utilizó una escala Likert. El cuestionario fue el siguiente:

11
ID _________
Indique su grado de acuerdo con las siguientes frases marcando con una cruz la opción que más se ajuste a
opinión:
0-Muy en 1-Algo en 2-Ni acuerdo 3-Algo de 4-Muy de
desacuerdo desacuerdo ni acuerdo acuerdo
desacuerdo
1- La atención del personal es cordial
2-La bibliografía es fácilmente
accesible
3-Las instalaciones son confortables

Con los datos recopilados se procesó la siguiente base de datos:

ID ATENCION ACCESIBILIDAD INSTALACIONES


1 3 2 4
2 3 3 4
3 4 2 4
4 3 2 3
5 4 3 4
6 4 2 3
7 3 3 3

1- Cargue la base de datos en el Infostat:


Seleccione la Archivo/Nueva tabla
Datos/Acciones sobre columnas/Insertar columna
2- Generar la variable “Grado de satisfacción” como suma de las puntuaciones:
Datos/Transformar
Seleccione las variables/Aceptar
Tilde la opción “Suma”/Aceptar
Cambie el nombre de la nueva variable por “Satisfacción”

12
PRÁCTICO 2: PRESENTACIÓN GRÁFICA Y TABULAR DE DATOS

La presentación gráfica de datos propicia una lectura rápida, aunque en ocasiones puede resultar tergiversada o
imprecisa según la calidad del gráfico. Son de uso frecuente en las publicaciones periodísticas y científicas
gráficos circulares, de líneas simple o compuesto, de barras horizontales y verticales -simple o compuesto,
agrupadas o segmentadas-, ideogramas y pictogramas, entre otros. La selección de uno u otro tipo de gráfico
depende del tipo de datos y el número de series a representar. Deben contener titulo principal, identificación de
las variables en los ejes y unidad de medida, fuente de datos y referencias si corresponde.
La presentación tabular de datos es más precisa y detallada que un gráfico. Pueden construirse tablas de una y
dos entradas y en todos los casos deben contener titulo principal, título de columnas y filas, fuente de datos. Un
tipo especial de tabla utilizado para análisis estadístico de datos son las llamadas distribuciones de frecuencias
en las que se relacionan los valores de alguna variable con el número de veces que fue observado “frecuencia
absoluta” (FA) y/o con el porcentaje de veces que fue observado la “frecuencia relativa” (FR). Estas frecuencias
pueden acumularse hasta un valor de la variable (FAA; FRA) o bien desde un valor de la variable (G; GR). Las
distribuciones de frecuencias absolutas y relativas pueden representarse gráficamente mediante el gráfico de
bastones si la variable es discreta o bien con histograma si la variable se presenta agrupada en intervalos de
clase.
PRACTICA PROPUESTA

1- La siguiente tabla muestra la distribución de alumnos matriculados en una universidad privada, por carrera y
facultad. Complete la tabla con la información faltante, represente gráficamente e interprete el renglón resaltado.
FACULTAD CARRERA ALUMNOS % DE ALUMNOS POR % DE ALUMNOS
MATRICULADOS CARRERA POR FACULTAD
CIENCIAS SOCIALES Psicología 1850
16,41%
Sociología 910 24,48%
8,07%
CS. ECONOMICAS Contador 2370
21,02%
Marketing 2505
22,22%
Administración 3640 …………%
…………%
TOTAL 11275 100%

2- Del trabajo Análisis neo-bibliométrico de las investigaciones de tesis en la escuela académico-profesional de


psicología UNMSM5 extrajimos dos gráficos.
a) Construya las tablas que dieron origen a los gráficos.
b) Interprete la información del año 2003 del gráfico 1.
c) Según el gráfico 4, ¿cuáles son las áreas temáticas más y menos estudiadas? Justifique su respuesta
numéricamente.

5
Fuente: http://pepsic.bvs-psi.org.br/scielo.php?script=sci_arttext&pid=S1609-
74752006000100006&lng=pt&nrm=iso

13
3- En el año 2008 la facultad de ingeniería de la Universidad de Palermo llevó a cabo una encuesta orientada a
indagar acerca del grado de satisfacción de los vecinos de la Ciudad Autónoma de Buenos Aires y del Gran
Buenos Aires con respecto al servicio actual de recolección de residuos, la actitud en relación a la clasificación
domiciliaria y el grado de conocimiento de los distintos mecanismos de tratamiento y disposición final de
residuos.
Los resultados referidos a distintos aspectos del servicio de recolección domiciliaria en la CABA se ilustran el
siguiente gráfico.
100%
% Respuestas

80%

60%

40%

20%

0%
HORARIO DE

ACTITUD DEL

VOLUMINOSOS
HIGIENE VIA

RECLAMOS
PERSONAL
SERVICIO

PUBLICA

OBJETOS
RETIRO

Muy disconforme Algo disconforme Algo conforme Muy conforme

Por su parte, la figura de la derecha No clasifica


85% Dispuesto a
ilustra tanto la disposición actual como Clasifica
clasificar en el
actualmente
la futura disposición a la clasificación 16%
futuro

de residuos domiciliarios. 73%

No clasificará
10%

Redacte un párrafo que resuma los principales aspectos que pueden deducirse a partir de los gráficos.

4- Con el objetivo de estudiar la incidencia del tabaquismo en su curso se procederá a realizar un censo entre los
alumnos presentes. El cuestionario es el siguiente:
ID: __________ SEXO: _____ Femenino ______ Masculino
¿Usted fuma habitualmente? ___ SI ___ NO

a) A medida que se vayan recopilando los datos complete la base de datos que sigue:

14
ID SEXO FUMA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
b) Realizando los conteos necesarios se espera completar las siguientes tablas de frecuencias:

SEXO CANTIDAD % RTAS FUMADOR CANTIDAD % RTAS


RESPUESTAS RESPUESTAS
Femenino NO
Masculino SI

SEXO
FUMADOR FEMENINO MASCULINO
SI
NO

PROCESOS EN EL INFOSTAT
1- Cargue la base de datos en el Infostat:
Archivo/Nueva tabla
Datos/Acciones sobre columnas/Insertar columna
2- Procese las tablas de frecuencias para las variables “Sexo” y “Fumador”:
Estadísticas/Tablas de frecuencias
3- Genere un gráfico que ilustre la distribución de fumadores:
Gráficos/Gráfico de sectores/categorías en filas
4- Genere la tabla de doble entrada que relacione las variables “Sexo” y “Fumador”:
Estadísticas/Datos categorizados/Tabla de contingencia
Seleccione las variables o criterios de clasificación/Aceptar
Seleccione “Sexo” para las columnas y “Fumador” para las filas
En la solapa Opciones tilde las 4 primeras/Aceptar

15
c) Observando las tablas y responda las siguientes preguntas:
c.1- ¿Cuántos individuos participaron de la encuesta?
c.2- ¿Cuántas mujeres participaron? ¿Qué porcentaje representan?
c.3- ¿Cuántos fumadores hay en el grupo? ¿Qué porcentaje representan?
c.4- ¿Cuántas mujeres fumadoras hay en el grupo? ¿Qué porcentaje representan?
c.5- En el grupo de los hombres ¿cuántos no fumadores hay? ¿Qué porcentaje representan? Compare
con el grupo de mujeres y saque conclusiones.

5- En una empresa petrolera se llevó a cabo un estudio sobre satisfacción laboral a través de encuestas a los
empleados. Una de las preguntas fue la siguiente:
“Califique la fluidez de las comunicaciones con su superior (muy insatisfactoria; insatisfactoria; normal;
satisfactoria; muy satisfactoria).
Procesadas las encuestas se agruparon las respuestas en las siguientes tablas de frecuencias:
Sector:
ADMINISTRACIÓN Sector: TECNICO
X FA FR FAA FRA X FA FR FAA FRA
Muy insatisfactoria 1 0,01 1 0,01 Muy insatisfactoria 21 0,44 21 0,44
Insatisfactoria 6 0,08 7 0,1 Insatisfactoria 18 0,38 39 0,81
Normal 24 0,33 31 0,43 Normal 4 0,08 43 0,9
Satisfactoria 24 0,33 55 0,76 Satisfactoria 4 0,08 47 0,98
Muy satisfactoria 17 0,24 72 1 Muy satisfactoria 1 0,02 48 1
TOTAL 72 0,99 48 1
Referencias:
X: valores de la variable FA: frecuencia absoluta FR: frecuencia relativa
FAA: Frecuencia absoluta acumulada FRA: Frecuencia relativa acumulada

a- ¿Cuál es la variable en estudio? ¿Qué valores toma? Clasifíquela e indique su escala de medición.
b- Usted es el encargado de completar el informe ejecutivo: por favor complételo
“En la encuesta sobre satisfacción laboral participaron ………. empleados, ………. Técnicos y ……….
Administrativos.
El ……..% de los técnicos perciben como muy satisfactoria la fluidez en las comunicaciones con sus superiores,
en tanto el ………….% de los administrativos tienen el mismo nivel de percepción.
Las tasas de empleados que están algo o muy insatisfechos con las comunicaciones con sus superiores son de
…….% entre el personal técnico y ………% para los administrativos.
Se concluye entonces que resultaría recomendable implementar acciones a fin de mejorar las comunicaciones
entre el personal ………………………………. y el nivel jerárquico de la compañía.”

6- En una escuela primaria la maestra de lengua de las dos divisiones de 3er grado organizó una actividad con el
objetivo de analizar los errores ortográficos que cometen los alumnos durante el dictado de un texto. La maestra
contó el número de errores que cometió cada alumno y construyó las siguientes tablas:

16
División A División B
X FA FR FAA FRA X FA FR FAA FRA
0 2 0,09 2 0,09 1 3 0,11 3 0,11
1 2 0,09 4 0,18 2 4 0,15 7 0,26
2 5 0,22 9 0,40 3 5 0,18 12 0,44
3 6 0,26 15 0,66 4 7 0,26 19 0,70
4 7 0,3 22 0,96 5 4 0,15 23 0,85
5 1 0,04 23 1 6 4 0,15 27 1

a) Identifique la variable observada y clasifíquela. También identifique la unidad de análisis.


b)Observando las tablas responda las siguientes preguntas:
b.1- ¿Cuántos alumnos fueron evaluados en cada grado?
b.2- En la división A ¿cuántos alumnos no cometieron errores? ¿y en la otra división?
b.3- ¿Cuántos alumnos cometieron sólo un error en cada división? ¿Qué porcentaje representan?
b.4- ¿Cuántos alumnos cometieron al menos 4 errores en cada división? ¿Qué porcentaje representan?
b.5- Si se considera aceptable que un alumno de 3er grado cometa a lo sumo 2 errores ¿en qué división
se observó el mejor rendimiento?

7- Se realizó un ensayo con el objetivo de analizar el tiempo de reacción frente a un imprevisto (en segundos) de
choferes de transportes de larga distancia. Los datos recopilados se incluyen más abajo.
a) Identifique la variable y clasifíquela.
b) Procese la tabla de frecuencias según el instructivo.
c) Observando la tabla de frecuencias responda las siguientes preguntas: BASE DE DATOS
c.1- Realice la lectura del penúltimo renglón de la tabla. ID Variable
c.2- ¿Cuántas observaciones se realizaron? 1 2,78
2 2,22
c.3- ¿Cuántos sujetos reaccionaron en menos de 2 segundos? 3 2,25
c.4- ¿Qué porcentaje de sujetos tardó más de 1,5 segundos en 4 2,04
reaccionar? 5 2,36
6 2,14
c.5- ¿Cuántos y qué porcentaje de sujetos tardaron entre 1 y 2 7 2,17
segundos en reaccionar? 8 1,44
9 2,25
10 1,04
PROCESOS EN EL INFOSTAT 11 2,39
12 1,63
1- Cargue la base de datos en el Infostat: 13 2,56
Archivo/Nueva tabla 14 1,99
15 2,38
2- Procese la tabla de frecuencias para la variable 16 1,07
Estadísticas/Tabla de frecuencias 17 1,23
18 3,07
Seleccione la variable/Aceptar 19 2,61
Tilde las opciones FAA y FRA 20 0,72
21 2,54
Tilde “personalizado” y modifique el límite inferior = 22 2,24
0,5; el límite superior = 3,5; aumente el número de intervalos 23 1,82
24 0,99
a 6/Aceptar.

17
25 1,72
26 2,72
27 2,85
28 1,87
29 1,66
30 2,35

8- En un laboratorio de especialidades medicinales están comparando la efectividad de dos medicamentos A y


B. Para ello trataron a dos grupos de pacientes con síntomas similares con una dosis de uno de los
medicamentos y registraron el tiempo (en horas) que transcurrió hasta que los síntomas desaparecieron. Los
datos tabulados son los siguientes:
MEDICAMENTO A MEDICAMENTO B

LI LS MC FA FR FAA FRA LI LS MC FA FR FAA FRA


3 - 3,5 3,25 4 0,19 4 0,19 1 - 1,5 1,25 1 0,03 1 0,03
3,5 -4 3,75 7 0,33 11 0,52 1,5 -2 1,75 3 0,08 4 0,1
4 - 4,5 4,25 6 0,29 17 0,81 2 - 2,5 2,25 7 0,18 11 0,28
4,5 -5 4,75 3 0,14 20 0,95 2,5 -3 2,75 9 0,23 20 0,51
5 - 5,5 5,25 1 0,05 21 1 3 - 3,5 3,25 8 0,21 28 0,72
3,5 -4 3,75 3 0,08 31 0,79
4 - 4,5 4,25 6 0,15 37 0,95
4,5 -5 4,75 2 0,05 39 1

Esperamos que usted de respuestas a las siguientes preguntas justificando numéricamente en cada caso:
a) Identifique la variable en estudio. Clasifíquela y determine cuál es la escala de medición.
b) ¿cuántos pacientes fueron tratados en cada grupo?
c) Si los especialistas consideran prometedor que un medicamento actúe en menos de 3 horas ¿cuál de los
medicamentos parece más efectivo?
d) ¿Qué porcentaje de pacientes en cada grupo demoró en recuperarse al menos 4 horas?
e) ¿Qué representación gráfica sería apropiada para ilustrar las distribuciones de frecuencias?

9- Como parte de un estudio descriptivo, exploratorio y transversal sobre personalidad, salud y estrés en
estudiantes de secundaria noruegos se distribuyó un cuestionario a 1162 estudiantes. El cuestionario relevó
datos sociodemográficos como la zona de residencia (urbana-rural) y el sexo (femenino-masculino) e incluía
además una versión reducida del cuestionario sobre Sentido del Humor (Sense of Humor Questionnaire, SHQ-6)
que puntúa entre 6 y 24 y se interpreta sujetos con más sentido del humor cuanto más alto el puntaje. A
continuación se muestran parte de los resultados obtenidos para su análisis.
Tabla 1 Gráfico 1
Puntaje SHQ6 frec. Abs. Frec. Relat
Distribución de los puntajes del SHQ6
6–8 64 5,5%
8 – 10 77 6,6%
25,0%
10 -12 99 8,5%
% encuestados

20,0%
12 – 14 89 7,7% 15,0%
14 – 16 94 8,1% 10,0%
16 – 18 197 17,0% 5,0%
18 – 20 248 21,3% 0,0%
20 – 22 199 17,1% 8 10 12 14 16 18 20 22 24
22 – 24 95 8,2%

18
a) Explique porqué se considera al presente estudio “descriptivo”, “exploratorio” y “transversal”.
b) Identifique y clasifique todas las variables observadas mencionadas en el párrafo ntroductoria.
c) ¿Cuántos sujetos puntuaron como máximo 14 en el SHQ-6? ¿Qué porcentaje representan?
d) ¿Cuántos y qué porcentaje de sujetos puntuaron al menos 20? ¿Son los que tienen más o menos sentido
del humor?
e) Identifique en el gráfico la información del tercer intervalo.
f) ¿Diría usted que en general los estudiantes noruegos tienden a tener poco o mucho sentido del humor?

10- Como producto de una encuesta a un grupo de adolescentes a los que se les pidió que indicaran a su juicio
el grado de rigidez de la disciplina materna según la escala R= rígida; JT= justamente tolerante; MT= muy
tolerante, se obtuvo la siguiente tabla de contingencia:
a) ¿Cuántos adolescentes fueron encuestados por sexo? Frecuencias absolutas
¿cuál es el tamaño de la muestra? En columnas: Rigidez
b) ¿En cuál de los grupos de adolescentes (muchachos o Sexo R JT MT TOTAL
muchachas) perciben más rígida la disciplina materna? Muchachas 140 170 80 390
Muchachos 93 160 135 388
c) Entre los que perciben como justa la disciplina materna
Total 233 330 215 778
¿hay un mayor porcentaje de muchachos o muchachas?
d) ¿Qué porcentaje de encuestados son muchachas y juzgan
muy tolerante la disciplina materna?

11- La siguiente tabla de contingencia fue elaborada con base en la información relativa al número de pacientes
atendidos en los últimos 5 años en un centro especializado en tratamiento de trastornos de ansiedad.
Los tipos de trastornos observados en los pacientes se codificaron y la tabla de contingencia que muestra la
distribución de los trastornos por sexo son los siguientes:
Frecuencias absolutas Referencias:
TRASTORNO CODIFICADO P.A. = pánico con agorafobia
SEXO P.A. A.S. A.G. O.C. Total A.S. = ansiedad social
Hombre 291 340 196 99 926 A.G. = ansiedad generalizada
Mujer 686 510 214 121 1531 O.C. = obsesivo compulsivo
Total 977 850 410 220 2457

Responda las siguientes preguntas justificando numéricamente en cada caso:


a) ¿En la institución atendieron mayormente a hombres o a mujeres en los últimos cinco años?
b) ¿Qué tipo de trastorno de ansiedad fue más frecuentemente atendido en la institución?
c) ¿Qué trastorno prevaleció entre los hombres? ¿Es el mismo entre las mujeres?
d) Entre los sujetos tratados por ansiedad social ¿qué porcentaje de mujeres fueron atendidas?
e) ¿Qué porcentaje de hombres obsesivos compulsivos fueron atendidos en la institución?

12- Con el objetivo de identificar posibles diferencias en el nivel de riesgo suicida según la edad se realizaron
mediciones a adolescentes escolarizados de la ciudad de Buenos Aires. Se utilizó el Inventario de Ideaciones
Suicidas ISO-30. Las puntuaciones del inventario pueden variar entre 10 y 50 y se las categorizó en los niveles
bajo, moderado o alto obteniendo la siguiente tabla de contingencia:

19
RIESGO_SUICIDA
EDAD Alto Medio Bajo Total
15 años o más 3% 25% 34% 62%
Menos de 15 años 2% 18% 18% 38%
Total 4% 43% 52% 100%

a) ¿Qué porcentaje de adolescentes mostraron un bajo nivel de riesgo suicida?


b) ¿En qué grupo de edad hay un menor porcentaje de adolescentes con alto riesgo suicida?
c) En cada grupo de edad ¿Qué nivel de riesgo suicida prevalece?

20
PRÁCTICO 3: ANÁLISIS DESCRIPTIVO UNIVARIADO

Para realizar el análisis estadístico de una serie de datos contamos con una serie de medidas que describen
distintos aspectos, a saber:
 MEDIDAS DE TENDENCIA:
o Media Aritmética: es la suma de los valores de la variable dividida por el número de datos. La

fórmula de cálculo del promedio de una población de datos es:  


x i

N
o Mediana: es el valor de variable ubicado en la posición central de la serie ordenada.
o Modo: es el valor de la variable que se repite con mayor frecuencia.
 MEDIDAS DE POSICIÓN:
o Fractiles: son valores de la variable que dividen a la serie en grupos con igual cantidad de
observaciones. También puede definirse como el valor de la variable que acumula por debajo
un cierto porcentaje de datos.
 MEDIDAS DE DISPERSIÓN:
o Varianza: es la suma de los desvíos cuadráticos de cada valor de la variable respecto a la
media aritmética dividida por el número de datos. La fórmula de cálculo de la varianza de una

 x  
2

población de datos es:  


2 i

N
o Desvío estándar o típico: es la raíz cuadrada de la varianza. El cálculo del desvío de una

población de datos es:    2


o Coeficiente de variación: es el cociente entre el desvío estándar y la media, o en otras
palabras es el desvío estándar expresado como porcentaje de la media aritmética. Es un
número índice que determina la heterogeneidad de los datos y la representatividad de la media
aritmética. También permite comprar series de datos con diferentes unidades de medida. Su

cálculo consiste en: CV  *100

 MEDIDAS DE FORMA:
o Asimetría: es una de las características gráficas de una distribución que determina hacia qué
valores tienden a concentrarse los datos. En términos generales podrían distinguirse
distribuciones asimétricas positivas, asimétricas negativas y simétricas como se ilustra
seguidamente.

21
DISTRIBUCIÓN SIMÉTRICA

0,35

0,26
frecuencia relativa

0,17

0,09

0,00
2 4 5 7 8
VARIABLE

DISTRIBUCIÓN ASIMÉTRICA POSITIVA DISTRIBUCIÓN ASIMÉTRICA NEGATIVA

0,38 0,40

0,28 0,30
frecuencia relativa

frecuencia relativa

0,19 0,20

0,09 0,10

0,00 0,00
1 2 3 4 5 6 2 4 5 7 8 10
VARIABLE VARIABLE

También pueden resultar de interés la suma de los valores de la variable, los valores mínimo y máximo y la
cantidad de datos.

A continuación le proponemos realice la lectura del artículo titulado Percentiles de peso al nacer por
edad gestacional en gemelos peruanos
disponible en: http://scielo.sld.cu/scielo.php?pid=S0034-75312006000300003&script=sci_arttext
Este artículo ilustra la aplicación de las medidas descriptivas, así como su forma habitual de comunicar tal
información en un texto de tipo científico.

PRACTICA PROPUESTA

1- Un estudiante de Contador listó sus notas de exámenes finales que se muestran más abajo registrando para
cada materia a qué área pertenece (H: humanística; T: técnica)

Área T T T H H H T H T T T T T H T T T H T

Nota 8 4 7 5 4 2 6 2 8 5 8 9 7 4 4 6 8 7 4

PROCESOS EN EL INFOSTAT
1- Cargue la base de datos en el Infostat:
Archivo/Nueva tabla

22
Ingrese los datos en dos columnas.
Puede resultar útil convertir los datos a entero: Seleccionar la columna Nota/Acciones sobre columnas/Tipo de
dato/tildar la opción “entero”.
2- Para una descripción general de las notas procese:
Estadísticas/Medidas Resumen
Seleccione la variable/Aceptar
Tilde todas las opciones que desee. Puede elegir presentación vertical u horizontal
3- Para una descripción de las notas según el área de disciplinar procese:
Estadísticas/Medidas Resumen
Seleccione la variable
En la solapa de Particiones o en Criterios de clasificación seleccione la variable “Area”/Aceptar

a) ¿Cuántos finales rindió? ¿Cuántos finales aprobó y cuántos reprobó?


b) ¿Cuál es su nota media y el desvío de sus notas?
c) ¿Su rendimiento académico es homogéneo?
d) Interprete la mediana y el cuartil 1 (o percentil 25)
e) ¿Cuál es su nota más frecuente?
f) ¿Qué calificaciones obtuvo en el 25% de exámenes en que le fue mejor?
g) ¿En qué área disciplinar tiende a tener mejor rendimiento? ¿En cuál tiene un rendimiento más homogéneo?

2- En cierta escuela primaria de gestión privada se incorporó la enseñanza de una lengua extranjera para los
alumnos de 3er grado bajo un particular modelo de enseñanza denominado por inmersión. Bajo este modelo no
se dictan clases de inglés tradicionales, sino que se enseña matemática, lengua o ciencia en la lengua nativa y
en lengua extranjera. A fin del año lectivo se evaluaron a través de una prueba estandarizada dos habilidades:
comprensión lectora, comprensión auditiva, en la escala de 0 a 10. El resumen de las medidas descriptivas de
las puntuaciones fueron las siguientes:
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Comprensión Comprensión Versión Estudiantil


Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Box-plot Versión Estudiantil
Resumen lectora auditiva Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
10,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil
n 21 21 Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
7,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Compr_lectora

Media 5,96 7,23 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
5,94

D.E. 0,92 1,16


Versión Estudiantil Versión Estudiantil
5,00 Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

CV 15,5 16,06 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
2,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Mín 3 4 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil 0,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Máx 8 10 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Mediana 5,94 6,99


Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Q1 5,65 6,88 Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Box-plot Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Q3 6,38 7,76 Versión Estudiantil
10,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil

Asimetría -1,16 -0,24 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
7,50
Compr_auditiva

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

P(05) 5,05 6,29 Versión Estudiantil


Versión Estudiantil Versión Estudiantil
5,00
Versión Estudiantil Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
Versión Estudiantil
P(95) 6,99 8,59 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
2,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil 0,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

23
a) ¿En cuál de las habilidades cognitivas los estudiantes mostraron más desarrollo?
b) Compare los coeficientes de asimetría ¿Qué puede concluir?
c) ¿En qué habilidad se observa más variabilidad en las calificaciones?
d) ¿Qué observaciones puede usted hacer sobre los gráficos?
e) ¿Cuáles fueron las calificaciones del 5% de los mejores alumnos en cada habilidad?

3- Sobre el caso 8 del práctico 2 (efectividad de los medicamentos A y B) se procesaron con el Infostat las
estadísticas descriptivas que se adjuntan a continuación. También le ofrecemos el gráfico de caja (box-plot) para
que complemente su análisis:
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Medicamento A Medicamento B Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
n 21 39Estudiantil Versión Estudiantil Versión Estudiantil
Versión Título Versión Estudiantil
Media 4,01 3,06 Versión Estudiantil 5,24
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
D.E. 0,53 0,84
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
CV 13,09 27,53 4,23

Tiempo_efecto
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Mín 3,12 1,4 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Máx 5,05 4,93Estudiantil Versión 3,23
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Mediana 3,98 2,9 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión 2,22
Estudiantil Versión Estudiantil Versión Estudiantil
Q1 3,6 2,4
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Q3 4,33 3,7
Versión Estudiantil Versión 1,21
Estudiantil Versión Estudiantil Versión Estudiantil
Asimetría 0,16 0,19 Versión Estudiantil Versión Estudiantil
A Versión Estudiantil
B Versión Estudiantil
P(05) 3,28 1,69Estudiantil Versión Estudiantil Versión
Versión Medicamento
Estudiantil Versión Estudiantil
P(95) 4,76 4,61 Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Se le solicita que confeccione un informe en el que analice la efectividad de cada medicamento referenciando las
medidas descriptivas correspondientes y finalice con su recomendación experta.

4- Un médico busca información sobre tratamientos de la artrosis y encuentra un artículo con los resultados de
una investigación en la que se registró el tiempo que transcurrió (en días) hasta que cada paciente se recuperó
completamente. A continuación transcribimos tales resultados:
Resumen TRATAMIENTO TRATAMIETNO
ACUPUNTURA MEDICAMENTOSO
n 20 38
Media 12,10 20,00
D.E. 2,73 3,46
CV 22,53 17,32
Mín 9,00 15,00
Máx 17,00 25,00
Asimetría 0,49 0,16
P(25) 10,00 17,00
P(75) 14,00 22,00

Con base en esta información responda:


a) Cuántos individuos participaron de la experiencia? ¿Qué variable se observó? Clasifíquela e indique su unidad
de medida.
b) ¿Con qué tipo de tratamiento los pacientes tienden a curarse más rápido?
c) ¿Con cuál de los tratamientos los pacientes tiene una respuesta más homogénea?
d) Interprete P(25) en cada tratamiento.

24
5- Un grupo de psicólogos investigadores realizó un estudio sobre estrategias de afrontamiento y situaciones
estresoras en pacientes internados por enfermedades cardiovasculares. La técnica de recolección de
información fue a través de la versión abreviada de cierto cuestionario estandarizado que mide la intensidad en
que cada sujeto utiliza distintas estrategias de afrontamiento medidas en la escala de 0 a 10 y se interpreta que
valores mayores indican una mayor intensidad en el uso de la estrategia. Según la bibliografía se sabe que una
de las estrategias a la que apelan los pacientes es la de recurrir a la “religión” pero los investigadores sospechan
que es un recurso más intenso entre las mujeres con respecto a los hombres.
A continuación se incluye un resumen de los estadísticos calculados.
Medidas descriptivas Hombres Mujeres
Promedio 3,76 5,8
Desvío estándar 1,1 0,7
CV 29,3% 12%
Percentil 80 4,8 7,2
a) Indique el tipo de estudio realizado. Identifique las variables del caso y clasifíquelas.
b) Compare los promedios y los desvíos y extraiga conclusiones.
c) Interprete los CV.
d) Interprete los percentiles.

6- En una universidad se realizó una investigación con el objetivo de determinar los requerimientos de formación
de los docentes en función del dominio de competencias que favorecen un alto desempeño. Las competencias
se clasificaron en genéricas y técnicas. Las mediciones se realizaron con un instrumento que puntúa de 0 a 5 y
se interpreta un mayor dominio de la competencia cuanto mayor el puntaje obtenido.
La siguiente tabla muestra las estadísticas descriptivas obtenidas:
Subdimensiones Promedio Desvío estándar CV Mínimo Máximo
1. Competencias Genéricas 3.9 0.6 15,4% 3.0 4.9
2. Competencias Técnicas 3.5 0.6 17,1% 2.8 4.6
Redacte un breve informe con sus conclusiones, justificando sus dichos numéricamente.

7- Un grupo de investigadores se propuso indagar si existen diferencias significativas del autoconcepto en


función del modelo lingüístico de escolarización en una comunidad bilingüe en el país vasco. Para ello se
administró el Test de Autoconcepto (AFA) de Musitu a una muestra de 655 adolescentes de 16-17 años
escolarizados en escuelas públicas, la mitad aproximadamente en el modelo A (enseñanza en castellano y el
euskera como asignatura) y la otra mitad en el modelo D (enseñanza en euskera y el castellano como
asignatura). El puntaje obtenido en el test se interpreta que a mayores puntajes es mayor (más positivo) el
autoconcepto del sujeto.

TABLA 1: Puntuación Test AFA para autoconcepto TABLA 2


social Autoconcepto Autoconcepto
X Frec.Abs. Frec.Rel. Académico Social
0 y menos de 5 3 0,5% MODELO A Media 24,04 15,24
5 y menos de 10 13 2,0% CV 6,5% 7,4%
10 y menos de 15 494 75,4% MODELO B Media 22,75 12,95
15 y menos de 20 145 22,1% CV 9,8% 11,9%
655 100,0%

a) ¿Se trata de un estudio observacional o experimental? ¿transversal o longitudinal?

25
b) Interprete el 3er renglón de la tabla 1.
c) ¿Qué porcentaje de adolescentes puntuó al menos 10 en el test?
d) Escriba una breve frase que describa el impacto de los modelos de enseñanza en las dos dimensiones
observadas del autoconcepto (tabla 2).
e) ¿Por qué cree que los investigadores muestran las medias y no las medianas?

8- Se realizó una investigación con el objetivo de determinar si los exámenes orales son estresantes. Para ello
se tomó la presión arterial de estudiantes en dos situaciones diferentes: durante el desarrollo de un trabajo
práctico (situación común para el estudiante) y momentos previos a rendir un examen final en forma oral.
Participaron de la experiencia una muestra de alumnos de segundo año de la Facultad de Odontología de la
Universidad Nacional de Tucumán que cursaban la materia Fisiología, cuyas edades oscilaban entre 18 y 32
años, sin antecedentes hereditarios de hipertensión arterial. También se registró la nota que obtuvieron en el
examen.
a) ¿Cuál fue el procedimiento de recopilación de datos?
b) ¿Se trata de un estudio observacional o experimental? Justifique su respuesta.
c) Procesadas las medidas descriptivas para la variable “Presión arterial antes del examen oral” para cada grupo
de sexo se obtuvieron los siguientes resultados:

Resumen Mujeres Hombres


n 36 50
Media 124,15 125,77
D.E. 2,06 2,13
CV 1,66 1,69
Mín 120 122
Máx 129 130
Mediana 124,2 125,51
Asimetría -0,06 0,22
Percentil 80 125,77 128

c.1- ¿En qué grupo la presión tendió a ser más alta? ¿La presión arterial fue homogénea en cada grupo?
c.2- Interprete el percentil 80 en términos de la variable.
c.3- Ilustre gráficamente (a mano alzada) el tipo de asimetría de la distribución de la presión arterial en el
grupo de las mujeres.
c.4- Si en el grupo de mujeres se hubiera incluido una hipertensa ¿cómo hubieran variado las medidas
resumen?

9- APLICACIÓN: EFECTOS PSICOLÓGICOS DE LOS JUEGOS DEL ROL EN EL DESARROLLO SOCIAL Y


COGNITIVO DE LOS MENORES
Una investigación encargada por el Defensor del Menor al Colegio Oficial de Psicólogos de Madrid a instancia de
la Fiscalía de Menores de Madrid tuvo por objetivo conocer los aspectos perjudiciales que para el desarrollo
pudieran tener el ejercicio de los juegos del rol.
El artículo publicado en http://dreamers.com/defensadelrol/articulos/psicologos.htm tiene la siguiente
introducción: “…El objetivo de este estudio ha sido doble, por una parte comprobar si existen diferencias en el
desarrollo social y cognitivo de los adolescentes menores de 18 años que participan en juegos de rol y de los
que no lo hacen y por otra comprobar si existen diferencias en el desarrollo social y cognitivo de los jugadores de
rol menores de 18 años, en función de la frecuencia, intensidad y duración con la que practican los juegos…”

26
Procesados los datos se obtuvieron las salidas que se incluyen a continuación: analícelas y complete el
informe final.

Variable: Edad Frecuencia de juego según el sexo, en cantidad de casos


n Media D.E. Mín Máx FRECUENCIA_DE_JUEGO
128 15,95 1,23 14,00 18,00
SEXO Alta Media Baja Nunca Total
Mujer 7 8 16 31 62
Varón 19 16 10 21 66
Total 26 24 26 52 128

Resumen descriptivo del Nivel de ansiedad Opinión del efecto de la frecuencia de juego sobre
según la frecuencia de juego rendimiento académico
Nunca juega Juega alguna vez Frecuencia de juego
Media 3,94 5,16 Alguna
D.E. 0,37 0,77 Efecto en rendimiento vez Nunca Total
CV 9,39 14,92 Disminuye 11 6 17
Mejora 12 13 25
No influye 53 33 86
Total 76 52 128

INFORME

El número total de cuestionarios cumplimentados es de …... La edad media de los sujetos de la muestra es de
……… años (desvío = ……), oscilando entre los …… años mínimo y los …… años máximo. El ……….% de los
sujetos son varones (……) y el ……….% mujeres (……..).
El ……..% de la muestra nunca ha jugado a rol. El …….% juega con una baja frecuencia, el ……% juega con
una frecuencia media, el ……% tiene una alta frecuencia de juego.
Con el objetivo de analizar las diferencias en la frecuencia de juego en función del sexo se observó que entre los
varones el ……..% juega con una frecuencia media o alta, mientras que en el grupo de las mujeres esta tasa
alcanza un …… % por lo que se concluye que …………………………………… ………………… ………….
………………… ……………… ……………….. ….. …………….
También se observó entre los jugadores que el ……..% cree que la práctica de los juegos de rol no disminuye su
rendimiento escolar o incluso lo mejora.
A través de la Batería de Socialización de Silva (BAS-3) se midió el nivel de ansiedad social/timidez que puede
tomar valores de entre 0 (nivel mínimo de ansiedad/timidez) y 10 (nivel máximo de ansiedad/timidez). Analizando
las medidas descriptivas según la frecuencia de juego se concluye que …………………… ……………………..
………………………. ……………………. …………………………………………………………………………………

10- Continuando el análisis del caso de estudio “TOLERANCIA Y ADOLESCENCIA. EDAD, GÉNERO Y
NACIONALIDAD: ANÁLISIS COMPARATIVO”, complete el artículo con los datos contenidos en la base de
datos “Tolerancia y Adolescencia”.

Continuación del artículo:

METODOLOGIA. Para el análisis de los datos se aplicó …..

27
RESULTADOS. Participaron en la muestra ….. adolescentes de entre ….. y …. años de edad, con un promedio
de ……. años y una desviación típica de …… años. El ……. % son mujeres y el ……% son inmigrantes (Véase
Tabla 1).

TABLA 1: Características sociodemográficas de la muestra


Frecuencia %
Edad 11 a 12 años
13 a 14 años
15 a 16 años
Sexo Mujeres
Hombres
Nacionalidad Españoles
Inmigrantes

La tabla 2 indica ….

TABLA 2: Resumen descriptivo de las subescalas del Test de tolerancia


Subescala Mínimo Máximo Media D.E. CV
Conocim correcto 21 56 32,9 6,9 21,0%
Conocim erróneo 22 60 44,4 6,34 14,3%
Actitud positiva 5 15 9,6 2,7 28,1%
Actitud negativa 5 15 10,1 2,3 22,8%
Actitud neutra 5 15 10,6 2,4 22,6%
Susceptibilidad 5 15 10,2 2,1 20,6%
Autoeficacia 5 15 8,5 2,5 29,4%

La tabla 3 muestra el resumen descriptivo del nivel de tolerancia según el sexo. Se observa que …..

TABLA 3: Resumen descriptivo del nivel de tolerancia según el sexo


(INSERTAR LA TABLA)

La tabla 4 muestra el resumen descriptivo del nivel de tolerancia según la nacionalidad. Se observa que …..

TABLA 4: Resumen descriptivo del nivel de tolerancia según la nacionalidad


(INSERTAR LA TABLA)

28
PRÁCTICO 4: PROBABILIDADES

Puede asignarse una probabilidad a un suceso de manera subjetiva, a través del enfoque de Laplace (o clásico,
la probabilidad se determina teóricamente), según el enfoque frecuentista (para la que se requiere la
experimentación). Sin embargo, la teoría de probabilidad moderna se basa en el enfoque Axiomático de
Kolmogorov que define a la probabilidad como “una función de conjunto que asocia un valor no negativo a cada
resultado de un experimento aleatorio” y establece a su vez que toda probabilidad debe cumplir con los
siguientes axiomas:
P(A) ≥ 0
P(espacio muestral) = 1(1)
P(A ó B) = P(A) + P(B) (2)

De donde deducimos que una probabilidad es un número comprendido entre 0 y 1.


(1) El espacio muestral es el conjunto de resultados de un experimento aleatorio.
Cada resultado de un experimento aleatorio se denomina punto muestral.
Suceso o evento es un punto muestral o un conjunto de ellos que resultan de interés.
(2) Si A y B son sucesos mutuamente excluyentes.

Las probabilidades pueden ser calculadas sobre distintos tipos de sucesos:


Mutuamente excluyentes No pueden ocurrir simultáneamente en la misma prueba, por lo tanto la
probabilidad de que ocurran juntos es nula [P(A y B) = 0].
No excluyentes Pueden ocurrir juntos en la misma prueba, por lo tanto P(A y B)>0.
Independientes La ocurrencia de uno de los sucesos (B) no da información sobre el otro
suceso (A) por lo tanto no varía su probabilidad y P(A) = P(A/B).
Dependientes La ocurrencia de uno de los sucesos (B) da información sobre el otro suceso
(A) y modifica su probabilidad y P(A) ≠ P(A/B).
Las reglas de cálculo asociadas a cada tipo de sucesos son:

Excluyentes P(A o B) = P(A) + P(B)


No excluyentes P(A o B) = P(A) + P(B) – P(A y B)
Independientes P(A y B) = P(A) * P(B)
Dependientes P(A y B) = P(A) * P(B/A)

PRACTICA PROPUESTA

1- Suponga que usted va a rendir un examen oral de una materia cuyo programa consta de 12 unidades de las
que sólo estudió 9. El profesor elegirá una unidad al azar para interrogarlo. Suponiendo que aprueba solo si lo
interrogan sobre alguna de las unidades que usted estudió.
a) ¿Cuál es su probabilidad de aprobar?

29
b) ¿Cuál es su probabilidad de desaprobar?
c) Los sucesos “aprobar” y “desaprobar” ¿son mutuamente excluyentes o no excluyentes? Justifique su
respuesta.
d) Si lo interrogan sobre una unidad que usted no estudió ¿cuál es la probabilidad de que apruebe?
e) El resultado de su examen ¿es independiente o dependiente del estudio? Justifique su respuesta.

2- En un estudio reciente se identifican las características de un buen líder. Entre ellas se destacan tener
desarrollada la inteligencia emocional y ser innovador, atributos que fueron reconocidos en una muestra de
líderes empresarios según se muestra en la siguiente tabla.
Si usted es contratado en una gran empresa, ¿cuál es la probabilidad de que su superior sea un líder
a) innovador y cuente con inteligencia emocional?
b) Que tenga sólo una de las características deseables?
c) Que tenga alguna de las características deseables?
d) Si resulta ser innovador ¿cuál es la probabilidad de que no tenga inteligencia emocional?

INTELIGENCIA EMOCIONAL
Tiene No Tiene Total
Innovador 37 16 53
No innovador 13 9 22
Total 50 25 75

3- Un asistente social tiene que visitar a una familia de un barrio desfavorecido que deberá elegir al azar. Tiene
información sobre los servicios de agua potable y gas natural de la zona según consta en la siguiente tabla:
Frecuencias relativas al total, en cantidad de hogares
En columnas: GAS
AGUA NO TIENE TIENE Total
NO TIENE 370 260 630
TIENE 200 170 370
Total 570 430 1000

a- ¿Cuál es la probabilidad de que visite una vivienda que no tenga ninguno de los servicios?
b- ¿Cuál es la probabilidad de que la vivienda que visite cuente con los dos servicios?
c- ¿Qué porcentaje de las viviendas del barrio no tiene agua?
d- ¿Qué porcentaje de las viviendas del barrio no tiene gas?
e- Si la vivienda que visita cuenta con servicio de agua ¿es muy probable o poco probable que cuente también
con gas?
f- ¿Cuál es la probabilidad de que una vivienda cuente con algún servicio?
g- ¿Cuál es la probabilidad de que una vivienda cuente con sólo un servicio?

4- Se realizó un estudio prospectivo en pacientes beneficiarias del sistema de atención primaria que acudían a
sus controles habituales postparto. Para ello los internos de medicina acompañados por matrona o enfermera
realizaron una encuesta a aquellas mujeres que se encontraban entre el quinto o sexto mes postparto. Como
instrumento diagnóstico se utilizó los criterios del CIE 10 para depresión que consta de 9 ítems como
“disminución de la atención y concentración; pérdida de la confianza en sí mismo; perspectiva sombría del

30
futuro” entre otros; considerando casos positivos para depresión, aquellas mujeres que presentaron 5 o más de
los 9 criterios.
Durante la entrevista se confeccionó un cuestionario en donde se consignó si la paciente tenía o no
antecedentes personales o familiares (de primer grado) de depresión. Con base en los datos recogidos se
procesaron la siguiente tabla:
Frecuencias relativas al total, en cantidad de casos
CONTROL POSTPARTO
Antecedente_depresion DEPRESIVA NO DEPRESIVA Total
CON ANTECEDENTES 50 27 77
SIN ANTECEDENTES 16 44 60
Total 66 71 137
a) ¿Qué es más probable: que una mujer sufra o que no sufra depresión postparto?
b) Si una mujer sufre depresión postparto ¿cuál será el antecedente más probable?
c) Si un médico obstetra atiende a una nueva parturienta en un hospital público y averigua que no tiene
antecedentes personales ni familiares de depresión ¿le recomendaría contactar a un psicólogo para dar
tratamiento de apoyo a la paciente después del parto?

5- Un docente de Literatura encuestó a un grupo de estudiantes sobre si habían dormido o no la noche previa al
examen y relacionó esta información con las notas que obtuvieron, clasificadas en “aprobado” y “desaprobado” y
construyó la siguiente tabla:
CALIFICACION

Durmió DESAPROBADO APROBADO TOTAL


NO 17 10 27
SI 9 24 33
Total 26 34 60
a) ¿Es más probable desaprobar o aprobar los exámenes de esta materia?
b) ¿Cuál es la probabilidad de que un alumno se presente a rendir examen sin dormir?
c) El resultado del examen ¿es independiente o dependiente del descanso en la noche previa?
d) Los sucesos “aprobó” y “no durmió” ¿son excluyentes?

6- Un equipo de profesionales argentinos realizó una investigación con el objetivo de “determinar en tres
municipios de Cundinamarca, Colombia, la prevalencia del Trastorno por Estrés Postraumático (TEPT) infantil y
factores asociados, según tipo de exposición a la guerra.”
El estudio de corte transversal se efectuó a una muestra de escolares de 5 a 14 años de edad residentes en tres
ciudades con diferente exposición bélica (Ciudad La Palma, con exposición crónica; Ciudad Arbeláez, con un
hostigamiento armado reciente; Ciudad Sopó, sin exposición).
Se realizaron entrevistas psiquiátricas semi-estructuradas y se administró la Escala para Trastorno de Estrés
Postraumático Administrada. Los resultados sobre una selección de trastornos se muestran a continuación:

Trastorno
Ciudad de aprendizaje de conducta depresivo Total
Arbelaez 41 66 68 175
La Palma 71 61 83 215
Sopo 26 23 71 120
Total 138 150 222 510

31
a) ¿En qué nivel de exposición bélica es más probable encontrar niños con trastornos de conducta?
b) En situación de exposición crónica ¿qué tipo de trastorno prevalece?
c) ¿Cuál es la tasa general de niños con trastornos depresivos en Colombia?

7- Un equipo de abogados llevó a cabo un estudio durante dos años sobre el comportamiento de los detenidos
beneficiados con el sistema de monitoreo electrónico (tobillera) para encontrar un patrón de reincidencia en el
delito que les permitiera determinar, con conocimiento de causa, si la prisión morigerada había ayudado en la
reinserción social. Tomaron 454 casos de detenidos con pulsera y por cada uno de ellos seleccionaron otros tres
detenidos que hubieran cometido delitos similares. Los resultados del estudio se exponen a continuación:
Reincidencia
Condena no si Total
Carcel 1017 345 1362
Tobillera 381 73 454
Total 1398 418 1816

a) ¿Cuál es la probabilidad de que un delincuente juzgado reincida en el delito?


b) ¿Cuál es la probabilidad de que un delincuente reincida si cumple su pena con la modalidad de la tobillera?
c) ¿Diría que la pena morigerada facilita la reinserción social?

8- Para indagar si la maternidad temprana en una generación adelanta la edad del embarazo en la siguiente
generación, se llevó a cabo una encuesta a una muestra aleatoria de mujeres (adolescentes y adultas)
internadas por su primer parto en cierto hospital durante el último semestre. Se registró la edad de las mismas y
la edad en que la madre de la encuestada (o sea, la abuela) tuvo a su primer hijo. Se muestran a continuación
los datos tabulados obtenidos.

HIJA_DE_MADRE_ADOLESCENTE
GRUPO NO SI Total
ADOLESCENTE 39 24 63
ADULTA 53 16 69
Total 92 40 132

a) ¿Cuál es la probabilidad de que una parturienta sea hija de una madre adolescente?
b) Las hijas de madres adolescentes ¿qué probabilidad tienen de ser también madres adolescentes?
c) ¿En qué grupo de edad es más probable encontrar hijas de madres adolescentes?

9- Un equipo liderado por el especialista en redes sociales James H. Fowler, de la Universidad de San Diego,
emprendió una cruzada ambiciosa: rastrearon las relaciones de 4.739 personas durante 20 años, en el marco de
uno de los ensayos clínicos más multitudinarios con el objetivo de estudiar la influencia de las redes sociales en
la felicidad de las personas. A continuación recreamos parte de los datos recogidos.
a) ¿Cuál es la probabilidad de encontrar sujetos ¿Tiene un amigo feliz…
felices? USTED ES a menos de 1 km a más de 1 km Total
b) ¿Qué es más probable: que usted sea feliz si FELIZ? de su casa? de su casa?
tiene un amigo cerca de su casa, o si su amigo está NO 1185 1943 3128
lejos de su casa? SI 900 711 1611
Total 2085 2654 4739

32
10- Retomando el caso sobre “COMPARACION DE LAS REACCIONES DE ESTRÉS POST-TRAUMÁTICO EN
NIÑOS TURCOS EXPUESTOS Y NO EXPUESTOS A TERREMOTO ” le ofrecemos los datos obtenidos y el
informe técnico con el objetivo de que usted lo complete.
Frecuencias absolutas Frecuencias relativas al total
En columnas:TEPT En columnas:TEPT
GRUPO NO SI Total GRUPO NO SI Total
EXPUESTO 56 144 200 EXPUESTO 0,14 0,36 0,50
NO EXPUESTO 176 24 200 NO EXPUESTO 0,44 0,06 0,50
Total 232 168 400 Total 0,58 0,42 1
INFORME
“Estos resultados indican que las tasas de prevalencia estimada de PETP alcanzaron una proporción muy
alta/muy baja de ……..% en el grupo expuesto a terremoto y un ……..% en el grupo control no expuesto. El
número de niños para un diagnóstico posible de TEPT en los grupos expuestos a trauma fue ……….. veces
mayor/menor que en el grupo control no expuesto, …….. versus …….. casos, respectivamente. Los psicólogos
y profesionales de salud mental deberían considerar estas tasas de severidad y prevalencia de TEPT cuando
desarrollen programas de tratamiento, intervención y prevención para niños después de catástrofes naturales y
tecnológicas. Los resultados indican/no indican que la exploración temprana para la identificación de TEPT es
muy importante para predecir ulteriores efectos de TEPT.”

APLICACIÓN DE PROBABILIDADES EN LA EVALUACION DE MÉTODOS DIAGNÓSTICOS


ESTADO DE SALUD REAL
RESULTADO SEGÚN DIAGNÓSTICO SANO ENFERMO TOTAL
NEGATIVO = SANO 185 9 194
POSITIVO = ENFERMO 15 71 86
TOTAL 200 80 280

PROPIEDAD DEL MÉTODO DIAGNÓSTICO CALCULO


SENSIBILIDAD: Capacidad del test para detectar la P(diagnóstico positivo/enfermos) = 71/80 = 0,8875
enfermedad = es la proporción de verdaderos positivos
identificados por la prueba del total de enfermos
ESPECIFICIDAD: Capacidad del test para detectar a los P(diagnóstico negativo/sanos) = 185/200 = 0,925
sanos = es la proporción de verdaderos negativos
identificados por la prueba del total de sanos
VALOR PREDICTIVO POSITIVO: probabilidad de P(enfermo/diagnóstico positivo) = 71/86 = 0,826
padecer la enfermedad si se obtiene un resultado
positivo en el test diagnóstico.
VALOR PREDICTIVO NEGATIVO: probabilidad de estar P(sano/diagnóstico negativo) = 185/194 = 0,954
sano si se obtiene un resultado negativo en el test
diagnóstico.
FALSO POSITIVO: diagnóstico equivocado a un sujeto P(diagnóstico positivo/sano) = 15/200 = 0,075
sano.
FALSO NEGATIVO: diagnóstico equivocado a un sujeto P(diagnóstico negativo/enfermo) = 9/80 = 0,1125
enfermo

33
PRÁCTICO 5: MODELOS PROBABILISTICOS.
Distribución Normal y Normal Estandarizada

Muchas variables aleatorias continuas observadas en la realidad toman valores cuya distribución puede ser
adecuadamente modelada a través de la conocida distribución normal.
La función de densidad normal tiene características particulares como las siguientes:
 tiene forma campanular,
 es simétrica con respecto al promedio,
 es unimodal,
 es asintótica al eje de abscisas,
 tiene dos puntos de inflexión para los puntos y
 el área comprendida entre la campana y la abscisa (eje x) es igual a 1, o sea que representa al 100%
de valores de la variable aleatoria en estudio.
La distribución normal tiene dos parámetros que la definen: la media y la varianza; entonces podemos escribir X
˜ N
Los que siguen son algunos ejemplos gráficos de variables distribuidas normalmente:

Distribución Normal (100;25) Distribución Normal (36; 4) Distribución Normal (500;6400)

0,10 0,30 0,0100

0,08 0,22 0,0075


Densidad

Densidad

Densidad

0,05 0,15 0,0050

0,03 0,07 0,0025

0,00 0,00 0,0000


75 81 88 94 100 106 113 119 125 28 30 32 34 36 38 40 42 44 100 200 300 400 500 600 700 800 900
Variable Variable Variable

Las probabilidades bajo esta distribución se calculan como áreas o superficies bajo la curva, como se indica en
los siguientes casos:
Sea X una variable aleatoria continua N(500;6400), entonces:

Función de densidad
Normal(500,6400): p(evento)=0,8413
0,0050

 La probabilidad de que la variable tome 0,0037


Densidad

valores menores a 580: P(x<580)= FN(580) = 0,0025


0,8413
0,0012

0,0000
100,00 300,00 500,00 700,00 900,00
Variable

34
Función de densidad
Normal(500,6400): p(evento)=0,6462
0,0050

 La probabilidad de que la variable tome 0,0037

Densidad
valores mayores a 470: P(x>470)= GN(470) = 0,0025
0,6462
0,0012

0,0000
100,00 300,00 500,00 700,00 900,00
Variable

Función de densidad
Normal(500,6400): p(evento)=0,4199
0,0050

0,0037
 La probabilidad de que la variable tome

Densidad
valores entre 510 y 650: 0,0025

P(510<x<650)= F(650) – F(510) = 0,4199 0,0012

0,0000
100,00 300,00 500,00 700,00 900,00
Variable

Nota: puede reproducir los ejemplos con el Infostat, en el menú Aplicaciones/Didácticas/ Gráficos de
densidad de continua.

Hay otra distribución con características similares denominada Distribución Normal Estandarizada. “Z” es la
variable aleatoria normal estandarizada que resulta de la siguiente transformación de la variable original:
X 
Z y mide la distancia entre los valores de la variable y la media, en unidades de desvío estándar.

Distribución Normal Estándar(0;1)


Los parámetros que definen a la Distribución Normal
0,40
Estandarizada son la media (que vale 0) y la varianza
0,30
(que vale 1), entonces podemos escribir Z ≈ NE(0;1)
Densidad

Estandarizando la variable en estudio, pueden 0,20

hallarse las probabilidades requeridas bajo esta 0,10

distribución y han de ser equivalentes a las calculadas 0,00


-4 -3 -2 -1 0 1 2 3 4
bajo la curva normal.
Variable Z

También es posible calcular el valor de la variable que supera o es superado por cierta probabilidad (fractil bajo
la normal) como: X = + ZF . 

PRACTICA PROPUESTA

1- En la siguiente tabla se muestran las notas que obtuvo Matías, un alumno universitario, en los exámenes de
tres materias, así como la nota media y el desvío de las notas del curso.

35
a) Su tarea consiste en estandarizar las notas del alumno en cuestión y determinar en cuál de las materias le
fue mejor y en cuál peor en relación al curso.

Asignatura Notas de Promedio de Desvío de las Varianza de X 


Z
Matías notas del notas del las notas del 
curso curso curso
Psicología I 68 65 2 4
Matemática 77 77 9 81
Filosofía 83 89 6 36

b) Asumiendo que las notas de las tres materias se distribuyen normalmente, represente gráficamente la
distribución de las notas de Filosofía y la probabilidad de que a un alumno le vaya como a Matías o peor.
c) ¿Cuál es la probabilidad de que a un alumno le vaya como a Matías o mejor en Psicología I?
d) En Matemática ¿qué nota superó el 20% de los mejores alumnos?

PROCESOS EN EL INFOSTAT
1- Calcular una probabilidad bajo la distribución normal de probabilidades: opción 1
Aplicaciones didácticas/Gráficos de funciones de densidad continuas
Ingrese los parámetros de la distribución: media y varianza.
Seleccione entre las opciones ofrecidas en “el evento está definido por los valores…“ e ingrese
el valor de la variable de interés/Aceptar.

Calcular una probabilidad bajo la distribución normal de probabilidades: opción 2


Estadística/Probabilidades y cuantiles
Ingrese los parámetros de la distribución: media y varianza.
Ingrese el valor de la variable de interés en “Valor de x” /Calcular.

2- Calcular un fractil bajo la distribución normal de probabilidades


Estadística/Probabilidades y cuantiles
Ingrese los parámetros de la distribución: media y varianza.
Ingrese la probabilidad acumulada izquierda en P(X<x)/Calcular.

2- Suponga que la duración de los exámenes de estadística es una variable normalmente distribuida con una
media de 90 minutos y una varianza de 100 minutos2 y desvío de 10 minutos. Marque en los gráficos las
probabilidades que se le indican y determine en cada caso si tal probabilidad será igual, mayor o menor a 0,50.
a) ¿Cuál es la probabilidad de que un alumno entregue en menos de una hora y cuarto?
b) ¿Cuál es la probabilidad de que un alumno tarde más de una hora y media?
c) ¿Cuál es la probabilidad de que un alumno tarde entre 90 y 100 minutos en entregar su examen?
d) ¿Cuánto tiempo máximo tarda en entregar el examen el 10% de alumnos más rápidos?
e) ¿Cuánto tiempo mínimo tarda en entregar el examen el 15% de alumnos más lentos?

36
3- APLICACIÓN: EL COCIENTE INTELECTUAL6

¿Qué es el Cociente Intelectual? (también llamado erróneamente "coeficiente intelectual")


Los psicólogos están de acuerdo en decir que existen varias formas de inteligencia: desenvoltura verbal, lógica,
razonamiento numérico, inteligencia musical o espacial entre otras. Algunas de estas aptitudes están
fuertemente relacionadas entre ellas, como por ejemplo la inteligencia verbal y la lógica.
El cociente intelectual (C.I.) mide la inteligencia general, que es la correlación común a estas aptitudes
específicas ("factor g"). Consiste pues en la capacidad general de cada uno de pensar y resolver problemas en
un lapso de tiempo limitado.
Estudios científicos han demostrado que las puntuaciones de C.I. obtenidas en el seno de la población siguen
siempre una ley de distribución normal. Por convenio, la media general del C.I. ha sido establecida en 100. Así,
el 68 % de la población dispone de un cociente intelectual entre 85 y 115.
El cociente intelectual: Más del 75% de las personas tienen un cociente intelectual normal (CI). La media se
establece en 100 y, según la Organización Mundial de la Salud (OMS), quienes pasan de 130 son superdotados
y aquellos cuyo CI es inferior a 80 se consideran infradotados. Entre el 84 y el 90 se hallan “los niños límite”, a
los que les falta sólo un poco de apoyo para poder seguir el ritmo de los demás.

a) Con la información disponible determine cuánto vale el desvío estándar de los CI.
b) Si tuviera en sus manos la planificación de políticas sociales orientadas a sujetos infradotados ¿a qué
porcentaje de la población debería considerar?
c) Si tuviera en sus manos la planificación de políticas educativas ¿qué porcentaje de la población estudiantil
necesitaría apoyo?
d) ¿Cuál es la probabilidad de elegir a una persona al azar y que sea superdotada?
e) ¿Qué CI tiene el 20% de individuos mejor dotados?
f) ¿Qué CI tiene el 5% de individuos peor dotados?

4- De acuerdo a una investigación realizada en España, los adolescentes dedican por semana un tiempo
jugando a juegos de rol que es variable con distribución normal con una media de 15 horas y un desvío de 1,5 hs
(varianza = 2,25).
a) Ayudándose con un gráfico determine qué es más probable ¿qué un adolescente dedique más de 18 horas
en una semana jugando o que dedique menos de 14 hs?
b) Si se desea determinar cuánto tiempo dedica a los juegos de rol el 10% de adolescentes que menos tiempo
juegan
b.1- ¿qué fractil calcularía?
b.2- de entre los siguientes resultados ¿cuál diría usted que podría ser el valor del fractil?
a- 17 b- 13 c- 15 d- 1,5

5- Dentro del contexto psicodinámico, de la crítica al modelo conversivo y la técnica psicoanalítica ortodoxa nace
el concepto de alexitimia. Fue introducido por Nemiah y Sifneos, en 1970, para describir un conjunto de
manifestaciones cognitivo-afectivas observadas en pacientes aquejados de alteraciones psicosomáticas. Entre
estas características se encuentra la dificultad en el reconocimiento y expresión de sentimientos, una marcada

6
Fuentes: http://es.psicoactiva.centraltest.com/esptest/@test/part_info.php?INFO=356!incCENTRALQI1
http://www.consumer.es/accesible/es/educacion/primaria_y_secundaria/2006/04/04/150705.php

37
ausencia de fantasías, y un pensamiento concreto, externamente orientado, fijado al momento y a los fenómenos
externos y observables.
Como parte de diversas investigaciones se desarrollaron test con el propósito de medir este trastorno, uno de
ellos es el denominado SAT-9 (Cohen, Demers-Desrosiers y Catchlove, 1983).
Según la adaptación española, el SAT-9 genera una variable que puede tomar valores de 0 a 209 (ausencia de
alexitimia – máximo grado de alexitimia) y se ajusta a una distribución N(68; 196).

a) ¿Cómo se entiende la expresión “N(68; 196)”?


b) Estandarice la puntuación que obtuvo un paciente al administrarle este test -que fue de 95- e interprete el
resultado.
c) Ayudándose con un gráfico decida cuál de los siguientes resultados diría que es el correcto
c.1- P(X > 80) = 0,805 ó P(X > 80) = 0,195
c.2- P(X < 60) = 0,283 ó P(X < 60) = 0,717
c.3- P(80 < X < 90) = 0,862 ó P(80 < X < 90) = 0,138
d) Para calcular la puntuación mínima en el SAT-9 del 10% de la población más afectada por alexitimia,
d.1- ¿qué fractil debería calcularse?
d.2- ¿Cuál de los siguientes resultados cree que es el correcto?
a- 50,06 b- 68 c- 85,9

6- Al validar una escala de autoeficacia para la prevención del SIDA (Self-Efficacy for AIDS SEA-27) en
adolescentes, ciertos investigadores lo administraron a una muestra aleatoria simple de 964 adolescentes
tomados de 58 centros de salud públicos de Monterrey, México, en febrero de 1998, quienes no iban a consultar
por motivos relacionados con el SIDA. Tuvieron que responder además preguntas cerradas tipo Likert,
dicotómicas y un cuestionario integrado por dos preguntas abiertas sobre aspectos relevantes de la conducta
sexual para validar la escala.
Los investigadores concluyeron que la escala seguía una distribución normal con media de 95,14 y varianza de
665,64. (El texto completo en inglés de este artículo está disponible en: http://www.insp.mx/salud/index.html).
a) Con base en estos hallazgos estime si las probabilidades que plantean a continuación podrían valer 0,50; más
de 0,50 o menos de 0,50:

a.1- ¿Cuál es la probabilidad de que un adolescente mejicano puntúe por encima de 100 en el SEA-27?
a.2- ¿Cuál es la probabilidad de que un adolescente mejicano puntúe por debajo de 70?
b)Para calcular la puntuación en la escala superada sólo por el 5% de adolescentes, ¿qué fractil debería
calcularse?
c)¿Cuáles son las puntuaciones típicas en la escala SEA-27 entre los adolescentes mejicanos?

7- Una universidad privada inició el proceso de autoevaluación institucional y entre otras acciones prevé medir el
grado en que el plan de estudios satisface los requerimientos del mercado laboral según las percepciones de los
recién graduados de informática y los graduados hace 3 años. Las mediciones se realizaron a través de un
cuestionario del que surgía una valoración continua de entre 0= completamente insatisfecho y 20=
completamente satisfecho.
Se comprobó que las puntuaciones en ambos grupos se distribuyen normalmente. Entre los recientemente
graduados el promedio es de 14,7 con una varianza de 8,3 y en el grupo de graduados hace 3 años la media es
de 9,4 con una varianza de 7,2.
a) Si las autoridades estarían complacidas con un grado de satisfacción de por lo menos 13, ¿en cuál de los
grupos es más probable encontrar graduados satisfechos? ¿Diría Ud. que el grado de satisfacción
disminuye con el tiempo?

38
b) ¿Entre los recientemente graduados cuanto puntuó en el cuestionario el 20% menos satisfecho?

8- Suponga que en cierta población de adolescentes el riesgo suicida medido con el Inventario de Ideaciones
Suicidas ISO-30, resulta en una variable normalmente distribuida con un promedio de 35, una varianza de 36 y
desvío de 6. Además los especialistas clasifican en “bajo riesgo suicida” puntuaciones menores a 31; “riesgo
moderado” entre 31 y 44 y “alto riesgo” encima de 45.
a) ¿Qué porcentaje de adolescentes en la población en estudio tienen alto riesgo suicida?
b) ¿Qué porcentaje de adolescentes en la población en estudio presentan bajo riesgo?
c) Al estandarizar el puntaje que obtuvo en el test un adolescente se obtiene un resultado igual a -2 ¿qué le
indica?

9- A través de una evaluación sobre competencias realizada a los docentes de cierta institución, se determinó
que las puntuaciones de competencias genéricas siguen una distribución normal. Su tarea es expresar la
información que muestra el siguiente gráfico en términos de la variable estudiada.
Función de densidad
Normal(3,9,0,36): p(evento)=0,2023
0,7

0,5
Densidad

0,3

0,2

0,0
0,90 2,40 3,90 5,40 6,90
Variable 4,4

10- Los puntajes de una prueba de ingreso a una institución educativa se distribuyen normalmente con promedio
= 65 y desvío estándar = 10. Por otra parte se fijaron las siguientes normas: no ingresan a la institución los
candidatos que obtengan un puntaje inferior a 50; ingresan de manera directa aquellos que obtengan 80 puntos
o más, y el reto deberá completar un curso de nivelación.
a) Orientándose con un gráfico de la campana normal estime qué es más probable:
1- no ingresar a la institución 2- tener que hacer el curso de ingreso
3- ingresar directamente
b) Un candidato obtuvo en el examen de ingreso 85 puntos: estandarice e interprete el resultado obtenido.

11- La edad promedio de inicio en los videojuegos es 12 años (DE = 3,5) para las chicas y 9,5 (DE = 1,7 para los
chicos), ambas con distribución normal.
a) El fractil 15 bajo la normal resultó igual a 8,5 para el grupo de chicas. Represente gráficamente y exprese el
resultado en forma coloquial.
b) Para cada población represente la probabilidad de que un sujeto se inicie en la práctica de los videojuegos
antes de los 10 años. ¿En qué grupo es un suceso más probable?
c) María se inició en los videojuegos a los 9 años y Pablo a la misma edad. ¿Cuál de ellos se inició de manera
más tardía en su grupo de pertenencia?

39
SUMA DE VARIABLES ALEATORIAS Y TEOREMA CENTRAL DEL LÍMITE

Quienes realizan investigaciones cuantitativas diseñando y administrando encuestas o experimentos no pueden


dejar de conocer la existencia y alcance del Teorema Central del Límite y sus aplicaciones.
A esta altura usted ya sabrá que así como hay muchas variables observables en la realidad que siguen el
modelo normal de probabilidad, hay otras que no siguen tal modelo. Sin embargo está demostrado que “si se
combinan linealmente suficientes valores de una variable X no normal con media x x conocidas, se
w w” según reza el
teorema.

Podemos mencionar una aplicación destacada cuando los datos provienen de muestreo o experimentación. Se
relaciona con el promedio muestral x que recordemos es una función de datos muestrales y se calcula
x1  x2  ....  xn
x por lo que resulta en una combinación lineal de n valores de una variable. Así que, si
n
se toman muestras suficientemente grandes los promedios muestrales tenderán a distribuirse normalmente con
 x2
parámetros  x   x y varianza   2
x
, y además la variable estandarizada será
n
x
Z  NE (0;1) .
x
n

Se presentan a continuación algunos ejemplos de aplicación del teorema central del límite.

1- Las calificaciones de los alumnos secundarios en Biología según los registros históricos se distribuyen con
cierta asimetría positiva con una media de 5,3 puntos y una varianza de 2,69 puntos2.
a- En los cursos de 25 estudiantes ¿cuál es la probabilidad de que la nota media sea inferior a 5 ?
b- ¿En qué porcentaje de cursos de Biología, de 25 alumnos, la nota promedio superaría los 6?
c- ¿Cuál es la nota promedio que superarán sólo el 5% de los cursos de 25 alumnos?

2- Los afiliados a cierto servicio médico pagan en promedio 326 $/mensuales con una varianza de 1764 $ 2. Si se
realiza una encuesta sobre satisfacción del servicio a una muestra de 40 afiliados
a- ¿es muy probable o poco probable que la muestra de encuestados estén pagando en promedio actualmente
más de 340$/mes?
b- ¿consideraría estar frente a una muestra inusual o atípica si se calcula que pagan en promedio menos de 300
$/mes?

40
PRÁCTICO 6: PRUEBAS DE HIPOTESIS SELECCIONADAS

La técnica estadística conocida como prueba, test o ensayo de hipótesis es utilizada en investigaciones
científicas con el objetivo de poner a prueba teorías de los más diversos campos de estudio. Su importancia
radica en que a partir de datos muestrales o experimentales es posible generalizar (inferir) las conclusiones a la
población completa mensurando los posibles errores de decisión a través de probabilidades.
Concretamente se trata de una técnica con la que se pone a prueba una suposición o conjetura acerca de
alguna característica de una o más variables medidas en una o más poblaciones. Así, entre otros, los supuestos
pueden realizarse sobre:
- la tendencia central de una variable (promedio poblacional ),
- la variabilidad (varianza poblacional 2),
- el porcentaje de individuos que poseen cierto atributo (proporción poblacional p),
- la asociación de variables,
- la distribución de probabilidad que sigue una variable.

Nótese que los supuestos que realice el investigador sobre los parámetros promedio  varianza o
proporción P, en la práctica no podrán ser verificados con precisión a menos que se lleve a cabo un censo, que
en general resulta imposible concretar. De manera que sólo se contará con estimaciones que se consigan a

partir de muestras. Los estimadores son respectivamente el promedio muestral x ; la varianza muestral S2 y la
proporción muestral de éxitos p̂ .
Para que los resultados puedan ser generalizados a la población de la que se extrajo la muestra ha de tenerse
en cuenta que:
 las observaciones muestrales deben ser aleatorias e independientes,
 según el caso pueden requerirse que la muestra provenga de una población distribuida normalmente.

Hay una gran variedad de test que en principio pueden clasificarse en paramétricos y no paramétricos. Elegir el
test apropiado en cada caso implica identificar y definir:
a) el objetivo del investigador en términos de hipótesis,
b) el tipo de variable observada, respuesta o dependiente (categórica o cuantitativa) y la escala de
medición,
c) el diseño muestral o experimental con el que se obtuvieron los datos, que ha de ser tal que no de lugar
a explicaciones del fenómeno estudiado distintas a la propuesta por el investigador.

Cualquiera sea las prueba de hipótesis, una vez establecida la hipótesis de investigación y definidos los
aspectos metodológicos, se siguen siempre los mismos pasos para su resolución, a saber:
- Establecer las hipótesis estadísticas, nula y alternativa
- Determinar la distribución muestral y la dirección de extremo de la prueba
- Determinar la condición de rechazo de la hipótesis nula

41
- Calcular el valor p para la prueba seleccionada evaluando los datos reunidos en el ensayo
- Extraer la conclusión estadística y en términos de la hipótesis propuesta.

SELECCIÓN DE PRUEBAS DE HIPOTESIS


En el presente curso nos concentraremos en una selección de los test más difundidos.
Al momento de aplicar profesionalmente estas pruebas le aconsejamos que consulte en textos o con expertos
las validaciones previas que requiere cada uno. Estas podrían estar vinculadas a los tamaños muestrales, a la
distribución de la variable respuesta o a la variabilidad de las muestras, entre otras.

PRUEBA T PARA DOS MUESTRAS INDEPENDIENTES


Esta prueba se aplica cuando el investigador desea estudiar la tendencia de una variable dependiente/respuesta
cuantitativa (Y), medida en escala de intervalo o de razón distribuida y normalmente, en función de una variable
independiente/factor con dos niveles, tal que las unidades de análisis clasificadas en cada nivel del factor, son
diferentes, por lo que se tendrán dos muestras independientes. El diseño podría esquematizarse como sigue:
VARIABLE EXPLICATIVA O FACTOR
Categoría 1 Categoría 2
Y11 Y21
Y12 Y22
….. …..
Y1n Y2n

El diseño muestral o experimental da lugar a dos muestras independientes, una para cada nivel del factor o para
cada categoría de la variable independiente. En la siguiente tabla se ilustra este tipo de diseño:
Variable observada/respuesta VI o Factor Categorías o Niveles del factor
Gasto mensual en telefonía celular de cada Sexo Hombres
encuestado (en $, valores de 0 a 1000) Mujeres
Nivel de ansiedad de cada paciente de Tratamiento Sin tratamiento (placebo)
cierto centro de salud (valores de 0 a 100) Con tratamiento
Tiempo transcurrido hasta la remisión de Dosis de un medicamento 5 ml
los síntomas de cada paciente (en horas, 10 ml
de 0 a 12)

El test que permite comparar los promedios de una variable en dos muestras independientes se conoce como
PRUEBA T para muestras independientes.

Ejemplo:
Se desea probar si el desempeño académico en matemáticas de los alumnos universitarios se ve afectado
negativamente en función de su situación laboral.
METODOLOGIA. Se tomó una muestra aleatoria de alumnos que rindieron matemática en el último año. El
desempeño académico se midió a través de la calificación en el examen final de matemática. La situación laboral
se clasificó en dos categorías (Trabajo – No trabaja). Se fija un nivel de significación de 0,05. Los datos
obtenidos se muestran en la tabla 1.

42
TABLA 1: Calificaciones en el examen de matemática según la situación laboral
Grupo No trabaja Grupo Trabaja
8 4
5 5
2 4
7 2
6 8
2 4
5 5
2
6

VD: nota de cada alumno en el examen de matemática.


Tipo de variable y escala: cuantitativa, escala de intervalo. APLICA LA
VI: Situación laboral PRUEBA T PARA
Valores de la variable: Trabaja, No trabaja 2 MUESTRAS
Muestras: dos, independientes. INDEPENDIENTES

Hipótesis de investigación
Hi) El desempeño académico en matemáticas de los alumnos universitarios se ve afectado negativamente en
función de su situación laboral
Predicción en términos de las variables: Si los alumnos trabajan, entonces tendrán un desempeño académico
más deficiente que los que no trabajan.

Hipótesis estadísticas:
En términos del caso de estudio y en forma simbólica
Ho) La situación laboral no afecta negativamente el desempeño en matemática.
notasno trabaja ≤  notas/ trabaja

H1) La situación laboral afecta negativamente el desempeño en matemática.


 notas /no trabaja > notas/ trabaja

DISTRIBUCION MUESTRAL: T DE STUDENT


DIRECCIÓN DE EXTREMO: DERECHA
CONDICIÓN DE RECHAZO: p < nivel de significación 
Procesamiento de la prueba T para calcular el valor p
Estadísticas/Inferencia basada en dos muestras/Prueba T
Seleccionar la variable dependiente y la independiente como criterio de clasificación/Aceptas
En grupos activos clikear sobre el 1er grupo de la hipótesis y seleccionar la dirección de
extremo/Aceptar
Salida del Infostat de la Prueba T para muestras Independientes

Clasif. Grupo 1 Grupo 2 nA nB Media A Media B p-value


Situación lab No trabaja Trabaja 7 9 5,00 4,44 0,6034

Conclusión estadística: dado que p-value > 0,05 no puede rechazarse la hipótesis nula.

Informe final: No hay evidencias de que los estudiantes que no trabajan tengan un mejor desempeño
académico en matemática respecto a los que trabajan (p = 0,6034).

43
NOTA: Interpretación de p-value = 0,6034: es la probabilidad de rechazar equivocadamente la hipótesis nula. En
otras palabras, si la hipótesis nula fuese cierta y aún así el investigador decidiera que el grupo que no trabaja
califica con notas más altas que el grupo que trabaja, podría estar cometiendo un error con probabilidad 0,6034.
Obviamente estaría corriendo un riesgo inaceptable motivo por el cual no debe rechazar la hipótesis nula.

PRUEBA T APAREADA PARA DOS MUESTRAS DEPENDIENTES


Esta prueba se aplica cuando se desea estudiar una variable, cuantitativa en escala al menos de intervalo,
medida en forma repetida –dos veces- sobre las mismas unidades de análisis. El diseño podría esquematizarse
como sigue:
Individuo Condición 1 Condición 2
1 Y11 Y12
2 Y21 Y22
… ….. …..
n Yn1 Yn2

El diseño muestral o experimental da lugar así a dos muestras dependientes. Es de aplicación clásica cuando se
desea probar acuerdo entre dos jueces/técnicas, para determinar la efectividad de tratamientos con un diseño
pre-post test y también aplica en ensayos con diseño test – re test.
Variable observada VI o Factor Categorías o Niveles del factor
Peso de cada paciente (en kg) Tratamiento Sin tratamiento = Inicio
Tratado = Final
Evaluación del sabor de cada Juez A
marca de vino fino (valores de 0 a B
10)

Ejemplo:
Se desea probar si dos docentes que trabajan en cierto instituto de idiomas tienen el mismo criterio de
evaluación.
METODOLOGIA. Cada docente debió evaluar la misma muestra de exámenes. El criterio de evaluación se
determinó a través de la calificación que asignada a cada uno. Los datos relevados son:

CALIFICACIONES DEFINIDAS POR CADA DOCENTE


Examen Docente A Docente B
1 6 6
2 8 7
3 7 9
4 9 9
5 7 8
6 9 10
7 8 9
8 4 2
9 6 5
10 7 7
11 6 6
12 7 7

44
Variable observada: nota de cada examen
Tipo de variable y escala: cuantitativa, escala de intervalo. APLICA LA
VI: Docente PRUEBA T APAREADA
Categorías: A - B PARA 2 MUESTRAS
Muestras: dos, dependientes DEPENDIENTES

Hipótesis de investigación
Hi) ¿Difieren los criterios de evaluación de los docentes?
Predicción en términos de las variables: En idéntica situación, las calificaciones que definen los docentes A y
B son diferentes.

Hipótesis estadísticas:
En términos del caso de estudio y en forma simbólica
Ho) En promedio, las calificaciones que asignan los docentes A y B no difieren significativamente.
H0) X/A – X/B) = 0

H1) En promedio, las calificaciones que asignan los docentes A y B difieren significativamente
H1)X/A – X/B) ǂ 0

DISTRIBUCION MUESTRAL: T DE STUDENT


DIRECCIÓN DE EXTREMO: BILATERAL
CONDICIÓN DE RECHAZO: p < nivel de significación 
Procesamiento de la Prueba T Apareada para calcular el valor p
Estadísticas/Inferencia basada en dos muestras/Prueba T apareada
Seleccionar las variables en el orden en que se desean compara/ Aceptar
Seleccionar la dirección de extremo/Aceptar

Salida del Infostat de la Prueba T para muestras Independientes


Prueba T (muestras apareadas)
Obs(1) Obs(2) N media(dif) Media(1) Media(2) DE(dif) T Bilateral
Docente A Docente B 12 1,75 7,00 5,25 1,22 4,99 0,0004

Conclusión estadística: dado que p-value < 0,05 puede rechazarse la hipótesis nula.

Informe final: hay evidencias de que los docentes A y B difieren significativamente en los criterios de evaluación
(p = 0,0004). Analizando la nota media en cada muestra se observa que el docente A tiende a poner
calificaciones significativamente más altas que B.

PRUEBA CHI-CUADRADO (INDEPENDENCIA/HOMOGENEIDAD)


La Prueba de Independencia se aplica para probar si dos variables categóricas, cuantitativas categorizadas o
discretas, están asociadas. En este caso, la recopilación de datos requiere que se fije el tamaño de muestra
general y luego se procede a clasificar a los individuos en las categorías de las variables en estudio.
La Prueba de Homogeneidad se utiliza para comparar la distribución de frecuencias de la variable dependiente
en los distintos niveles de la variable independiente. Inicialmente entonces, se seleccionan los tamaños de
muestra para cada nivel de la variable independiente.

45
El nombre coloquial Prueba Chi se debe a que en ambos casos, y cumpliéndose los supuestos que exigen estas
pruebas, se aplica en la resolución la distribución de probabilidad Chi-cuadrado, cuya variable estadística es 
El tabulado de los datos dará lugar a una tabla de contingencia que resume la distribución conjunta de las
frecuencias observadas. El procedimiento de la prueba tiene el objetivo de comparar tales frecuencias
observadas con las frecuencias esperadas, teóricas, que se esperarían si fuese cierta la hipótesis nula.

Ejemplo:
Se desea probar si el rendimiento de los alumnos en los cursos de Matemática I difiere según la facultad de
procedencia.
METODOLOGIA: Se tomaron muestras de alumnos de las actas de distintos cursos y se los clasificó según
estuviesen aprobados, desaprobados o hubiesen abandonado la materia en cada facultad de procedencia
obteniendo la siguiente tabla de contingencia:

TABLA DE FRECUENCIAS OBSERVADAS


Facultad Aprobado Desaprobado Abandonó
Ingeniería 47 5 14
Cs. Empresariales 39 12 10
Cs. Sociales 36 19 7

Variable dependiente: rendimiento de cada alumno en cursos de matemática


Tipo de variable: categorizada (aprobó, desaprobó, abandono). APLICA LA
Variable independiente: Facultad PRUEBA DE
Categorías: 3 (ingeniería, empresariales y sociales) HOMOGENEIDAD

Hipótesis de investigación
Hi) ¿ el rendimiento de los alumnos en los cursos de Matemática I difiere según la facultad de procedencia?
Predicción en términos del caso: La distribución de las calificaciones es diferente en cada facultad

Hipótesis estadísticas:
H0) El rendimiento en matemática no difiere según la facultad de procedencia (o en otras palabras, “el
rendimiento en matemática es independiente de la facultad de procedencia”) y las proporciones de aprobados,
desaprobados y abandonos son las mismas en las tres facultades.
paprobar/ingeniería = paprobar/Cs. empresariales = paprobar/Cs. sociales
pdesaprobar/ingeniería = pdesaprobar/Cs. empresariales = pdesaprobar/Cs. sociales
pabandonar/ingeniería = pabandonar/Cs. empresariales = pabandonar/Cs. sociales

H1) El rendimiento en matemática difiere según la facultad de procedencia (o en otras palabras, “el rendimiento
en matemática depende de la facultad de procedencia”) y alguna proporción de aprobados, desaprobados o
abandonos es diferente en alguna facultad.

DISTRIBUCION DE PROBABILIDAD: CHI-CUADRADO


DIRECCIÓN DE EXTREMO: DERECHA (SIEMPRE)
CONDICIÓN DE RECHAZO: p < nivel de significación 

Procesamiento en el Infostat:

Estadísticas/Datos categorizados/Tablas de contingencia

46
Seleccione las variables como criterios de clasificación/Aceptar
Indique qué variable se dispondrá en las columnas y cuál en las filas.
En la solapa “Opciones” seleccione las 5 primeras tablas/Aceptar.

Estadístico Valor gl p
Chi Cuadrado Pearson 11,73 4 0,0195

Validación: en primer lugar observe la tabla de frecuencias esperadas (la transcribimos a continuación). Para
que la prueba sea válida no más del 20% de las frecuencias esperadas debe ser inferior a 5. Esta prueba
también requiere que la muestra sea de tamaño 40 o superior.
En el ejemplo no hay frecuencias esperadas menores a 5 y la muestra es de 185 por lo que se puede continuar.
En columnas:Rendimiento
Facultad Abandonó Aprobado Desaprobado Total
Cs Empresariales 10,01 39,38 11,62 61,00
Cs Sociales 10,17 40,02 11,81 62,00
Ingenieria 10,83 42,60 12,57 66,00
Total 31,00 122,00 36,00 189,00

Conclusión estadística: dado que p-value = 0,0195 < 0,05 hay evidencias para rechazar la hipótesis nula.

Informe final: la evidencia indica que el rendimiento en matemática difiere significativamente según la facultad
de procedencia (p= 0,0195).
En virtud de la conclusión es recomendable profundizar el análisis con el objetivo de determinar en qué sentido
ocurren las diferencias, para lo cual se requiere estudiar con detalle la tabla de frecuencias relativas a la facultad.

En columnas:RENDIMIENTO
Aprobado Abandonó Desaprobado Total
Cs. Empresariales 64,0% 16,0% 20,0% 100,0%
Cs. Sociales 58,0% 11,0% 31,0% 100,0%
Ingeniería 71,0% 21,0% 8,0% 100,0%
Total 65,0% 16,0% 19,0% 100,0%

O gráficamente:
100%

80%
% de estudiantes

60%

40%

20%

0%
Cs. Cs. Sociales Ingeniería
Empresariales

Aprobado Abandonó Desaprobado

En todas las facultades se observa que lo más frecuente es que los estudiantes aprueben, destacándose la
facultad de Ingeniería con un 71% de aprobados entre los que participaron en la muestra. Así mismo, en la
facultad de Ingeniería resultó mucho mayor el porcentaje de abandono que de desaprobados.
Resalta también el hecho que la facultad de Cs. Sociales es la que menor porcentaje de aprobados revela, así
como el mayor porcentaje de desaprobados respecto a las otras facultades.

47
PRÁCTICA PROPUESTA

1- En cierta fábrica metalúrgica se proponen determinar si es recomendable la incorporación de jóvenes en


nuevas contrataciones de personal por ser éstos más eficientes que los de más edad.
METODOLOGIA. Se tomó una muestra de operarios y se los clasificó según su edad (grupo jóvenes= hasta 30
años; grupo mayores = más de 30 años). Todos realizaron la misma tarea tres veces y se anotó el mejor tiempo
(en minutos) en que cada uno completó la tarea obteniendo los siguientes datos:
Velocidad (en minutos)
Grupo Jóvenes 28 35 26 42 33
Grupo Mayores 34 22 25 37 37 39 41 29

a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,


discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,4796 ¿Qué concluye?

2- Como producto de una encuesta a un grupo de adolescentes a los que se les pidió que indicaran a su juicio el
grado de rigidez de la disciplina materna según la escala 1= rígida; 2= justamente tolerante; 3= muy tolerante, se
obtuvo la siguiente tabla:
Grado de Rigidez
Sexo Rígida Justamente Muy tolerante Total
tolerante
Muchachas 140 170 80 390
Muchachos 93 160 135 388

Se desea probar si la percepción del grado de rigidez de la disciplina materna difiere según el sexo del hijo (nivel
de significación = 0,05).
a) Identifique la hipótesis de investigación, la variable dependiente y clasifíquela (categórica, discreta,
continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,0001 ¿Qué concluye?

3- La educación es el medio preventivo por excelencia para identificar precozmente personas que puedan estar
adoptando factores de riesgo para sufrir algún tipo de trastorno o enfermedad en el futuro.
Se llevó a cabo una intervención educativa orientada a la prevención de padecer hipertensión arterial. Participó
una muestra intencionada de estudiantes universitarios, de entre 18 y 25 años, quienes asistieron a 5 charlas
sobre factores de riesgo de la patología hipertensiva.
Los participantes pertenecían a distintas facultades: 89 a Medicina, 25 a Psicología, 50 a Ingeniería y 24 a
Educación.
Se realizó un test antes de la primera charla y uno al finalizar la intervención. En cada test se midió el grado de
conocimiento acerca del tema asignando un punto por cada respuesta correcta.

48
Hipótesis 1: La intervención educativa tiene efecto positivo en el conocimiento. (nivel de significación = 0,05).
Hipótesis 2: el efecto de la intervención educativa se asocia a la tipo de formación (o sea a la facultad de origen).
En este caso se clasificó a los estudiantes según los resultados de los test (adquirió nuevo conocimiento, no
adquirió nuevo conocimiento).

Para cada hipótesis:


a) Identifique la hipótesis de investigación, la variable dependiente y clasifíquela (categórica, discreta, continua);
también variable independiente o factor y sus niveles. Determine la prueba estadística aplicable. Fije las
hipótesis nula y alternativa en términos del caso y simbólicamente. Determine la dirección de extremo de la
prueba y la condición de rechazo.
b) A un nivel de significación de 5% concluya sabiendo que el valor p para la hipótesis 1) resultó 0,004 y para la
hipótesis 2) resultó 0,063.

4- Se realizó un estudio prospectivo en pacientes beneficiarias del sistema de atención primaria que acudían a
sus controles habituales postparto. Los internos de medicina acompañados por matrona o enfermera realizaron
una entrevista a aquellas mujeres que se encontraban entre el quinto o sexto mes postparto registrando si la
paciente tenía o no antecedentes personales o familiares (de primer grado) de depresión y si presentaba en ese
momento síntomas de depresión postparto. Se conjetura que la presencia de depresión postparto se asocia con
los antecedentes personales o familiares de depresión.
Se obtuvieron los datos que siguen.
CONTROL POSTPARTO
Antecedente_depresion DEPRESIVA NO DEPRESIVA Total
CON ANTECEDENTES 50 27 77
SIN ANTECEDENTES 16 44 60

a) Identifique la hipótesis de investigación, la variable dependiente y clasifíquela (categórica, discreta,


continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,002 ¿Qué concluye?

5- Con el objetivo de determinar la efectividad de un antidepresivo se seleccionó un grupo de pacientes -


hombres y mujeres de entre 50 y 60 años- que habían puntuado 7 o más en una prueba estandarizada que
puntúa de 0 = sin depresión a 10 = depresión severa.
Al azar se los dividió en dos grupos: a) grupo control: se les administró un placebo; b) grupo tratado: se les
administró el antidepresivo en dosis iguales para todos los individuos. Luego de dos meses volvió a realizarse la
prueba estandarizada.
a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,
discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,086 ¿Qué concluye?

49
6- Para determinar si la satisfacción laboral de los empleados se relaciona con el estilo de liderazgo es una
variable que se seleccionaron dos compañías telefónicas cuyos CEOs tenían estilos diferentes. El CEO de la
compañía A pone énfasis principalmente en la productividad y eficacia; mientras que el CEO de la compañía B
se preocupa sobre todo en el bienestar del personal a su cargo de manera que prioriza a las personas.
En cada compañía se eligieron al azar 10 empleados a los que se administró un cuestionario elaborado en
escala de Likert (0= “completamente insatisfecho” a 5 = “completamente satisfecho”) que consta de 12
proposiciones orientadas a medir el grado de satisfacción laboral. El puntaje global de satisfacción se obtiene
como promedio de las respuestas a cada ítem del cuestionario.

a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,


discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,026 ¿Qué concluye? ¿Sobre qué individuos generaliza su conclusión?
e) ¿Cuáles serían las hipótesis estadísticas si el investigador sospecha que los empleados tienden a estar
más satisfechos si el CEO se preocupa por el bienestar del personal más que por la productividad?

7- (Fuente: http://ar.news.yahoo.com/060228/32/p7t2.html y Diario CLARIN – 15-3-06)


“El insomnio, más que una enfermedad, es un síntoma caracterizado por una inadecuada cantidad y calidad del
sueño. Los que lo sufren se despiertan con frecuencia a la noche o demasiado temprano o se duermen
demasiado tarde. Cuando se levantan siempre tienen la sensación de un sueño insuficiente y no reparador”,
define Edgardo Rhodius, jefe del Servicio de Neumonología del Hospital Alemán y director asociado de la carrera
de Médicos Especialistas en Neumonología de la UBA. … El mal dormir, tiene consecuencias en el plano físico,
intelectual y emocional…”
“Un equipo liderado por Virginia Godet-Cayre, del Centro de Investigación de Economía Sanitaria, en Francia,
dio seguimiento a las historias laborales de 369 trabajadores con insomnio y a las de otros 369 trabajadores sin
problemas de sueño…y publicaron un informe en la revista especializada Sleep” con los resultados que
obtuvieron al vincular el insomnio con las ausencias en el trabajo durante un período de dos años. En la tabla
que sigue reconstruimos la información recopilada por la investigadora:

En dos años… Grupo de los que sufren Grupo de los que no sufren
insomnio insomnio
Nunca faltaron al trabajo 184 244
Faltaron al trabajo al menos una vez 185 125
¿Qué conclusión habrán obtenido los investigadores respecto al efecto del insomnio en el ámbito laboral?

a) Identifique la hipótesis de investigación, la variable dependiente y clasifíquela (categórica, discreta,


continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,05 y procesada la prueba correspondiente se obtuvo un p-value =
0,0001 ¿Qué concluye?

50
8- Se desea probar la hipótesis que los pacientes esquizofrénicos perciben la crianza con mayor distancia y
frialdad emocional que los sujetos mentalmente sanos. Para ello se administró el Inventario de Evaluación del
Vínculo Parental a una muestra de sujetos esquizofrénicos y otra de individuos sanos. El inventario evalúa entre
otras cosas la distancia y frialdad emocional percibida por el sujeto respecto del padre y de la madre. Puede
tomar valores continuos entre 0 y 3 y se interpreta que valores mayores indican mayor distancia o mayor frialdad
emocional percibidas
a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,
discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Concluya a un nivel de significación de 0,01 según los resultados que se indican a continuación.
Distancia y frialdad emocional paterna P – value = 0,03
Distancia y frialdad emocional materna P – value = 0,00

9- Se realizó una investigación con el objetivo de determinar si los exámenes orales son estresantes. Dado que
el estrés es un conjunto de cambios orgánicos que se producen como respuesta del organismo a estímulos
nocivos, se decidió considerar como medida de estrés la presión arterial de los mismos estudiantes en dos
situaciones diferentes: durante el desarrollo de un trabajo práctico (situación común para el estudiante) y
momentos previos a rendir un examen final en forma oral.
Participaron de la experiencia una muestra de alumnos de segundo año de la Facultad de Odontología de la
Universidad Nacional de Tucumán que cursaban la materia Fisiología, cuyas edades oscilaban entre 18 y 32
años, sin antecedentes hereditarios de hipertensión arterial.
Se fijó un nivel de significación de 0,05.
a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,
discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Procesada la prueba correspondiente se obtuvo un p-value = 0,003 ¿Qué concluye?

10- Con el propósito de estudiar el nivel de satisfacción laboral de las enfermeras de los hospitales públicos y
privados de cierta provincia de Chile e identificar algunos factores relacionados con esta satisfacción, se llevó a
cabo una investigación a través de encuestas a 147 enfermeras de hospitales públicos y 101 de hospitales
privados. El nivel de satisfacción se midió en una escala de 0 a 1, donde mayores valores indican mayor
satisfacción.

51
1

0,75

Promedio
0,5

a) Interprete el gráfico de la derecha 0,25

Iluminación

Temperatura
Limpieza

Riesgo
Ruidos

Seguridad
Hospital Público Hospital Privado

b) Para probar si las enfermeras de hospitales públicos tienen un nivel de satisfacción asociado a los riesgos
del trabajo significativamente más bajo que las enfermeras de centros privados se decide realizar una
prueba de hipótesis.
b.1- ¿Qué prueba aconsejaría usted aplicar? Fije las hipótesis nula y alternativa y la condición de
rechazo.
b.2- Si se fija un nivel de significación de 0,05 y se obtuvo un p-value = 0,26 ¿Cuál sería su conclusión?
b.3- El gráfico que usted analizó en el ítem a) sugiere la misma conclusión de la prueba de hipótesis?

11- Un grupo de investigadores diseñó un instrumento con el objetivo de obtener información sobre la evaluación
que hacen los adolescentes de los eventos estresantes que les ocurren. El instrumento valora los eventos
estresantes en diversas áreas como la familia y la escuela, en una escala numérica de 0 a 10. Se fijó un nivel de
significación = 0,05.
Para determinar si el instrumento es estable en el tiempo, es decir que los sujetos responden siempre lo mismo
en distintas ocasiones en que se les administra el cuestionario, se realizaron dos mediciones a una muestra de
104 adolescentes mejicanos con diferencia de 15 días –procedimiento denominado test-retest.
a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela; también
variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) ¿Cuál habrá sido la conclusión de los investigadores si p-value = 0,35?

12- Se llevó a cabo un estudio con el objetivo de evaluar la efectividad del programa "Cuidando a los
cuidadores", diseñado para fortalecer la habilidad de cuidado de cuidadores familiares de personas con
enfermedad crónica. Para ello se realizó un cuasiexperimento con 125 cuidadores voluntarios que cumplían
funciones de cuidado de un familiar con enfermedad crónica. Los mismos participaron del programa “Cuidando a
los cuidadores” de 10 semanas de duración organizado con material audiovisual y escrito.
La medición inicial y final de la habilidad del cuidador familiar para cuidar se realizó con el inventario de habilidad
de cuidado, CAI®, que mide tres tipos de habilidad: conocimiento, valor y paciencia. Las mediciones se realizan
en una escala numérica continua y los puntajes se interpretan como que a mayor puntaje, mayor habilidad.
Se procesó una prueba para cada dimensión y los valores p se indican seguidamente:

52
Dimensión p-value
Conocimiento 0,005
Valor 0,446
Paciencia 0,262

Seleccione una de las dimensiones y dé respuesta a las siguientes cuestiones:


a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela (categórica,
discreta, continua); también variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente. Determine la dirección de extremo de la prueba y la condición de rechazo.
c) Extraiga la conclusión a un nivel de significación de 0,05.
d) ¿Las conclusiones son similares para las otras dimensiones?

13- Con el objetivo de definir intervenciones apropiadas para ayudar a los policías a afrontar un trabajo tan
estresante, se llevó a cabo una investigación en la que participaron 115 policías en actividad, de ambos sexos. Se
los consultó acerca de la frecuencia con que tenían pensamientos suicidas (nunca/rara vez, frecuentemente) y
además se registró el sexo del sujeto con el objetivo de probar si la frecuencia de ideaciones suicidas se asocian
al género.
a) Identifique la hipótesis de investigación, la variable dependiente y clasifíquela; también variable
independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente. Determine la dirección de extremo de la prueba y la condición de rechazo.
c) Extraiga la conclusión a un nivel de significación de 0,05 sabiendo que p-value = 0,367.
d) Con el objetivo de probar si la prevalencia de ideas suicidas (en las categorías a- nunca o rara vez y b-
frecuentemente) difiere según se trate de civiles o personal de la fuerza policial, se procesará la prueba
de hipótesis correspondiente.
d.1- Identifique las variables y clasifíquelas. Identifique la prueba
d.2- Establezca las hipótesis nula y alternativa y la condición de rechazo.
d.3- procesada la prueba se obtuvo un valor p = 0,0206: ¿Cuál es la conclusión?

14- Las creencias adictivas son un factor importante tanto en los trastornos por abuso de drogas como en su
tratamiento. Se pueden distinguir distintos tipos de creencias adictivas, una de ellos denominadas “creencias
anticipatorias” hacen referencia a las expectativas de recompensa.
Se administró el test de Wright y Beck para la evaluación de las creencias adictivas a una muestra de 21 sujetos
que iniciaron un tratamiento para las adicciones y otros 19 sujetos que no tiene una relación explicita con la
drogadicción, con el objetivo de probar el supuesto de que los adictos tienen creencias anticipatorias más
arraigadas. El test puntúa entre 0 y 7 correspondiendo los puntajes mayores a creencias más arraigadas. Las
medidas descriptivas obtenidas son las siguientes:
Grupo 1: en Grupo 2: sin relación
tratamiento con drogadicción
Promedio 5,3 3,1
Desvío 0,22 0,17

53
a) Identifique la hipótesis de investigación/predicción, la variable dependiente y clasifíquela; también
variable independiente o factor y sus niveles.
b) Determine la prueba estadística aplicable. Fije las hipótesis nula y alternativa en términos del caso y
simbólicamente.
c) Determine la dirección de extremo de la prueba y la condición de rechazo.
d) Se fijó un nivel de significación = 0,01 y se obtuvo un p-value= 0,002. Extraiga la conclusión.

15- Un grupo de profesionales se interesaron en probar la eficacia de la “Intervención en Adolescentes con Fobia
Social” (IAFS). Se trata de un tratamiento que incluye 12 sesiones grupales semanales y exposiciones
programadas con individuos de ambos sexos orientadas al entrenamiento de habilidades sociales.
Los profesionales optaron por diseñar un experimento que consistió en dividir en dos grupos a 34 adolescentes
voluntarios con similares niveles de fobia. Uno de los grupos fue sometido al tratamiento, mientras que el otro
permaneció en lista de espera. Finalmente con el test estandarizado SPAI se midió el grado de fobia. Este test
puntúa entre 0 y 200 y los valores numéricos se interpretan como mayor grado de fobia cuanto mayor el puntaje.
Los resultados fueron los siguientes:
Resumen descriptivo Grupo tratado Grupo en lista de espera
Media 64,3 126,8
Desvío estándar 28,1 18,3
CV 43% 14%

a) ¿Qué sugieren los promedios de los grupos en relación al tratamiento? ¿Qué sugiere el CV mayor del
grupo tratado en relación al tratamiento?
b) Los investigadores desean realizar la prueba de hipótesis correspondiente.
b.1- ¿Qué prueba deberían procesar? Explique el porqué de su recomendación.
b.2- Fije las hipótesis de investigación/predicción, la nula y la alternativa. Si el tratamiento es eficaz
¿qué resultados esperaría observar en el test SPAI?
b.3- Procesada la prueba se obtuvo p-value = 0,0001 ¿Cuál es la conclusión finalmente?

16- Completando el análisis del caso de estudio “TOLERANCIA Y ADOLESCENCIA. EDAD, GÉNERO Y
NACIONALIDAD: ANÁLISIS COMPARATIVO”, realice el análisis de datos y el informe de resultados con las
respectivas pruebas de hipótesis.

54
PRÁCTICO 7: ANALISIS DE CORRELACIÓN

ANALISIS DE CORRELACION

INTRODUCCION
La Estadística Descriptiva brinda herramientas para caracterizar la distribución de una variable (media,
variabilidad, etc.), pero con frecuencia el investigador necesita determinar si los datos de una distribución se
relacionan con los datos de otra. Por ejemplo, la persona encargada del departamento de recursos humanos en
una gran empresa podría estar interesada en ver si existe una relación entre las calificaciones obtenidas en la
universidad por los empleados y su éxito en la compañía. Si en verdad existe una relación fuerte entre estas dos
variables, las calificaciones en la universidad se podrían utilizar para predecir el éxito en la empresa, y por lo
tanto esta información sería muy útil en la selección de posibles empleados.
Otro uso importante de la correlación es la determinación de la “confiabilidad test-retest” de los instrumentos de
evaluación. La confiabilidad test-retest significa que existe consistencia en los puntajes obtenidos por los
individuos en administraciones repetidas de la prueba. Por ejemplo, suponiendo que el CI (o IQ por su sigla en
inglés) de un individuo permanece estable de un mes a otro, esperaríamos que una buena prueba de CI
mostrara una relación fuerte entre los puntajes obtenidos por el mismo individuo en dos administraciones de la
prueba, realizadas con un mes de diferencia. Las técnicas correlacionales nos permiten cuantificar la relación
entre los puntajes obtenidos en las dos administraciones.
Para comenzar el estudio de la correlación entre variables es útil representar la gráfica de dispersión o
dispersograma. Los siguientes gráficos muestran distintos tipos de asociación: varían en su forma, intensidad y
sentido.

FIGURA 1 FIGURA 2

20 20
15 15
Y 10 Y 10
5 5
0 0
0 20 40 60 0 20 40 60
X X

FIGURA 3

20
15
Y
10
5
0
0 20 40 60
X

55
La asociación entre variables puede ser lineal (figuras 1, 2) o curvilínea (figura 4). En nuestro caso nos
ocuparemos de la correlación lineal.

Además, la relación entre variables podría ser positiva o negativa. La dirección de la asociación entre dos
variables es positiva o directa cuando al crecer una variable, también crece la otra (figura 1, X: peso e Y:
estatura). La dirección de la asociación entre dos variables es negativa o inversa cuando al crecer una variable,
la otra disminuye (figura 2: X: cantidad inasistencias e Y: calificación del examen).
Por otra parte, la relación lineal entre variables podría ser perfecta o imperfecta. La relación es perfecta cuando
todos los puntos del dispersograma forman una línea recta (figura 1). Este tipo de relación es muy poco usual en
las ciencias del comportamiento, lo más común es encontrar relaciones imperfectas en las que los puntos no
caen sobre una recta (figuras 2 y 3).

La correlación se ocupa de establecer la magnitud y la dirección de la relación entre dos


variables x e y a través de un coeficiente: el coeficiente de correlación.

COEFICIENTE DE CORRELACION LINEAL r DE PEARSON


Se trata de uno de los coeficientes más utilizados. Se lo calcula sobre variables cuantitativas relacionadas
linealmente.
La r de Pearson es una medida de la forma en la que parejas de datos ocupan posiciones iguales u opuestas
dentro de sus propias distribuciones. Tales posiciones se determinan mediante los puntajes Z.
Si las parejas de datos ocupan la misma posición relativa dentro de sus propias distribuciones (Z iguales),
entonces la correlación debe ser perfecta (r = 1) y conocer uno de los valores de la pareja de datos nos permite
predecir de manera exacta el valor de la otra variable. Si la predicción es perfecta, la relación debe ser también
perfecta.
Supongamos datos de dos variables x e y para n individuos, cada una con su propia unidad de medida, por
ejemplo X: peso en kilos e Y: estatura en metros. La distribución de valores de x puede describirse con su media

 
y su desvío x; S x , y por su parte la distribución de valores de y se caracteriza por su propia media y desvío

y; S . Dadas las escalas tan diferentes de las variables, la transformación Z permitiría colocar a ambas
y

variables en la misma escala y el coeficiente de correlación queda definido como:

1  x  x  y  y 
r   
n  1  S x  S y 

INTERPRETACION DEL COEFICIENTE DE CORRELACION r DE PEARSON


- La correlación no hace ninguna distinción entre variables explicativas y variables respuesta. Cualquier
variable puede ser X y cualquiera puede ser Y.

56
- La correlación de Pearson exige que las dos variables sean cuantitativas (hay otros coeficientes de
asociación para variables categóricas).
- La correlación no tiene unidad de medida, es sólo un número.
- Si r resulta positiva, la asociación entre las variables es positiva o directa (figura 1). Si r resulta negativa,
la asociación entre las variables es negativa o inversa (figura 2).
- La correlación r siempre toma valores entre -1 y +1. Valores cercanos a cero indican una relación lineal
muy débil (figura 3). La fuerza de la relación lineal aumenta a medida que r se aleja de 0 y se acerca a 1
o a -1. Los valores iguales a -1 o 1indican correlación perfecta.
- La correlación se ve fuertemente afectada por unas pocas observaciones atípicas. En presencia de
observaciones atípicas en el diagrama de dispersión, r se debe utilizar con precaución.
- Para la interpretación de r puede orientarse con la siguiente tabla. Las barras de módulo indican que la
interpretación vale tanto para valores positivos como negativos del coeficiente.

Coef. de correlación Asociación

>| 0,70| fuerte a intensa

|0,50| a |0,69| sustancial

|0,30| a |0,49| moderada

|0,10| a |0,29| baja

|0,01| a |0,09| despreciable


Las variables son independientes o no se
0
relacionan linealmente

CORRELACIÓN NO IMPLICA CUASALIDAD


Cuando existe una correlación entre dos variables, resulta tentador concluir que una de ellas es la causa de la
otra. Sin embargo, podría ser un grave error sin antes haber investigado más a fondo la naturaleza de la
relación, pues que dos variables estén correlacionadas, podría deberse a alguna de las siguientes situaciones:
1) la correlación entre X e Y es espuria, es decir, la correlación exhibida por la muestra se debe a
accidentes del muestreo o comportamientos inusuales que no volverían a ocurrir si se repitiese el
ensayo.
2) Una tercera variable es la causa de la correlación entre X e Y. Si el salario docente y el precio de la
leche están fuerte y positivamente correlacionados, claramente no podría concluirse que los aumentos
en el precio de la leche se deben a los mayores ingresos de los docentes. El tercer factor responsable
de aumentos de salarios y de precios es la inflación!
3) X es la causa de Y o bien Y es la causa de X. Estas relaciones causales sólo pueden determinarse en
un experimento en el cual variemos de manera sistemática sólo la variable posiblemente causal y medir
su efecto sobre la otra variable.

57
EJEMPLO:
Se desea estudiar la asociación entre X: Cociente intelectual e Y: Nota media de calificaciones en la carrera
universitaria. Los datos obtenidos en un muestra aleatoria de sujetos se muestran más abajo.
Estudiante CI Calificación 8,78

1 110 5
2 112 5,5
7,79
3 118 6,1
4 119 6,4

Calificacion
5 122 6,8 6,80
6 125 7
7 127 6,9
8 130 7,2 5,81

9 132 7,5
10 134 7,9
4,82
11 136 8 108,60 116,30 124,00 131,70 139,40
12 138 8,6 CI

El coeficiente de correlación de Pearson puede obtenerse con el Infostat:


Estadísticas/Análisis de correlación/coeficientes de correlación/Pearson/Aceptar
En la salida con formato matricial el resultado es el siguiente:
Coeficientes de correlación

Correlación de Pearson: Coeficientes\probabilidades

CI Calificacion
CI 1,00 7,0E-09
Calificacion 0,98 1,00

El coeficiente de correlación r resultó igual a +0,98.


Se interpreta que el cociente intelectual y la nota media de la carrera correlacionan fuertemente en sentido
positivo, es decir que altos CI se presentan sistemáticamente en sujetos con calificaciones altas y bajos CI se
asocian con calificaciones bajas.

EJERCICIOS PROPUESTOS
1- Interprete la asociación entre dos variables sobre los resultados que se muestran a continuación.
a) r = 0,85 b) r = - 0,59 c) r = 0,37 d) r = - 0,12

2- Sobre las muestras de datos representadas en las figuras 1, 2 y 3 se calculó el coeficiente de correlación de
Pearson. Los resultados obtenidos fueron -0,88; 0,22 y 0,92: relacione los valores numéricos con el gráfico
correspondiente. ¿Qué figura muestra la correlación más fuerte y cuál la más débil?

58
FIGURA 1 FIGURA 2 FIGURA 3
r = ……. r = ……. r = …….
20 20 20
15 15 15
10
Y

10

Y
10
5 5 5
0 0 0
0 20 40 60 0 20 40 60 0 20 40 60
X X X

3- Con el objetivo de aportar elementos metodológicos para el entrenamiento psicológico de los patinadores
durante la iniciación deportiva se llevó a cabo una experiencia con una muestra de niños de entre 9 y 13 años.
Durante un período los niños fueron capacitados con técnicas psicológicas de visualización y relajación inducida
por la palabra y al finalizar el entrenamiento se los sometió a una prueba de rendimiento en la que se registró el
tiempo (en segundos) que tardaron en recorrer 10 metros en patines. Además se registró el número de sesiones
de entrenamiento a las que asistió cada uno obteniendo los siguientes datos:

CANTIDAD DE
TIEMPO SESIONES
2,22 13
2,25 12
2,33 12
2,4 11
2,42 11
2,54 12
2,79 10
2,8 10
2,81 9

Interprete el coeficiente r de Pearson


Correlacion de Pearson: coeficientes\probabilidades

TIEMPO EDAD
TIEMPO 1,00 p= 0,003
EDAD r= -0,89 1,00

4- Con el fin de analizar el grado de asociación entre el descanso (medido en horas de sueño, Xmin= 0 ; Xmax = 10)
y la capacidad de respuesta a un imprevisto (medido en segundos hasta la reacción a un estímulo) se realizaron
mediciones a un grupo de sujetos: el procesamiento de los datos ofreció los siguientes resultados:
Análisis de correlación:

HORAS TIEMPO
HORAS 1,00 < 0,0001
TIEMPO -0,96 1,00

Interprete el coeficiente de correlación.

5- Como parte de un estudio sobre “Hábitos de vida saludable” se encuestaron 45 individuos a los que se
preguntó:
“¿Cuántas horas semanales dedica a hacer alguna actividad física?”
“¿Qué cantidad de líquido sin alcohol aproximadamente toma por día (en litros)?”

59
Analizadas las respuestas a través de un análisis de regresión en el que se definieron las variables
X1 = cantidad de líquido sin alcohol que toma aprox. por día
X2 = horas semanales que dedica a hacer alguna actividad física
Se desea estudiar el grado de asociación entre X1 y X2.
Análisis de correlación:

TIEMPO DEPORTE CONSUMO LIQUIDO


TIEMPO DEPORTE 1,00 0,00
CONSUMO LIQUIDO 0,87 1,00

a) Identifique las variables e identifique la escala de medición.


b) Confeccione el informe del análisis de correlación.

6- El trastorno de estrés postraumático (EPT) es un trastorno de ansiedad, que surge después de que una
persona pasa por un evento traumático que le causó pavor o por haber presenciado o saber de un acto violento
o trágico. Las manifestaciones son la repetición de la vivencia; evasión y aumento de excitación emocional que
pueden perseverar hasta meses o años. En virtud de que esta situación es especialmente peligrosa si se
presenta en profesionales de la policía o del ejército, se realizó un estudio entre 130 policías en actividad en el
que se calcularon las siguientes correlaciones de Pearson
Edad Vs Percepción de peligro; r = 0.05
Estrés vs Edad; r = - 0,20
Tiempo de duración del malestar vs Tiempo transcurrido del suceso estresor; r = 0,59
a) Explique porqué se aplicó el coeficiente de Pearson en esta investigación e interprete los resultados
obtenidos.
b) Confeccione el informe con las conclusiones del caso.

7- Se llevó a cabo una investigación con el objetivo de conocer la relación que existe entre la autoestima y el
compromiso organizacional de los trabajadores administrativos de una empresa del rubro alimenticio.
Participaron de la misma 28 empleados seleccionados al azar a los que se les aplicó el Inventario de
Autoestima-ALPEL y el cuestionario de Compromiso Organizacional.
El primero arroja puntajes numéricos y se interpreta una mayor autoestima cuanto mayor el puntaje obtenido en
el inventario.
El compromiso de los trabajadores con la organización se evaluó en tres dimensiones: compromiso afectivo,
sentimiento de pertenencia y compromiso con el trabajo. Mayores valores en cada una de las dimensiones
indican un mayor nivel de compromiso.
Un análisis exploratorio mostró que las variables no se distribuyen normalmente.
El análisis de correlación entre la autoestima y las dimensiones del compromiso organizacional arrojaron los
resultados que se muestran a continuación.

Variables Coef. de correlación


Autoestima- compromiso afectivo 0,132
Autoestima- sentimiento de pertenencia 0,174
Autoestima- compromiso con el trabajo 0,457

Confeccione el informe con las conclusiones del caso.

60
PRÁCTICO 8: ANALISIS DE REGRESIÓN

El Análisis de Regresión simple y lineal estudia la relacional funcional entre dos variables X e Y, donde la
variable Y se denomina variable dependiente y la X regresora o variable independiente.
La variable dependiente es la que el investigador desea explicar. La variable independiente o regresora o criterio,
es la que se espera explique el cambio de la variable dependiente.

Si la relación entre las variables es lineal, la predicción se realizará calculando la denominada recta de regresión
o de mínimos cuadrados basándose en datos muestrales, cuya expresión es:

y = a + bx

donde:
 y = es el valor esperado de la variable dependiente;
 a = es la ordenada al origen. Mide el valor esperado de la variable “Y” cuando “X” es igual a cero, y no
siempre tiene interpretación.
 b = es el coeficiente de regresión (o pendiente). Mide la variación positiva o negativa de la variable “Y”
ante incrementos unitarios en la variable “X”; o dicho en otras palabras, es la variación marginal de la
variable dependiente.
 x = es la variable independiente.
Uno de los procedimientos para verificar si las variables se relacionan linealmente consiste en calcular el
coeficiente de determinación R2. Este coeficiente puede tomar valores entre 0 y 1: cuanto más cercano a 1,
mejor es el ajuste de la recta; cuanto más cercano a 0 peor es.
Consideraremos el siguiente criterio: S i R2 > 0,5 el modelo lineal es válido y apto para predecir.
En estudios longitudinales en los que se analiza la evolución de una variable a través del tiempo (en períodos
regulares) puede aplicarse también el modelo lineal de regresión si se verifican los supuestos correspondientes.
En esta aplicación particular la variable independiente es el tiempo –que simbolizaremos “t”- y la ecuación de la
recta puede escribirse como: Y = a + bt
En ocasiones es necesario codificar a la variable temporal con una numeración correlativa (1; 2; …. O bien 0; 1;
2; 3…). Ha de tenerse en cuenta que la ordenada “a” en general no se interpreta siendo el coeficiente de
regresión el que resulta más informativo.

PRÁCTICA PROPUESTA

1- Entre los siguientes pares de variables identifique cuál es la variable independiente o regresora (X) y cuál la
dependiente (Y).
a) Número de errores de tipeo en una página; Duración del entrenamiento en dactilografía

61
b) Tiempo (en minutos) hasta la normalización de la presión arterial; dosis de un medicamento inyectable para la
presión.
c) Peso (en kilos); estatura (en centímetros).
d) Cantidad de plantas parasitadas en un invernadero; cantidad de antiparasitario aplicado (en litros).
e) Tiempo dedicado a actividades deportivas (en horas semanales); Nivel de estrés (escala de 10 a 50, valores
mayores indican más estrés).
f) Alumnos inscriptos en una institución educativa; año.

2- Para los pares de variables de la actividad anterior se calcularon las respectivas rectas de regresión. Su tarea
es interpretar los coeficientes de la recta de mínimos cuadrados o de regresión.
a)
Duración de un entrenamiento en dactilografía (en horas, Xmin= 1; Xmax= 30)
Y = 11,9 – 0,3 x
Y: Número de errores de tipeo en una página

b)
Dosis de un medicamento inyectable para la presión (Xmin=1 ml; Xmax= 5 ml).
Y = 55 - 8X
Y= Tiempo (en minutos) hasta la normalización de la presión arterial

c)
Estatura (en centímetros, Xmin= 155; Xmax= 180)
Y= Peso (en kilos) y = -103 + 1.02X

d)
X: Cantidad de antiparasitario aplicado; Xmin= 200 cc; Xmax= 600 cc
Y = 875 – 9x
Y: cantidad plantas parasitadas en un invernadero en el mes setiembre (en
litros).

e)
X: Tiempo dedicado a actividades deportivas (en horas semanales) Xmin= 0;
Y = 47 - 4x
Xmax= 10
Y: Nivel de estrés

f)
X: año Xmin= 2000; Xmax= 2009 Y = -210367 + 105,7x
Y: Cantidad de alumnos inscriptos en una institución educativa

3- Con lo dicho analice los casos propuestos en la actividad anterior y atendiendo al coeficiente de determinación
que ahora le ofrecemos realice las predicciones que se solicitan si lo cree conveniente.
a) Predecir el número de errores de tipeo en una página después de un 25 horas de entrenamiento en
dactilográfica. R2 = 0,73

b) Predecir el tiempo en que mi tía logrará normalizar la presión arterial si le aplican 3 ml de un medicamento
inyectable para la presión. R2 = 0,27

c) Predecir el peso de un adolescente cuya estatura es 1,75. R2 = 0,81.

62
d) Predecir la cantidad de plantas parasitadas en un invernadero en el próximo mes de setiembre luego de la
aplicación de 50 cc de antiparasitario. R2 = 0,92.

e) Predecir el nivel de estrés de una persona que practica deportes 8 hs semanales. R2 = 0,37

f) Predecir el número de alumnos inscriptos que puede esperarse en 2010. R2 = 0,83

4- Con el objetivo de aportar elementos metodológicos para el entrenamiento psicológico de los patinadores
durante la iniciación deportiva se llevó a cabo una experiencia con niños de entre 9 y 13 años. Durante los 8
primeros meses de entrenamiento deportivo, los niños fueron capacitados con técnicas psicológicas de
visualización y relajación inducida por la palabra y al final del período de entrenamiento se les realizaron test
físicos que demuestran el rendimiento en la velocidad de reacción (medido en segundos en recorrer 10 metros
en patines). Además se registró la edad de los niños y se obtuvieron los siguientes datos:

VELOCIDAD EDAD
2,22 13
2,25 12
2,33 12
2,4 11
2,42 11
2,54 12
2,79 10
2,8 10
2,81 9

PROCESOS EN EL INFOSTAT
1- Cargue la base de datos en el Infostat:
Archivo/Nueva tabla
Ingrese los datos en dos columnas.
2- Para realizar un análisis de regresión que permita predecir la velocidad (Y, variable dependiente) en
función de la edad (X, variable regresora) procese:
Estadísticas/Regresión lineal
Seleccione las variables/Aceptar/Aceptar
La salida del proceso se copia a continuación con indicación de los coeficientes que usted debe tener en cuenta:
Análisis de regresión lineal Coeficientes de regresión y estadísticos asociados

Variable N R² Coef Est.


VELOCIDAD 9 0,79 const 4,37 =a
EDAD -0,17 =b

5- Con el fin de analizar el efecto del descanso (medido en horas de sueño, Xmin= 0 ; Xmax = 10) sobre la capacidad
de respuesta a un imprevisto (medido en segundos hasta la reacción a un estímulo) se realizaron mediciones a un
grupo de 6 individuos: el procesamiento de la regresión ofreció los siguientes resultados:
Variable N R² Coef Est.
respuesta 6 0,99 const 3,51 = a
descanso -0,25 = b

a- ¿El modelo lineal es válido para hacer predicciones?

63
b- Escriba la recta de regresión e interprete sus coeficientes.
c- Prediga el tiempo de reacción para un individuo que descansó 8 horas

6- Como parte de un estudio sobre “Hábitos de vida saludable” se encuestaron 45 individuos a los que se
preguntó:
“¿Cuántas horas semanales dedica a hacer alguna actividad física?”
“¿Qué cantidad de líquido sin alcohol aproximadamente toma por día (en litros)?”
Analizadas las respuestas a través de un análisis de regresión en el que se definieron las variables
Y = cantidad de líquido sin alcohol que toma aprox. por día
X = horas semanales que dedica a hacer alguna actividad física
Se calculó la función de regresión y = 0,5 + 0,7 X y además los coeficientes r = 0,86 y R2 = 0,739. La variable
regresora “X” tomó valores entre 0 y 9.
a. Interprete los coeficientes “a” y “b” de la función de regresión.
b. El modelo lineal calculado ¿es apto para hacer predicciones?
c. Prediga mi consumo diario promedio de líquido sabiendo que dedico 3 horas semanales a las actividades
físicas.

7- Un estudio realizado entre 86 estudiantes universitarios tuvo por objetivo determinar un modelo que permitiera
predecir el futuro rendimiento académico (medido con la nota en el examen final, en la escala de 0 a 100) en
función de dos variables regresoras: a) el número de intervenciones de cada alumno durante las clases del
primer mes del curso de una materia troncal de la carrera, y b) la asistencia a clase medido como el número de
clases en las que estuvo presente durante el primer mes de clase.
Con las observaciones se obtuvieron las siguientes estadísticas:
MODELO 1 MODELO 2
Variable N R² Variable N R²
nota 86 0,88 nota 86 0,94

Coeficientes de la recta de regresión Coeficientes de la recta de regresión


Coef Est. Coef Est.
const 2,25 const -3,77
intervenciones 0,65 asistencia 1,48

a) Identifique las variables independiente o regresora y la dependiente. ¿Cuál de las dos rectas tiene una
mayor capacidad de predicción? Justifique numéricamente.
b) Escriba la función lineal de la nota en el examen en función de la variable regresora que usted eligió en
el ítem anterior e interprete los coeficientes de regresión en términos del caso.
c) Prediga la nota de un estudiante que asistirá a las 8 clases del primer mes del curso.

8- La información que sigue fue extraída de la página del INDEC (www.indec.mecon.ar). Le proponemos que
aplicando el modelo de regresión lineal, realice un análisis de la evolución de la “esperanza de vida” y si lo
considera apropiado efectúe la predicción que se indican.

64
Años censales Esperanza de vida al nacer ESPERANZA DE VIDA
(en años)
78,14
1869 32,9
1895 40,0

ESPERANZA_VIDA
66,32
1914 48,5
1947 61,1 54,50
1960 66,4
1970 65,6 42,68
1980 68,9
1991 71,9 30,86
2001 73,8 1850 1876 1903 1929 1955 1982 2008
2011 ¿? AÑOS_CENSALES

R2 = 0,98
Y = -567,71 + 0,32X

9- Observe los gráficos A y B:


a) Identifique y clasifique las variables independiente y dependiente.
b) ¿en cuál de ellos la recta de regresión tendrá un coeficiente de regresión negativo? Suponga que el valor
numérico de dicho coeficiente es 1,9 ¿cómo lo interpreta?
Gráfico A Gráfico B
50 50
Pacientes atendidos
Pacientes atendidos

40 40

30 30

20 20

10 10

0 0
Ene Feb Mar Abril May Jun Jul Ago Set Oct Nov Dic Ene Feb Mar Abril May Jun Jul Ago Set Oct Nov Dic

65
ANEXO I independiente “salud mental” (sano,
RESPUESTAS ABREVIADAS DE esquizofrénico). Instrumentos: Inventario de
LA PRÁCTICA PROPUESTA Evaluación del Vínculo Parental y cuestionario.
Muestra tamaño 73 (23 esquizofrénicos y 50
sanos). Estudio observacional, descriptivo,
PRACTICO 1: CONCEPTOS INTRODUCTORIOS correlacional, trasnversal.

1- a) observacional, transversal, confirmatorio, 3.3- Fenómeno: situaciones estresantes vividas por


inferencial. Muestreo. estudiantes. Población: estudiantes universitarios.
b) observacional, longitudinal, exploratorio, Marco Muestral: alumnos de segundo año de la
multivariado. Muestreo.probabilístico. Facultad de Odontología de la Universidad Nacional
c) observacional, transversal, descriptivo, de Tucumán que cursaban la materia Fisiología .
exploratorio, univariado. Muestreo no probabilístico Muestra; alumnos de segundo año de la Facultad
d) observacional, transversal, multivariado, de Odontología de la Universidad Nacional de
exploratorio. Muestreo probabilístico Tucumán que cursaban la materia Fisiología sin
e) experimental, longitudinal según el diseño, antecedentes hereditarios de hipertensión arterial.
univariado, inferencial, confirmatorio. Muestreo Variable “presión arterial” cuantitativa continua,
escala de razón. Variable “nota”, cuantitativa
2- a) Cuantitativa continua, segundos, escala de discreta, escala de razón. Factor: situación
razón. estresante (si = examen oral, no = práctico).
b) Cuantitativa discreta, unidades, escala de razón. Instrumentos: registro académico, tensiómetro.
c) Categórica, escala ordinal.
d) Categórica, escala nominal. 3.4- Fenómeno: actitud tolerante de los
e) Cuantitativa, continua, escala de intervalo. adolescentes. Factores: “edad” (cuantitativa
discretizada, escala de razón) y “género”
3.1- Fenómeno: impacto de la duración de la (cualitativa, escala nominal). Variable dependiente:
internación de pacientes trasplantados en la salud “nivel de tolerancia” cuantitativa continua, escala de
mental de los familiares. intervalo. Estudio observacional, transversal,
Población: conjunto de familiares de descriptivo.
transplantados. Marco muestral: conjunto de
familiares de transplantados en los últimos 6 meses 3.5-. Fenómeno: estrés post-traumático en niños.
en Hospital Universitario Virgen del Rocío de Población: niños turcos expuestos a terremoto.
Sevilla, España. UA: cada familiares de Muestra: 400 niños turcos de 4to y 5to grado (200
transplantados en los últimos 6 meses en Hospital de Sakarya y 200 de Edurne). Variable
Universitario Virgen del Rocío de Sevilla, España dependiente: síntomas de TEPT, categorizada
Variable independiente “duración de la internación (débil, moderado, severo y muy severo). Factor:
del trasplantado”, categorizada, escala ordinal. exposición a terremoto (si= Sakarya, no = Edurne).
Variables dependientes: “Nivel de ansiedad” y Instrumento: OSU-Child PTSD Inventory
“Nivel de depresión” de cada familiar de Observacional, descriptivo e inferencial, trasnversal.
transplantado, cuantitativas, escala de intervalo.
Muestra tamaño 148. 3.6-. Fenómeno: efectos psicológicos e
Instrumentos: Escalas de Ansiedad y Depresión de inmunológicos del masaje con aromaterapia.
Leeds e historia clínica de los trasplantados. Población: pacientes con cancer de mama tratados.
Estudio observacional, transversal, descriptivo, Muestra: pacientes con cancer de mama tratados
exploratorio. con cirugía o quimioterapia, de 45 a 58 años. UA:
cada paciente con cancer de mama tratado con
3.2- Fenómeno: importancia de la crianza en la cirugía o quimioterapia, de 45 a 58 años, tamaño
evolución de pacientes con esquizofrenia. 15. Variable dependientes: Nivel de ansiedad,
Población: conjunto de esquizofrénicos. Variables cuantitativa escala de intervalo. Variable
“distancia y frialdad emocional paterna” y “distancia independiente: tratamiento (sin tratar, tratado
y frialdad emocional materna”, cuantitativa, escala durante 4 semanas). Instrumento: inventario de
de intervalo. Otras variables observadas: sexo ansiedad (STAI). Experimental, univariado,
(categórica, nominal), edad (sin datos para ser inferencial.
clasificada), nivel educativo (categórica, ordinal) y
nivel socioeconómico (categórica, ordinal). Variable 3.7- Desarrollo en clase.

66
5) “Percepción sobre la fluidez de las
4- Desarrollo en clase. comunicaciones”, variable categórica medida en
escala ordinal.
5- Desarrollo en clase.

6- Desarrollo en clase.

PRACTICO 2: PRESENTACIÓN GRÁFICA Y


TABULAR DE DATOS

1- El 32,28% de los matriculados pertenecen a la


carrera de Administración (3640 estudiantes). La
facultad de Cs. Económicas concentra el 75,52%
de la matrícula de la universidad. - “En la encuesta sobre satisfacción laboral
participaron 120 empleados, 48 Técnicos y 72
2- a) Tabla 1 Administrativos.
Año Monografía Estudio Investigación TOTAL El 2% de los técnicos perciben como muy
de caso satisfactoria la fluidez en las comunicaciones con
2000 5 2 2 9 sus superiores, en tanto el 24% de los
2001 6 6 administrativos tienen el mismo nivel de percepción.
2002 1 3 4 Las tasas de empleados que están algo o muy
2003 3 1 4 8 insatisfechos con las comunicaciones con sus
2004 1 2 3 superiores son de 81% entre el personal técnico y
2005 2 2
10% para los administrativos.
Se concluye entonces que resultaría recomendable
Tabla 2 implementar acciones a fin de mejorar las
Äreas temáticas %
comunicaciones entre el personal técnico y el nivel
estudiadas
Psicología general 15,79
jerárquico de la compañía.”
Personalidad 5,26
Psicometría 5,26 6) a- “Número de errores ortográficos cometidos por
Psicosocial 21,05 cada alumno”, cuantitativa discreta. UE: cada
Psicología educacional 36,84 alumno de 3er grado de las divisiones A y B.
Tratamiento y prevención 15,79 b.1-nA = 23; nB = 27
b.2- FA(0)A = 2; FA(0)B = 0
b) En el año 2003 se presentaron 8 tesis, la mitad b.3- FA(1)A = 2; FA(1)B = 3; FR(1)A = 9%; FR(1)B =
de ellas fueron investigaciones y sólo una fue un 11%
estudio de caso. b.4- G(4)A = 8 o 34,7%; G(4)A = 15 o 55,6%
c) El área más estudiada fue psicología educacional b.5- División A (40% de alumnos con resultados
(36,84%), y las menos estudiadas psicometría y aceptables)
personalidad (5,26% cada área).
7) Actividad a desarrollada en el aula.
3- El aspecto de la recolección de residuos que
mayor disconformidad despierta entre los vecinos, 8) a- “Tiempo transcurrido entre la toma del
es la higiene en vía pública con más de un 60% medicamento (A o B) y la desaparición de los
algo o muy disconforme. El horario del servicio es el síntomas”, cuantitativa continua medida en escala
aspecto con el que hay conformidad (más del 80% de razón.
conforme). b- nA= 21 pacientes; nB= 39 pacientes.
Sólo el 16% de los encuestados clasifica c- Medicamento B (20 pacientes)
actualmente los residuos. El 73% de los que no d- Medicamento A: 48%; Medicamento B: 20%.
clasifican actualmente los residuos estarían e- Histograma.
dispuesto a hacerlo en el futuro.
9) b- “Zona de residencia”, categórica; “Sexo”,
4) Actividad a desarrollada en el aula. categórica; “Puntaje del SHQ6 sobre percepción del
propio sentido del humor”, cuantitativa.
c- 329; 28,3%.

67
d- 294; 25,3%, son los que se perciben con más 3,6 y 4,33 horas, mientras que con B el tiempo
sentido del humor. típico de reacción es de 2,4 a 3,7 horas.
f- En general tienden a las puntuaciones más altas
del inventario, o sea a percibirse con más sentido 4) a- n = 58; “tiempo hasta la recuperación”, um= en
del humor. días, continua.
b- Con acupuntura
10) a- Femenino: 390; Masculino: 388. Total: 778 c- Con medicamento
b- En el grupo de las muchachas (36% vs 24% de d- El 25% de los pacientes tratados con acupuntura
los muchachos) se recuperó en 10 días como máximo y con la
c- Muchachas (52%) medicina en 17 días máximo.
d- 10%
5) a- Observacional, transversal, descriptivo.
11) a- Mujeres (62%) “Intensidad en el uso de la religión”, cuantitativa
b- P.A: (40% escalar.
c- En el grupo de hombres: A.S. (37%); en el grupo b- Las mujeres tienden a hacer un uso más intenso
de las mujeres P.A. (45%) de la religión como estrategia de afrontamiento y la
d- 60% intensidad es menos variable en este grupo.
e- 4% c- La intensidad del uso de la religión entre los
hombres es heterogénea; entre las mujeres hay
12) a- 52% homogeneidad, es decir que la intensidad es similar
b- en el grupo de menores de 15 años (4%) entre las integrantes del grupo.
c- en el grupo de 15 y más años prevalece el bajo d- El 20% de los hombres puntuó al menos 4,8 en
riesgo(0,34/0,62= 0,548); en el grupo de menos de la escala de intensidad. Entre las mujeres, el 20%
15 años prevalece se encontraron tantos casos de puntuó al menos 7,2.
riesgo medio como bajo (0,18/0,38 = 0,47).
6) Se observa una cierta ventaja en el dominio de
PRACTICO 3: ANÁLISIS DESCRIPTIVO las competencias genéricas (mayor promedio y
UNIVARIADO valores mínimo y máximo superiores a los de las
competencias técnicas). Las distribuciones de los
1) Desarrollo en el aula puntajes resultaron ambos homogéneos (CV <
20%).
2) Comprensión auditiva (puntaje promedio,
mediana, nota mínima y máxima superiores que en 7) a- Observacional, transversal.
comprensión lectora, aunque con calificaciones b- 494 estudiantes encuestados obtuvo puntajes de
algo más variables) entre 10 y 15 en el test AFA, representan un 75,4%
- Los puntajes en comprensión lectora tienen de encuestados.
distribución asimétrica negativa más marcada que c- 97,5%
en comprensión auditiva, o sea que tienden a d- En general autoconcepto académico tiende a ser
superar al promedio (aunque es más bajo que en más positivo que el autoconcepto social. En función
comprensión auditiva). del modelo lingüístico, se observa que bajo el
- En las dimensiones evaluadas hay notas atípicas modelo A tanto el autoconcepto académico como el
tanto altas como bajas. Se confirman las social están más positivamente valorados.
conclusiones anteriores sobre la tendencia y e- Las medias aritméticas son representativas
variabilidad de los puntajes. (CV<20%).
- Comprensión lectora: 6,99 puntos; comprensión
auditiva: 8,59 puntos. 8) a- muestreo no probabilístico.
b- Observacional
3) El medicamento B tiende a resultar más efectivo c.1- Hombres; c.2- si; c.3- el 20% de las mujeres
(hace efecto en menor tiempo promedio, mediana registró una presión superior a 125,77 y el 20% de
inferior) aunque de manera más heterogénea entre los hombres superó 128; c.4- habrían aumentado la
pacientes. Se debería analizar el caso atípico en el media, el desvío, el CV y el máximo.
grupo tratado con el medicamento B (si hay motivos
para eliminarlo del análisis quizás el efecto del 9) El número total de cuestionarios cumplimentados
medicamento resulte más favorable). Típicamente es de 128. La edad media de los sujetos de la
los pacientes tratados con A reaccionan entre las muestra es de 15,95 años (desvío = 1,23),

68
oscilando entre los 14 y los 18 años. El 51,6% de
los sujetos son varones (66) y el 48,4% mujeres 4) a- Es más probable no sufrir depresión posparto,
(62). P(no ser depresiva)= 0,52
El 41% de la muestra nunca ha jugado a rol. El 20% b- Lo más probable es que tenga antecedentes,
juega con una baja frecuencia, el 19% juega con porque
una frecuencia media, el 20% tiene una alta P(con antecedent/sufre depresión posparto)=0,76
frecuencia de juego. c- No, porque P(sufrir depresión posparto/ no tiene
Con el objetivo de analizar las diferencias en la antecedentes)= 0,27
frecuencia de juego en función del sexo se observó
que entre los varones el 53% juega con una 5) a- Es más probable aprobar, P(aprobar)= 0,57
frecuencia media o alta, mientras que en el grupo b- P(no dormir)= 0,45
de las mujeres esta tasa alcanza un 24% por lo que c- Son sucesos dependientes porque P(aprobar) ≠
se concluye que entre los varones los juegos de rol P(aprobar/durmió)
están más difundidos y éstos tienden a dedicarles d- No, porque P(aprobar y no dormir) > 0
más tiempo que las mujeres.
También se observó entre los jugadores, que el 6) a- hostigamiento armado reciente (0,38)
85% cree que la práctica de los juegos de rol no b- P(depresión/exposición crónica) = 0,386
disminuye su rendimiento escolar o incluso lo c- P(depresión) = 0,435
mejora.
A través de la Batería de Socialización de Silva 7) a- P(reincidencia) = 0,23
(BAS-3) se midió el nivel de ansiedad social/timidez b- P(reincidencia/tobillera) = 0,161
que puede tomar valores de entre 0 (nivel mínimo c- Si
de ansiedad/timidez) y 10 (nivel máximo de
ansiedad/timidez). Analizando las medidas 8) a- P(hija de madre adolescente)= 0,30
descriptivas según la frecuencia de juego se b- P(ser madre adolesc/hija de madre adol)=0,6
concluye que se observa que aquellos que que c- Grupo adolescente (0,38)
jugaron alguna vez tienden a tener un mayor nivel
de ansiedad. 9) a- 0,34
b- P(ser feliz/amigo cerca) = 0,432 vs
10) Desarrollo en aula P(ser feliz/amigo lejos) = 0,268

PRACTICO 4: PROBABILIDADES 10) INFORME


“Estos resultados indican que las tasas de
1) a- P(aprobar) = 9/12 = 0,75 prevalencia estimada de PETP alcanzaron una
b- P(desaprobar) = 0,25 proporción muy alta de 72% en el grupo expuesto
c- Mutuamente excluyentes porque P(aprobar y a terremoto en comparación al 12% en el grupo
desaprobar) = 0 control no expuesto. El número de niños para un
d- P(aprobar/no estudió) = 0 diagnóstico posible de TEPT en los grupos
e- Dependiente porque expuestos a trauma fue 6 veces mayor que en el
P(aprobar) ǂ P(aprobar/no estudió) grupo control no expuesto, 144 versus 24 casos,
respectivamente. Los psicólogos y profesionales de
2) a- P(innov y IE) = 37/75 salud mental deberían considerar estas tasas de
b- P(solo una) = 13/75 + 16/75 = 0,387 severidad y prevalencia de TEPT cuando
c- P(alguna) = P(innov o IE) = 1- 9/75 desarrollen programas de tratamiento, intervención
d- P(noIE/innov) = 16/53 y prevención para niños después de catástrofes
naturales y tecnológicas. Los resultados indican
3) a- P(no tenga gas ni agua) = 0,37 que la exploración temprana para la identificación
b- P(tenga gas y agua) = 0,17 de TEPT es muy importante para predecir ulteriores
c- P(no tener agua) = 0,63 efectos de TEPT.”
d- P(no tener gas) = 0,57
e- Bastante probable porque P(tenga gas/tiene
agua) = 0,47, aunque menos probabilidad de que
no tenga.
f- P(tenga agua o gas) = 0,63
g- P(solo un servicio) = 0,46

69
varianza = 0,36 y desvío = 0,6. La P(x>4,4)=
PRACTICO 5: MODELOS PROBABILISTICOS – 0,2023.
DISTRIB. NORMAL DE PROBABILIDADES
10) a- hacer el curso de ingreso
1) a- b- Z= 2, la calificación está a dos desvíos por
Asignatura Z encima de la media, pertenece al grupo que ingresa
Psicología 1,5 directamente.
Matemática 0
Filosofía -1 SUMA DE VARIABLES ALEATORIAS Y TCL
Le fue mejor en Psicológia I, le fue peor en
Filosofía. 1) Variable: nota promedio de una muestra de 25
b-P(x < 83)= 0,1586 alumnos ≈ N (media = 5,3; varianza = 0,108)
c- P(x > 68)= 0,933 a- 0,181; b- 0,017; c- x0,95 = 5,84
d- X80 = 84,5
2) Variable: cuota promedio en una muestra de 40
2) a- P(x < 75) > 0,50 afiliados ≈ N (media = 326; varianza = 44,1)
b- P(x > 90) = 0,50 a- 0,018; b- atípica, prob = 0,00004.
c- P(90 < x < 100) = 0,3413
d- x0,10 = 77,18 minutos
e- x0,15 = 100,36 minutos PRACTICO 6: PRUEBAS DE HIPOTESIS

3) a- 15 1) Variable observada: tiempo requerido por cada


b- P(x< 80) = 0,091 operario para completar una tarea (en minutos),
c- P(84<x<90) = 0,109 cuantitativa continua. Factor: edad de los operarios
d- P(x>130) = 0,0227 (jóvenes, mayores).
e- x0,80 = 112,62 y más Hi) ¿Los operarios jóvenes son más rápidos?
f- x0,05 = 75,33 y menos H0) El tiempo requerido en completar una tarea es
independiente de la edad del operario,
4) a- Menos de 14 hs (0,252) tiempo/jovenes= tiempo/mayores
b- x0,10 = 13,08 H1) El tiempo requerido en completar una tarea
depende de la edad del operario,
5) a- la variable está normalmente distribuida con  tiempo/jovenes< tiempo/mayores
media = 68 y varianza = 196. CR: p-value < , unilateral izquierda
b- Z = 1,93. El paciente puntúo 1,93 desvíos por Prueba t
encima de la media, sólo el 2,7% de sujetos Dado que p-value=0,4796 > 0,05 no puede
puntúan más alto en la escala de alexitimia. rechazarse H0). No hay motivos para suponer que
c.1- P(x >80) = 0,195; c.2- P(x<60) = 0,283; c.3- los jóvenes tienden a ser más rápidos.
P(80<x<)=0,138
d- x0,90 = 85,94 2) Variable: grado de rigidez percibido de la
disciplina materna (rígida, justamente tolerante, muy
6) a.1- P(x>100) < 0,50; a.2- P(x<70) < 0,50 tolerante), categórica. Factor: sexo del hijo
b- x0,95 (muchacha, muchacho).
c- entre 69,34 y 120,94 Hi) ¿La percepción del grado de rigidez de la
disciplina materna difiere según el sexo del hijo?
7) a- en el grupo de recientemente graduados H0) La percepción del grado de rigidez de la
P(x>13)= 0,72. Si disciplina materna es independiente del sexo del
b- x0,20= 12,27 hijo, Prigida/muchacha = Prigida/muchacho
Pjust tolerante/muchacha = Pjust tolerante/muchacho
8) a- P(x>45) = 0,048 Pmuy tolerante/muchacha = Pmuy tolerante/muchacho
b- P(x<31) = 0,252 H1) La percepción del grado de rigidez de la
c- Puntuó dos desvíos por debajo de la media disciplina materna dependiente del sexo del hijo,
(x=23), por lo tanto está en el grupo de bajo riesgo. alguna P(k) difiere
CR: p-value <  unilateral derecha
9) Las calificaciones en competencias genéricas se Prueba chi de independencia
distribuyen normalmente con una media de 3,9;

70
Dado que p-value=0,0001 < 0,05 puede rechazarse H1) Un tratamiento de dos meses con el
H0). Hay motivos para suponer que el grado de medicamento antidepresivo reduce nivel de
percepción de la disciplina materna difiere según el depresión y por ende el puntaje en la prueba
sexo del hijo. estandarizada,  depresión/control> depresión/tratado
CR: p-value < , unilateral derecha
3) Hipótesis 1: prueba T para muestras Prueba t
dependientes. Var dep: cant respuestas correctas, Dado que p-value = 0,086 > 0,05 no puede
Var indep: capacitación (sin – con) rechazarse H0). No hay motivos para suponer que
H0) La intervención no favorece un mayor se reduce el nivel de depresión después de un
conocimiento,  (Xcon int – Xsin int)=<0 tratamiento de dos meses con el medicamento.
H1) La intervención favorece un mayor
conocimiento,  (Xcon int – Xsin int)>0 6) Variable: Satisfacción laboral (SL), cuantitativa
CR: p-value < , unilateral derecha continua. Factor: estilo de liderazgo del CEO (A:
Dado que p-value=0,004 < 0,05 hay motivos para prioriza la productividad, B: prioriza a las personas).
rechazar H0). Hay indicios para suponer que la Hi) ¿La satisfacción laboral está asociada con el
intervención favorece un mayor conocimiento. estilo de liderazgo del CEO?
Hipótesis 2: prueba de homogeneidad H0) La satisfacción laboral es independiente del
Ho) el efecto de la intervención educativa es estilo de liderazgo del CEO, SL/A= SL/B
independiente del tipo de formación H1) La satisfacción laboral está asociada con el
H1) el efecto de la intervención educativa no es estilo de liderazgo del CEO, SL/A ≠  SL/B
independiente del tipo de formación CR: p-value < , bilateral
CR: p-value < , unilateral derecha Prueba t
Dado que p-value=0,063 > 0,05 no hay motivos Dado que p-value = 0,026 > 0,01 no puede
para rechazar H0). No puede inferirse que el efecto rechazarse H0). No hay motivos para suponer que
de la intervención se asocie al tipo de formación. el grado de satisfacción laboral depende del estilo
de liderazgo del CEO. Esta conclusión puede
4) Variable dependiente: Presencia de depresión en generalizarse a los empleados de las compañías A
el control postparto (depresiva, no depresiva), y B.
categórica. Variable independiente: antecedentes f) H0) A=B ; H1) A < B
de depresión (con antecedentes, sin antecedentes).
Hi) ¿Los antecedentes de depresión personales o 7) Variable observada: cantidad de ausencias al
familiares inciden en la prevalencia de depresión trabajo durante dos años (nunca; al menos una
postparto? vez), categórica. Criterio de clasificación: calidad del
H0) La depresión postparto es independiente de los descanso nocturno (insomnes, no insomnes).
antecendentes familiares y personales de la Hi) ¿La calidad del descanso nocturno afecta el
parturienta, rendimiento laboral medido a través del
Pdepresión posparto/con antecedentes = Pdepresión/sin antecedentes ausentismo?
Pno depresión/con antecedentes = Pno depresión/sin antecedentes H0) El ausentismo es independiente de la calidad
H1) La depresión postparto depende de los del descanso nocturno,
antecendentes de la parturienta, alguna P(k) difiere PAusentismo/insomnes=PAusentismo/no insomnes
CR: p-value < , unilateral derecha Ppresentismo/insomnes=Ppresentismo/no insomnes
Prueba chi de independencia H1) El ausentismo no es independiente de la calidad
Dado que p-value=0,01 < 0,05 puede rechazarse del descanso nocturno, alguna P(k) es distinta.
H0). Hay motivos para suponer que los CR: p-value < , unilateral derecha
antecedentes de depresión personales o familiares Prueba chi de independencia
inciden en la prevalencia de depresión postparto. Dado que p-value = 0,0001 < 0,01 puede
rechazarse H0). Hay motivos para suponer que el
5) Variable respuesta: nivel de depresión, rendimiento laboral medido a través del
cuantitativa. Factor: Tratamiento (control y tratado). ausentismo/presentismo depende de la calidad del
Hi) ¿Es efectivo el medicamento antidepresivo descanso nocturno.
luego de un tratamiento de dos meses?
H0) Un tratamiento de dos meses con el 8) Variables observadas (X): a) distancia y frialdad
medicamento antidepresivo no varía el puntaje en la emocional paterna percibida; b) distancia y frialdad
prueba estandarizada, depresión/control= depresión/tratado emocional materna percibida. Cuantitativas

71
continuas. Factor: salud mental (sano, b- Prueba T
esquizofrénico). Ho)  x/públicos= x/privado ; H1)  x/públicos< x/privado
Hi) a) ¿Los esquizofrénicos perciben mayor CR: p-value < 
distancia y frialdad emocional paterna que los Dado que p-value = 0,26 > 0,05 no puede
sanos? rechazarse H0). No hay motivos para suponer que
H0) La distancia y frialdad paterna percibida es las enfermeras de hospitales públicos estén
independiente del estado de salud mental, significativamente más insatisfechas con el nivel de
x/esquiz= x/sanos ruidos que las de hospitales privados.
H1) La distancia y frialdad paterna percibida es b.3- Si.
mayor entre los esquizofrénicos,  x/esquiz> x/sanos
CR: p-value < , unilateral derecha 11) a- Variables observadas (X) Evaluación de
Prueba t eventos positivos relacionados con la familia,
Dado que p-value = 0,03 < 0,05 puede rechazarse evaluación de eventos negativos relacionados con
H0). Hay motivos para suponer que los la familia, etc. Criterio de clasificación: Recopilación
esquizofrénicos perciben como más distantes y de datos (test = día 1, re-test= día 15). Prueba T
fríos a sus padres. pareada.
b)¿Los esquizofrénicos perciben mayor distancia y b- Ho) (Xdía 1 – Xdía 15)=0
frialdad emocional materna que los sanos? H1)  (Xdía 1 – Xdía 15) ǂ 0
H0) La distancia y frialdad materna percibida es Prueba bilaterial
independiente del estado de salud mental, CR: p-value < 
 x/esquiz= x/sanos Dado que p-value = 0,35 > 0,05 no puede
H1) La distancia y frialdad materna percibida es rechazarse H0). No hay motivos para suponer que
mayor entre los esquizofrénicos,  x/esquiz> x/sanos el instrumento no sea inestable en el tiempo.
CR: p-value < , unilateral derecha
Prueba t 12) a- Variables respuestas (X): conocimiento,
Dado que p-value = 0 < 0,05 puede rechazarse H0). valor, paciencia de cada cuidador. Condición
Hay motivos para suponer que los esquizofrénicos experimental: antes y después del entrenamiento.
perciben como más distantes y frías a sus madres. Prueba T pareada para cualquier dimensión
seleccionada.
9) Variable observada X: presión arterial, b- Ho)x/medición inicial – x/medición final)=0
cuantitativa continua. Factor: situación (estresora, H1)  (x/medición inicial – x/medición final) < 0
no estresora) No hay pruebas de mejoras en las dimensiones de
H0) Los exámenes orales no son estresantes, “valor” y “paciencia”, si en “conocimiento”.
 (Xoral – Xpráctico)=0
H1) Los exámenes orales son estresantes, 13) a- Variable observada: frecuencia de
 (Xoral – Xpráctico)>0 pensamientos suicidas, categórica. Variable de
clasificación: sexo, categórica. Prueba chi.
CR: p-value < , unilateral derecha b- Ho) La frecuencia de pensamientos suicidas es
Prueba t apareada independiente del género.
Dado que p-value=0,003 < 0,05 hay motivos para H1) La frecuencia de pensamientos no es
rechazar H0). Hay indicios para suponer que los los independiente del género
examenes orales son estresantes porque la presión CR: p-value <
arterial es significativamente superior en esta c- Dado que p-value = 0,367 > 0,05 no puede
situación. rechazarse H0). No hay motivos para suponer que
la frecuencia de las ideaciones suicidas difiera entre
10) a- Los aspectos mejor evaluados entre las varones y mujeres policías.
enfermeras de hospitales privados fueron el riesgo d- Variable observada: frecuencia de pensamientos
y la limpieza. En los hospitales públicos los mejor suicidas, categórica. Variable de clasificación: grupo
evaluados fueron los ruidos y la limpieza. (civiles; policías), categórica. Prueba chi.
El aspecto peor evaluado en ambos grupos fue la b- Ho) La frecuencia de pensamientos suicidas es
seguridad. independiente del grupo.
En general las enfermeras de los hospitales H1) La frecuencia de pensamientos no es
privados se muestran más satisfechas que sus independiente del grupo
pares de hospitales públicos. CR: p-value < 

72
c- Dado que p-value = 0,0206 < 0,05 puede
rechazarse H0). Hay motivos para suponer que la 5) a- X1: tiempo dedicado al deporte (en
frecuencia de las ideaciones suicidas difiere entre horas/semana), X2: consumo de líquido (en
civiles y policías. litros/día) Las variables se distribuyen normalmente.
b- as variables se asocian fuertemente en sentido
14) a- Variable observada (X): creencias positivo, es decir que un mayor el consumo de agua
anticipatorios, cuantitativa. Factor: Adicción (adicto, ocurren en general asociado con más actividad
no adicto). Prueba T deportiva y menores consumos de agua ocurren en
H0)  x/grupo 1 = x/grupo 2 general asociado con menos actividad deportiva.
H1)  x/grupo 1 >  x/grupo 2
CR: p-value < , unilateral derecha 6) a- la muestra es grande.
b- Prueba t b- La edad y la percepción de peligro no están
c- Dado que p-value = 0,002 < 0,01 puede asociadas. La edad correlaciona débilmente con el
rechazarse H0). Hay motivos para suponer que los nivel de estrés, en sentido negativo. Hay una
sujetos con adicciones las creencias anticipatorios asociación moderada y positiva entre el tiempo de
están más arraigadas. duración del malestar y el tiempo transcurrido del
suceso estresor.
15) a- las medidas descriptivas sugieren que el
tratamiento es efectivo porque tiende a reducir el 9) La autoestima no parece asociada con el
grado de fobia, aunque con resultados compromiso afectivo y el sentimiento de
heterogéneos. pertenencia, aunque sí con el compromiso con el
b- Prueba T porque se evalúa una variable trabajo. Esta última es moderada, significativa y
cuantitativa en dos grupos independientes. positiva.
Hi) ¿Es el IAFS un programa efectivo?
H0)  x/grupo tratado = x/grupo control PRÁCTICO 8: ANALISIS DE REGRESIÓN
H1)  x/grupo tratado <  x/grupo control
CR: p-value <  1) a- X= duración del entrenamiento; Y= número de
Dado que p-value = 0,0001 < 0,01 puede errores
rechazarse H0). Hay motivos para suponer que el b- X= dosis de un medicamento; Y= tiempo hasta la
programa IAFS es efectivo en el tratamiento de normalización de la presión
fobia social en adolescentes. c- Cualquiera puede la V.D.
d- X= cantidad de antiparasitario aplicado; Y=
cantidad de plantas parasitazas
PRÁCTICO 7: ANALISIS DE CORRELACIÓN e- X= tiempo dedicado a actividades deportivas; Y=
nivel de estrés
1) a- la asociación es fuerte en sentido positivo. B) f- X= tiempo; Y= cantidad de inscriptos
la asociación es sustancial en sentido negativo. C)
la asociación es moderada en sentido positivo. C) la 2) a- a= antes de iniciar el entrenamiento se
asociación es débil en sentido negativo. esperan 11,9 errores por página; b= por cada hora
de estudio el número de errores se reduce en 0,3.
2) Figura 1: r = 0,92 resulta la asociación más b- a= si no se suministra el medicamento el
fuerte, Figura 2: r = -0,88 , Figura 3: r = 0,22, resulta paciente tarda 55 min en normalizarse; b= por cada
la asociación más débil ml de medicamento, el paciente se normaliza 8
minutos más rápido.
3) Desarrollo en clase c- a= no se interpreta; b= por cada cm más alta una
persona, será 1,02 kg más pesada.
4) X1: tiempo de descanso (en horas), X2: d- a= no se interpreta; b= por cada cc de
capacidad de respuesta (en segundos) antiparasitario se reduce en 9 el número de plantas
El tiempo de descanso y la capacidad de respuesta enfermas
frente a un imprevisto se asocian intensamente en e- las personas que no hacen actividad deportiva
sentido negativo, es decir que capacidad de puntúan 47 en promedio en la escala de estrés: b=
respuestas más rápidas ocurren en general con por cada hora semanal de práctica deportiva se
mayores tiempos de descanso y capacidad de puede esperar una reducción media de 4 puntos en
respuestas más lentas ocurren en general con la escala de estrés
menores tiempos de descanso.

73
f- a= no se interpreta; b= el número anual de
inscriptos aumenta anualmente a razón de 105,7 en
promedio.

3) a- El modelo lineal es válido. Predicción: 4,4


errores.
b- El modelo lineal no es válido.
c- El modelo lineal es válido. Predicción: 75,5 kg
d- El modelo lineal es válido. Predicción: 450
plantas enfermas
e- El modelo lineal no es válido.
f- El modelo lineal es válido. Predicción: 2085,6
inscriptos.

4) Desarrollo en clase.

5) a- Si.
b- Y = 3,51 – 0,25X. Se estima que quienes no
duermen demoran en promedio 3,51 segundos en
reaccionar ante un imprevisto. Una hora adicional
de sueño es beneficioso porque se reduce el
tiempo de reacción ante imprevistos en 0,25
segundos.
c- 1,51 segundos.
d- Las variables tienen una asociación muy intensa
y negativa.

6) a- a = 0,5: quienes no realizan actividad física


toman un promedio de 0,5 lts. de agua/día.
b = 0,7: por cada hora de actividad física
semanal el consumo de agua aumenta 0,7 lts/día.
b- Si, R2 > 0,50
c- Y = 2,6 lts/día

7) a- Y = nota en el examen final de cada alumno


X1 = número de intervenciones
X2 = asistencia a clase
El modelo 2 tiene mejor ajuste (mayor R2)
b- Y = -3,77 + 1,48x
B = 1,48: por cada clase que asisten los alumnos
hay un incremento en nota final de 1,48 ptos.
c- Y = 8,07

8) El modelo lineal es válido. La esperanza de vida


aumenta a razón de 0,32 años por año censal.
75,81 años.

9) a- Y = cantidad de pacientes atendidos; X =


tiempo, en años.
b- Caso B
c- b = -1,9 significa que por cada año que pasa se
reduce el número de pacientes atendidos en 1,9.

74

S-ar putea să vă placă și