Sunteți pe pagina 1din 48

I.

INTRODUCCIÓN

1.1. ANTECEDENTES Y JUSTIFICACIÓN DEL PROBLEMA

1.1.1 ANTECEDENTES

San Diego City S. Chools (2004), el Índice de Rendimiento

Académico (API) es la piedra angular del sistema de Rendición de

Cuentas de California. El propósito del API es medir el rendimiento

académico y el desarrollo de las escuelas. Es un índice (o escala)

numérico que va desde un bajo 200 que hasta un alto 1000. El resultado

o la asignación de una escuela en el API indican el nivel de rendimiento

de una escuela.

El desarrollo de una escuela se mide por lo bien que ésta

progresa hacia su meta (o la sobrepasa). Este año marca el quinto ciclo

de informes del API, establecido mediante el Decreto de Rendición de

Cuentas de las Escuelas Públicas (PSAA)

Los resultados de la Prueba de Criterios de California en disciplinas

lingüísticas en inglés, matemáticas, historia/ciencias sociales y ciencias,

se usaron para calcular el API Base de las escuelas en 2003 y los

resultados del desarrollo del API en 2003–2004. Además, la misma

información usada para calcular el API de toda una escuela se utiliza

para cada subgrupo estudiantil considerablemente numeroso en cada

escuela. Asimismo, los resultados de la Prueba de Aptitud de

California, Sexta Edición (CAT/6), el Examen de Egreso de California

(CAHSEE) y la Evaluación Alterna del Desempeño de California

1
(CAPA) están incluidos en el Los resultados del Desarrollo del API de

2003-04.

Doctor Miguel Andrade G. Doctor (C) Christian Miranda

J.Doctor ( C) IRMA Freixas S. , el estudio realizado es cuantitativo,

descriptivo, correlacional, multivariado por los factores (o variables

independientes), explicativo (varianza del Rendimiento Académico), y

predictivo vía explicación matemática (comunalidad, intersección o

dispersión concomitante entre los factores y el criterio), cuyo interés

está en querer responder el siguiente problema: ¿Cómo se relacionan las

Inteligencias Múltiples Lógico-Matemática y Lingüística, el

Currículum del Hogar con el Rendimiento Académico de los Alumnos

de Segundo Año Medio de Liceos Municipalizados de la Comuna de

Santiago?. Para ello, se ha propuesto en término de objetivos, aportar

antecedentes teóricos y empíricos a la conceptualización y métrica de

las teorías de las Inteligencias Múltiples, en su parte Lógico-

Matemática y Lingüística, el Currículo del Hogar y la Autoestima;

determinar y comprender los niveles de relación de algunas variables

intelectuales, del Hogar con el Rendimiento alcanzado de los alumnos;

y establecer las variables que mejor describan y explique los niveles de

Rendimiento Académico de los alumnos. Los resultados obtenidos a

partir de este estudio, revelan que la variable Condiciones Necesarias

en el Hogar para Motivar el Deseo de Aprender y la Inteligencia Lógico

Matemática tienen igual poder de determinación sobre el Rendimiento

en castellano. Respecto del Rendimiento en Matemáticas; el máximo de

2
predicción lo entrega la Inteligencia Lógico-Matemática, con un 14,2%,

más la Inteligencia Lingüística que aporta un 1,9%. Se ratificó aquí el

poder influyente que aporta la Familia sobre los Rendimientos

académicos; y, se añaden variables que han sido poco exploradas

sistemáticamente en Chile: Inteligencias Múltiples, Condiciones para

Motivar los Aprendizajes.

Pizarro (1985), el Rendimiento Académico es entendido como

una medida de las capacidades respondientes o indicativas que

manifiestan, en forma estimativa, lo que una persona ha aprendido

como consecuencia de un proceso de instrucción o formación. El

mismo autor (1978) ahora desde una perspectiva del alumno, define el

Rendimiento como la capacidad respondiente de éste frente a estímulos

educativos, susceptible de ser interpretado según objetivos o propósitos

educativos pre-establecidos.

Himmel (1985), ha definido el Rendimiento Escolar o

Efectividad Escolar como el grado de logro de los objetivos

establecidos en los programas oficiales de estudio. Este tipo de

Rendimiento Académico puede ser entendido en relación con un grupo

social que fija los niveles mínimos de aprobación ante un determinado

cúmulo de conocimientos o aptitudes (Carrasco, 1985).

Heran Y Villarroel (1987, p.10), el Rendimiento Académico se

define en forma operativa y tácita afirmando que “el rendimiento

escolar previo como el número de veces que el alumno ha repetido uno

o más cursos”. En cambio Gardner (1994) ha puesto de manifiesto el

3
problema que han tenido que afrontar todas las sociedades modernas al

momento de resolver el problema educativo; esto es, supeditar sus

propias opciones al mundo del desarrollo y la industrialización de la

sociedad. Esto ha significado que cualquiera que sea el tipo de

sociedad, ha tenido que adaptarse a formas tradicionales de transmisión

del conocimiento, y por ende, a los criterios restringidos de evaluación

y de aceptación de rendimiento por parte de los alumnos. Postula en su

defecto, actuación, logros, proyectos contextualizados, significativos y

auténticos, derivados de instrucciones diferenciadas. Ahora, la

inteligencia escolar es un tema relativo a nuestro estudio en la medida

que da cuenta de la operacionalización del concepto de Inteligencia en

relación con el Rendimiento Escolar y con el fin de explicar, en parte,

las diferencias en él.

Mary de Masi (2002), avances en las matemáticas entre los

estudiantes de escuela media según las pruebas NAEP. El porcentaje de

jóvenes latinos de 8vo grado que alcanzaron o superaron el nivel básico

de matemáticas del examen NAEP casi se duplicó entre 1992 y el 2000,

con una extraordinaria mejora del 96 por ciento. La juventud latina

necesitaría mejorar un 81 por ciento para alcanzar a sus compañeros de

otros grupos étnicos sobresalientes. Durante los últimos dos años,

aproximadamente uno de cada cuatro estudiantes latinos de octavo

grado tuvieron calificaciones en los niveles 3 ó 4 en la evaluación de

matemáticas del estado de Nueva York (un 16% en el 2001 y un 23%

en el 2002.) Esto concuerda con el rendimiento de los estudiantes

4
afroamericanos. Los estudiantes Requiere de una mejora del 81 por

ciento.

Rendimiento Académico de los Alumnos (2005), según un

estudio de la Universidad de Salamanca el bajo rendimiento del alumno

se debe a la baja formación en los niveles anteriores y al excesivo

número de asignaturas. Los profesores de la Universidad de

Salamanca consideran que las causas principales del bajo rendimiento

del alumno universitario son el bajo nivel con el que llegan a la

educación superior y el excesivo número de asignaturas que tienen que

cursar cada año. Según se desprende del estudio realizado sobre el

rendimiento académico de los alumnos de la Universidad salmantina,

financiado por el Consejo Social, entre las causas atribuibles al propio

estudiante figuran la falta de autoexigencia y responsabilidad, el

deficiente aprovechamiento de las horas de tutoría y el insuficiente

dominio de las técnicas de estudio por parte del alumno. Los docentes

también atribuyen este bajo rendimiento a la falta de esfuerzo para

centrarse en el estudio, la escasa motivación y la falta de orientación al

elegir la titulación. Por otra parte, entre las causas debidas a los propios

profesores el informe subraya la baja estimulación para la dedicación a

la tarea docente, la falta de estrategias de motivación por parte del

profesor y la escasa comunicación entre docente y alumno. El equipo de

investigación, dirigido por el catedrático de Educación Javier Tejedor,

define como ?globalmente positiva? la valoración de las condiciones de

docencia por parte del profesorado, fundamentada principalmente en la

5
dedicación de un tiempo razonable en la preparación de las clases. No

obstante, el informe concreta algunos aspectos negativos como la

escasa preparación previa de los alumnos, la deficiente coordinación

entre los programas, la reducida posibilidad de promoción personal que

ofrece la Universidad y la escasa coherencia académica de los planes de

estudio.

Los investigadores sugieren una serie de iniciativas para

mejorar el rendimiento de los alumnos teniendo en cuenta los tres tipos

de variables; institucionales, alumnado y profesorado. En relación a la

institución proponen buscar estrategias para elevar el nivel de

conocimientos de los alumnos previamente a su ingreso en la

Universidad, de forma especial en los estudios de Ciencias. Entre las

opciones planteadas figura la realización de un curso preparatorio con

las asignaturas claves de los distintos tipos de estudios. Asimismo,

consideran la necesidad de replantearse en los nuevos planes de estudio

la posibilidad de incorporar más asignaturas de carácter anual y

potenciar la coordinación de los programas de las materias impartidas

en los planes de estudios. Respecto a los alumnos, el equipo de

investigación apuesta por potenciar los servicios de orientación para

mejorar tanto sus hábitos y técnicas de estudio como sus actitudes de

responsabilidad, esfuerzo y autoexigencia; revalorizar la función de la

tutoría como actividad docente y propiciar una mayor asistencia regular

a las clases, limitando al máximo el absentismo sin causas justificadas.

6
Finalmente, sobre el profesorado el informe aconseja tomar medidas

orientadas al reconocimiento de las tareas docentes (no sólo para

impartir las clases, sino con actividades de puesta al día, preparación de

materiales, corrección de ejercicios) y a la potenciación de la formación

pedagógica del profesorado.

Dr. C Jorge Bacallao Gallestey, Dr. José M. Parapar, Lic.

Mercedes Roque, Lic. Jorge Bacallao Guerra (2004), El presente

trabajo se realizó con el propósito de mostrar que el grupo es un

modificador de la relación entre el rendimiento académico y sus

predictores y con ello, fundamentar la necesidad de recurrir a la

modelación jerárquica para la predicción del rendimiento. Se aplicaron

modelos con coeficientes aleatorios, especialmente apropiados para la

circunstancia frecuente de casos agrupados, en la que los supuestos

usuales de los modelos lineales ordinarios dejan de ser válidos y los

modelos clásicos, inaplicables. Se constató que algunos de los

predictores tradicionales tenían relevancia condicionada al grupo,

aunque no parecían tener relevancia marginal. Se demostró así que el

grupo es un modulador de la relación entre el rendimiento académico y

algunos de sus predictores. La consecuencia de mayor trascendencia fue

que la asignación de un estudiante a un grupo podía influir

considerablemente en su rendimiento académico, independientemente

de sus condiciones iniciales.

Bardales Mendoza, Olga Teodora (1993) UPCH, su estudio

tiene la finalidad de indicar si existe o no diferencia correlacional de la

7
autoestima con el rendimiento académico en función al tipo de familia

que pertenecen los estudiantes de primaria de colegios nacionales de

Lima metropolitana, 379 alumnos del nivel socio económicos

constituyen la muestra. El instrumento utilizado es el inventario de

autoestima de Coopersmith. El estudio realizado llego a la siguiente

conclusión: No existe diferencia correlacional significativa de la

autoestima con el rendimiento académico en función al tipo de familia a

la que pertenece el estudiante de primaria. Así mismo los alumnos que

viven con ambos padres tienen mayor autoestima que los alumnos que

viven sin sus padres, finalmente, los niños que viven con un padre

tienen mayor autoestima que los niños que viven sin sus padres.

García Benau, Antonia y Gandia Cabedo, Juan (1994), el

objetivo de su estudio es profundizar en el conocimiento de la

satisfacción de la actividad académica, docencia e investigación de los

docentes universitarios de contabilidad de España. Se elabora un

cuestionario como instrumento de la información requerida para

desarrollar el presente estudio. La conclusión de la investigación es la

siguiente: Los docentes muestran gran atención a la estructura

organizativa del sistema universitario español, sin embargo a la mayoría

de los profesores les gustaría dedicar mayor tiempo a la investigación

de lo que ya dedican.

García Cocio, Berta (1993) UPIGV, la investigación que

realiza se refiere a la satisfacción laboral de un grupo de psicólogos que

trabajan en la modalidad de educación especial en Lima, 64 psicólogos

8
de ambos sexos conforman la muestra, tanto de la zona urbana y

marginal de Lima. Los instrumentos de la investigación fueron la hoja

de registros de variables personales y la escala de actitudes hacia la

satisfacción laboral. Su estudio señala que los psicólogos de educación

especial de la zona urbana y marginal muestran opiniones favorables de

satisfacción laboral no existiendo diferencia respecto al sexo, ni al lugar

donde laboran.

O’Hara Y Tedeiman (1959), realiza una investigación

correlacional, cuyas variables son: Las aptitudes (numéricas, relaciones

especiales, razonamiento abstracto, razonamiento verbal y

razonamiento mecánico.), los intereses, las clases sociales, los valores y

el autoconcepto vocacional, 1000 jóvenes universitarios de BOSTON

conforman la muestra estudiada, de los cuales 460 son recién

ingresantes, 276 del segundo año y 264 de años superiores los

instrumentos utilizados en la investigación fueron: Prueba de actitud

diferencial (PAD), escala de preferencia de Kuder, índice de hogar

Gough, estudio de valores Allport-Vernon-Lindzey, inventario de

Valoración del trabajo de Súper, Cuestionario de autoestima O’Hara Y

Tedeiman. La conclusión del estudio fue la siguiente: Existe correlación

significativa entre las variables anteriores mencionadas, pues los

resultados oscilan entre 0.70 a 0.81 incrementándose la correlación en

los años avanzados de estudio.

Tovar C. y Villegas L. (2000), su investigación tiene por

finalidad de describir la presencia de los principios orientadores de la

9
reforma curricular a través de la opinión de los estudiantes de la escuela

de enfermería de la Universidad del Valle. La muestra estuvo

constituida por 107 estudiantes de Pre grado y 84 estudiantes de sexto y

octavo semestre. El instrumento utilizado fue un cuestionario sobre la

formación académica y el currículo. El resultado de la investigación fue

el siguiente: A los alumnos les gusta asignaturas relacionadas a la

formación personal, con componentes de ser, la autoestima. Les gustan

aquellas asignaturas que les permita desarrollar sus habilidades

intelectuales y emocionales. Les gustan las materias de su carrera.

Tucc (1963), su estudio tiene la finalidad de determinar el

porcentaje de estudiantes que se encontraban satisfechos con su

elección vocacional. La muestra estuvo constituida por 163 estudiantes

de la Wayne State University. El resultado de su investigación fue el

siguiente: 34% había decidido de manera definitiva acerca de sus planes

vocacionales, el 48% tenía una decisión provisional, 18% afirmo que

estaba indeciso.

Verastigui (1999) UNMSM, su estudio es correlacional causal.

La muestra estuvo constituida por 70 profesores y 70 alumnos de 5

Institutos superiores pedagógicos públicos (Monterrico, Yungay,

Chupaca, Moquegua, Tarapoto). Los instrumentos de la investigación

fueron: Test de capacitación profesional para profesores, la prueba de

suficiencia profesional. El resultado de su investigación fue el

siguiente: Existe una influencia significativa del tratamiento curricular

y la capacitación docente en la calidad de la formación profesional.

10
Warren (1961), su estudio sugirió que los cambios en el área de

estudios universitarios ocurrían cuando existía una discrepancia entre el

concepto personal de si mismo y el papel ocupacional para el cual

esperaba ser formado en la universidad. La muestra entubó constituida

por 525 estudiantes varones ingresantes a la universidad. El instrumento

utilizado el inventario de Ómnibus de personalidad. La conclusión de

su investigación fue el siguiente: El promedio de las calificaciones

académicas se correlacionan significativamente con el cambio en el

área de estudio.

Por otra parte, cabe mencionar que no se encontraron estudios

realizados usando el regresión lineal múltiple bayesiana,

específicamente aplicado al tema en estudio, lo cual se constituye en

una razón más para su estudio y aplicación del análisis bayesiano.

Finalmente, los antecedentes mencionados anteriormente constituyen

las bases para realizar la presente investigación.

1.1.2 JUSTIFICACIÓN

La presente investigación es de importancia para la sociedad,

primordialmente para la Ciudad de Huaraz, pues se conocerá con mayor

claridad las características que tienen los alumnos de la UMASAM para

ver su rendimiento Académico, y de esta manera contribuir a resolver la

dificultad de los estudiantes universitarios a causas de la autoestima,

satisfacción de la profesión elegida y la edad, además de ello, se podrán

conocer las tendencias de futuros profesionales con quienes contará la

sociedad.

11
Además, es de suma importancia para los estudiantes por la gran

relevancia social que contiene el estudio del rendimiento académico en

ellos, ya que dicho rendimiento se convierte en un proceso de

socialización en el cual ellos van a estar introducidos de alguna u otra

manera, la autoestima, la satisfacción vocacional, cuando un estudiante

se encuentra satisfecho con la carrera elegida esta motivado y por lo

tanto es capaz de contestar su propia naturaleza y comprometerse a un

cambio personal mejorando sus deficiencias cognitivas y afectivas con

la finalidad de alcanzar el grado optimo de desarrollo.

Por otro lado, el enfoque Bayesiano es de suma importancia

pues nos provee datos más precisos que sirven para tomar decisiones,

por lo cual la teoría Bayesiana será contrastada en la realidad con la

finalidad de darle una validación práctica al Enfoque Bayesiana

aplicado al análisis de regresión lineal múltiple.

1.2. PROBLEMA

¿Cuáles son las relaciones que prevalecen entre la Autoestima, la

Satisfacción de la Profesión Elegida, las Realidades Etáreas y el

Rendimiento Académico en el Proceso de Formación de los

Estudiantes de la Facultad de Economía y Contabilidad de la

Universidad Nacional Santiago Antúnez de Mayolo -2008?

1.3. HIPÓTESIS

La autoestima, la satisfacción con la profesión elegida y la edad

influyen significativamente en el rendimiento de los estudiantes de la

12
Facultad de Economía y Contabilidad de la Universidad Nacional

Santiago Antúnez de Mayolo -2008

1.4. OBJETIVOS

1.4.1. Objetivo General

Desarrollar la técnica Bayesiana para establecer el modelo de

regresión lineal múltiple del autoestima, la edad y la satisfacción con la

profesión sobre el rendimiento académico de los alumnos de la

Facultad de Economía y Contabilidad de la Universidad Nacional

Santiago Antúnez de Mayolo -2008

1.4.2. Objetivos Específicos

 Explicar el procedimiento de la técnica Bayesiana en el modelo

de regresión lineal múltiple.

 Establecer el modelo de regresión lineal múltiple del autoestima,

la edad y la satisfacción con la profesión, con el rendimiento académico

de los alumnos de la Facultad de Economía y Contabilidad de la

Universidad Nacional Santiago Antúnez de Mayolo -2008.

 Establecer si existe relación entre el autoestima, la edad y la

satisfacción con la profesión con el rendimiento académico de los

alumnos de la Facultad de Economía y Contabilidad de la Universidad

Nacional Santiago Antúnez de Mayolo -2008.

13
II. MATERIALES Y MÉTODOS

2.1. MATERIAL DE ESTUDIO

2.1.1. Población

La presente investigación se llevó a cabo en la Universidad

Nacional Santiago Antúnez de Mayolo, en la Facultad de Economía y

Contabilidad. La población examinada esta constituida por todos los

alumnos de la Facultad, es decir 276 estudiantes.

2.1.2. Muestra

Unidad de análisis

Estudiante de la Facultad de Economía y Contabilidad de la

Universidad Santiago Antúnez de Mayolo.

Tamaño de la muestra

Tamaño de muestra se calculó con la siguiente formula:

Z²pqN
n
T²(N - 1)  Z²pq

Donde:

P: Porcentaje de matriculados a la F.E.C.- UNASAN (tomada de

encuesta piloto)

14
Z: Valor de la distribución normal para un 95% de confianza

T: Es el porcentaje de tolerancia del trabajo de investigación

N: Número total de estudiantes de la Facultad de Economía y

Contabilidad en el año 2005.

Entonces, reemplazando los datos a la fórmula se obtiene:

n = 99 estudiantes.

2.2. MÉTODOS Y TÉCNICAS

2.2.1. Método

Los datos fueron obtenidos mediante la aplicación de un

conjunto de pruebas que nos permitió conocer el estado real del

desarrollo psicológico, de personalidad así como la formación

académica profesional de cada uno de los alumnos que componen

nuestra población.

Estas pruebas son: El Test del inventario de autoestima de

Coopersmith, el inventario de satisfacción con la profesión elegida.

Todas estas pruebas fueron utilizadas luego de determinar su necesaria

validez y confiabilidad, que nos dan seguridad y garantía sobre la

exactitud de los resultados.

A continuación presentaremos una descripción detallada de los

instrumentos utilizados: Los datos se recolectaron mediante un

15
cuestionario (Anexo N° 02), Test de Autoestima (Anexo N 03) y la

Satisfacción por la profesión elegida (Anexo N° 04), el método de

muestreo indicado para este tipo de estudio es el muestreo estratificado.

A continuación presento una descripción detallada de los instrumentos

utilizados:

INVENTARIO DE AUTOESTIMA DE COOPERSMITH

a) FICHA TÉCNICA

Autor: Stanley Coopersmith.

Año de Edición: 1997

Traducción: Panizo M.I.

Ámbito de Aplicación: de 16 a 25 años.

Forma de Administración: Individual y Colectiva.

Normas que ofrece: Los sistemas de medida dan lugar a varias

modalidades de normas.

Áreas que Explora: El inventario está dividido en 4 sub tests más un

sub test de mentira, ellos son:

 Sub test L (Mentira): Indica falta de consistencia en los

resultados por lo que el inventario queda invalidado.

 Sub test Si Mismo: Los puntajes altos indican valoración de sí

mismo y altos niveles de aspiración, estabilidad, confianza, adecuadas

habilidades sociales y atributos personales.

16
 Sub test Social Pares: Una puntuación alta indica que el sujeto

posee mayores dotes y habilidades en las relaciones con amigos y

colaboradores, así como con extraños. La aceptación social y de sí

mismos están muy combinados.

 Sub test Hogar Padres: Un nivel alto revela buenas cualidades y

habilidades en las relaciones íntimas con la familia, se siente respetado,

tiene independencia y una concepción moral propia.

 Sub test universidad: Los niveles altos indican que el individuo

afronta adecuadamente las principales tareas académicas, posee buena

capacidad para aprender. Trabaja a satisfacción tanto a nivel individual

como grupal.

b) DESCRIPCIÓN DE LA PRUEBA

El Inventario de Autoestima de Coopersmith está constituida por

58 afirmaciones, con respuestas dicotómicas (SI - NO), que brindan

información acerca de las características de la autoestima a través de la

evaluación de 4 sub tests.

c) NORMAS DE CORRECCIÓN

El puntaje máximo es de 100 puntos y el test de mentiras (items:

28,32,36,41,45,50,53,58) invalida la prueba si es un puntaje superior a

cuatro. Los puntajes se obtienen sumando el número de items

respondido en forma correcta y multiplicando éste por 2 sin incluir el

puntaje de mentiras. Así por ejemplo: N° de items x 2 = nivel de

17
autoestima 40 x 2 = 80 De acuerdo a la categoría de autoestima 80

le Corresponde el nivel de autoestima Alto (ver Anexo 5).

Cabe señalar los items cuya respuesta deberá ser:

Si(1,4,5,5,8,9,14,19,20,26,27,28,29,32,36,38,41,42,43,46,47,50,53,58

para los items restantes la respuesta será No.

d) VALIDEZ Y CONFIABILIDAD DEL INVENTARIO DE

AUTOESTIMA

- Validez de Contenido: La redacción de los items tuvo algunos

cambios de expresión, de acuerdo a las sugerencias de 2 psicólogos,

considerando las características de la población investigada. Los items

que cambiaron respecto a su expresión son:

Soy una persona simpática por

Soy una persona agradable.

Con frecuencia me siento a disgusto en mi grupo por

Con frecuencia me siento incómodo con mis compañeros de la

universidad.

 Generalmente me siento desmoralizado en mi grupo por

 Generalmente me siento subestimado (a) por mis compañeros de

estudio.

 Me aceptan fácilmente por

18
 Me aceptan fácilmente en un grupo.

 Paso bastante tiempo soñando despierta por

 Paso bastante tiempo imaginando mi futuro.

 Estoy orgulloso de mi rendimiento en la escuela por

 Estoy orgulloso de mi rendimiento en la universidad

 Estoy haciendo lo mejor que puedo por

 Estoy haciendo lo mejor que puedo para conseguir mis logros

académicos.

 Preferiría estar con niños menores que yo por

 Preferiría estar con jóvenes menores que yo.

 Me gustan todas las personas que conozco por

 Me agradan todas las personas que conozco.

 Me gusta cuando me invitan a salir a la pizarra por

 Me gusta cuando me invitan a exponer un tema relacionado a la

profesión que estudio

 No me está yendo tan bien en la escuela como yo quisiera por

 No me está yendo tan bien en la universidad como yo quisiera.

 Realmente no me gusta ser un adolescente por

 Realmente no me gusta ser joven.

 No me importa lo que pase por

 No me importa lo que me pase.

 Siempre se lo debo decir a los demás por

 Todas las acciones que realizó siempre necesito comunicárselo a

los demás.

19
 Los chicos generalmente se la agarran conmigo por

 Soy el centro de las bromas que realizan mis compañeros

- Validez de Constructo: El procedimiento utilizado para la

validez de constructo consistió en correlacionar los sub test y el total del

test de autoestima.

- Confiabilidad: EL Inventario de autoestima se aplicó a una

muestra de 99 estudiantes de la Universidad Nacional Santiago Antúnez

de Mayolo, cuyas características eran similares a la población

investigada. Obtenido los puntajes totales se procedió a ordenar a los

alumnos en dos grupos 25% con puntaje alto y 25% con puntaje bajo,

una vez ordenado los datos se obtuvo de ellos la desviación estándar, el

promedio y la varianza de cada uno de los items del test, finalmente

para obtener el coeficiente de cada test se aplicó la formula de kuder

Richardson (r20).

INVENTARIO DE SATISFACCIÓN CON LA PROFESIÓN

ELEGIDA.

a) FICHA TÉCNICA

Autora: Jesahel Vildoso Colque

Año de Edición: 1998

Ámbito de Aplicación: Jóvenes de 16 años a más.

Forma de Administración: Individual y Colectiva.

Áreas que Explora:

20
El inventario está estructurado sobre la base de la jerarquía de

necesidades de Abraham Maslow, entre las que destacan las

necesidades fisiológicas, seguridad, pertenencia, amor, estima de sí

mismo y de actualización del yo. Cabe señalar que para Maslow la

necesidad fisiológica es inferior pero potente, si ella no es satisfecha las

demás no podrán serlo, son impulsos como el hambre, la sed, el sexo, el

sueño etc. Por lo tanto consideramos que esta necesidad es básica y que

de no ser satisfecha no se podría estudiar, por ello es que sólo a partir de

la necesidad de seguridad se ha construido el inventario. A continuación

presentamos las necesidades que constituyen el inventario de

satisfacción con la profesión elegida.

· Necesidad de seguridad: El estudiante tiene la necesidad de

verse libre del miedo, del caos, así la profesión elegida garantizará la

protección física (abrigo, techo, salud) y comodidad, es decir lograr

cierta estabilidad en el medio.

· Necesidad de pertenencia: El estudiante desea pertenecer a

una institución, un grupo, un equipo, o ser parte de una comunidad

profesional que irradie valor para él, así pues el alumno se agrupa por

afinidad, simpatía, necesidad y otros. Cabe señalar que es parte de ésta

necesidad la búsqueda de establecer relaciones afectuosas, lograr un

lugar en el grupo y ser alguien importante dentro de él

· Necesidad de estima: La estima del estudiante lo conduce a

sentimientos de autoconfianza, autoevaluación, automotivación,

21
capacidad y suficiencia de ser útil y necesario. Pues ésta necesidad a

través de la profesión elegida busca prestigio, estatus, aprecio, así como

el deseo de fuerza, logro, competencia, independencia y libertad.

· Necesidad de autorrealización: En esta necesidad se

presenta en el estudiante el impulso místico o espiritual tales como el

servicio a los demás mediante la profesión elegida, piedad, amor al

desvalido, amor al prójimo. Cabe señalar que la necesidad de

autorrealización del alumno es el deseo de desarrollar al máximo sus

potencialidades.

b) DESCRIPCIÓN DE LA PRUEBA.

El Inventario de Satisfacción con la Profesión elegida está

constituida por 4 sub test: seguridad, pertenencia, estima, y

autorrealización. El Inventario tiene una duración de 20 a 30 minutos,

presenta 33 ítems, con 5 respuestas alternativas:

 Totalmente de acuerdo

 De acuerdo

 Ni de acuerdo ni en desacuerdo

 En desacuerdo

 Totalmente en desacuerdo.

Los items se elaboraron procurando un 50% de items positivos y un

50% de items negativos, como corresponde a una escala Lickert, brinda

22
información acerca de la satisfacción de los alumnos con la profesión

elegida.

c) NORMAS DE CORRECCIÓN

Para realizar la corrección del inventario fue conveniente

mencionar los items negativos, ello son:

3,6,7,13,14,15,18,19,20,22,24,25,28,29,32,33.

Por lo tanto la alternativa positiva y negativa presentará características

diferentes así:

ALTERNATIVA POSITIVA:

· (TA) Totalmente de acuerdo = 5 puntos

· (DA) De acuerdo = 4 puntos

· (NA) Ni de acuerdo ni en desacuerdo = 3 puntos

· (ED) En desacuerdo = 2 puntos

· (TD) Totalmente en desacuerdo = 1 punto

ALTERNATIVA NEGATIVA:

· (TA) Totalmente de acuerdo = 1 puntos

· (DA) De acuerdo = 2 puntos

· (NA) Ni de acuerdo ni en desacuerdo = 3 puntos

· (ED) En desacuerdo = 4 puntos

· (TD) Totalmente en desacuerdo = 5 punto

El puntaje total se obtiene sumando el resultado de cada item.

Así por ejemplo: Item 2: "La profesión que he elegido me garantizará

estabilidad y bienestar económico" Si el estudiante "X" ha marcado en

el item 2 la alternativa (a) entonces tiene 5 puntos en este item. Por ser

23
una alternativa positiva. Así: Alumno “X": Item1 + item2+ item3+……

item33 = puntaje total 4 + 5 + 2 ...... 1 = 80 De acuerdo a la norma

elaborada para el inventario de satisfacción con la profesión elegida el

puntaje total de 80 corresponde a un nivel de insatisfacción con la

profesión elegida de parte del estudiante.

d) VALIDEZ Y CONFIABILIDAD

· Validez de contenido: El instrumento fue presentado a 01

psicólogos, con la finalidad de recolectar sugerencias acerca de la

redacción de los items, considerando las recomendaciones respectivas

se procedió a realizar cambios en algunos items respecto a la forma de

expresión.

- Validez de Constructo: Para la validez de constructo se utilizó

el siguiente procedimiento: correlacionar los sub tests y el total del test

de satisfacción con la profesión elegida.

· Confiabilidad: La confiabilidad del instrumento se realizó con

una muestra de 99 estudiantes pertenecientes a la Facultad de Ciencias

de la Universidad Nacional Santiago Antúnez de Mayolo cuyas edades

oscilan entre 16 y 25 años, Obtenido los puntajes totales se procedió a

puntaje bajo, una vez ordenado los datos se obtuvo de ellos la

desviación estándar, el promedio y la varianza de cada uno de los items

del test, finalmente para obtener el coeficiente de cada test se aplicó la

formula de kuder Richardson (r20).

2.2.2.-Modelo de regresión lineal múltiple Bayesiano:

El modelo es el siguiente:

24
Donde:

Y = Rendimiento Académico.

X1 = Inventario de Autoestima.

X2 = Inventario de Satisfacción con la Profesión elegida.

X3 = Edad de los alumnos.

2.2.2.1.-Teoría del Modelo de Regresión Bayesiano:

A.- Teorema de Bayes

Sea y = (y1, y2,..., yn)’ un vector de n observaciones cuya

distribución de probabilidad p (y/θ) depende de k parámetros

involucrados en el vector θ = (θ1,θ2,...,θk)’. Supóngase también que θ

tiene una distribución de probabilidad p(θ). Entonces, la distribución de

probabilidad condicional de θ dado el vector de observaciones y resulta:

p ( y /  )  p ( )
p ( / y )  con p(y)≠0 (1)
p( y)

A esta ecuación se lo conoce como el teorema de Bayes, p (y) es

la distribución de probabilidad marginal de y, y dado que los datos son

conocidos, su valor es completamente determinado con que Teorema de

Bayes puede ser escrito como:

p( / y )  c. p( y /  ). p( )) α p( y /  ). p( ) (2)

En esta expresión, p(θ) es la distribución a priori de θ y

representa la información que se tiene sobre el parámetro θ antes de

recolectar los datos, p(θ/y) es la distribución posterior de θ dado y y

25
representa la información que se tiene sobre θ después de recolectar los

datos. Este proceso de revisión de las probabilidades iníciales, dada la

información muestral, se ilustra en la figura Nº1.

Figura Nº1.

Combinación de la información a priori y muestral a través del

Teorema de Bayes.

Dist. a
priori
Información
p(θ)
inicial
Teorema Dist.
de Bayes Posterior
Información p (θ/y)
nueva Func. de
Verosimi
litud
l(θ/y)

Por ultimo, es conveniente señalar que la información muestral

y por lo general será introducida en el modelo a través de estadísticas

suficientes para θ, dado que estas contienen toda la información

referente a los datos.

B.- Naturaleza secuencial del Teorema de Bayes

Dada una muestra inicial y1, por la fórmula de Bayes dada en (2)

se tiene que:

p( / y ) α p( y /  ). p( )
1 1

Ahora, para una segunda muestra y2 independiente de la primera

muestra:

26
p( / y,y ) α
1 2
p( y1 , y2 /  ). p( )  p( y1 /  ). p( y2 /  ). p( )

p( / y,y) α
1 2
p( y2 /  ). p( / y)
1

De esta manera, la distribución posterior p (θ/y1) obtenida con

la primera muestra se convierte en la nueva distribución a priori para ser

corregida por la segunda muestra.

Este proceso puede repetirse indefinidamente. Así, si se tienen r

muestras independientes, la distribución posterior puede ser recalculada

secuencialmente para cada muestra de la siguiente manera:

p( / y ,..., y ) α p( ym /  ). p( / y1 ,..., ym1)


1 m
para m =2,..., r

C.- Distribución posterior con información a priori difusa.

Cuando no se tiene información previa sobre los parámetros, la

selección de una distribución a priori adecuada adquiere una

connotación especial pues será necesario elegir una distribución que no

influya sobre ninguno de los posibles valores de los parámetros. Estas

distribuciones a priori reciben el nombre de difusas o no informativas y

han sido ampliamente estudiadas por varios autores. Algunos criterios

importantes para su elección los constituyen el principio de la razón

insuficiente de Laplace, la teoría de invarianza y el método de Jeffreys.

Esta teorías conducen a considerar distribuciones a priori uniformes en

caso el parámetro sea de posición y uniformes sobre el logaritmo del

parámetro sea de posición y uniformes sobre el logaritmo del parámetro

en caso sea de escala.

27
Ahora, se aplicarán estos conceptos para inducir una distribución a

priori no informativa para el modelo de regresión lineal múltiple:

y  X  

Supóngase que los errores son independientes y normalmente

distribuidos con media cero y varianza σ2, esto es, ε ~ Nn [0, σ2 I].

Entonces la verosimilitud p(y/β,σ2) será una Nn [X β, σ2 I]. Dadas las

estadísticas conjuntamente suficientes para β y σ2:


  ( X ' X ) 1 X ' y Estimador de Mínimos Cuadrados Ordinarios

 
( y  X  )' ( y  X  )

2
s v=n-k (3)
v

p(y/β,σ2) puede expresarse en función de s2 y  como:

 1  2 
) 
 
1
p( y /  ,  2)  exp  v s  (    )' X ' X (   
(2 ) 
n/2 n
 2 
2
 


Dado que β es un parámetro de posición y σ un parámetro de

escala, las distribuciones a priori no informativas (difusas) serán:

p(β) α 1 p(σ2) α 1 2

y asumiendo independencia a priori entre β y σ2:

1
p(  ,  2)  p(  ). p( 2) α

2

Ahora, por el Teorema de Bayes, la distribución posterior p(β,σ2/y) es:

p(  , 2 / y) α p(  ,  2). p( y /  ,  2)

p(  ,  2 / y ) α  1  2 
)  (4)
 
1
exp  v s  (    )' X ' X (   

n2
 2 
2
 


28
Esta expresión puede presentarse como el siguiente producto:

p(  ,  2 / y )  p( 2 / y ). p(  / y,  2)

con:

 v 2
exp  s 2   1
exp 


(    )' X ' X (    )

p( 2 / y) α  2   ; p(  /  2 , y ) α  2  2

 
2 v / 2 1

k

Donde p( 2 / y) es la distribución posterior marginal de 


2
y

p(  /  2 , y ) la distribución posterior condicional de  dado 


2
.

Aquí se puede notar que:

 v v 2 y
N   , ( X ' X )  

(5)
p( 2 / y)  Gamma  Inv , s  p(  /  , y ) 
2 1 2
k
 2 2 

Ahora, integrando sobre  la distribución posterior conjunta dada en

(4), se obtiene la distribución posterior marginal de  que es:


p(  / y )  t k (v,  , s2 ( X ' X ) 1 ).

Para derivar la distribución posterior marginal de un conjunto de

k1 elementos de , se integrará p(  / y ) con respecto a los k2

elementos restantes (k1 + k2 = k).

Sean las matrices: H  X ' X   H 11 H 12  y 1   H 11* H 12*   ( X ' X ) 1 2 ,


  H   s
 H 21* H 22*
2
s  H 21 H 22

1 el vector que contiene a los k1 parámetros de interés, 2 el vector

1
que contiene a los k2 parámetros restantes y H 11 la matriz que contiene

las varianzas y covarianzas de los k1 parámetros de 1 dados los k2

29
parámetros de 2 . Tras integrar p(  / y ) con respecto a  2 se

obtiene que p(  / y )  t (v,  , H 11*).
1 k 1 1

Por último, para obtener la distribución posteriori marginal de

un elemento de  , digamos  i , bastará con hacer k1 = 1 y entonces


p(  i / y )  t (v,  i, hii*) que es una distribución t-Student


univariada con v grados de libertad, parámetro de posición  y

parámetro de escala h ii* , donde h ii* es el elemento (i, i) de

2 1
s (X ' X ) .
D.- Distribución posterior con información a priori conjugada.

 
2
En esta situación, los parámetros y tiene cierta

distribución a priori conocida. Ya que la distribución Normal-Gamma

Inversa es conjugada con la verosimilitud Normal correspondiente al

vector de datos y, la presente metodología partirá de los resultados

obtenidos en la sección anterior. Así, las distribuciones posteriores

p( 2 / y) y p(  /  2 , y ) indicadas en (5), calculadas a partir de

una muestra inicial (y1, X1), serán las distribuciones a priori en esta

sección a las que se denotará como:



 2

)  Gamma  Inv v0 , v0 s0  y p(  /  )  N k (  0 ,  M 0 )
2 2 1
p( 2

2 2 

con los parámetros definidos según lo expuesto en (3).

30
Ahora, para una segunda muestra (y2, X2) de n2 observaciones

independientes de las n1 iníciales la función de verosimilitud de los

datos será:

 1 
p( y2 /  ,  ) 
2 1
exp    y  X   
2  ' y2  X 2  
(2 ) n  n  2
2

/2 2
2 2

y por el Teorema de Bayes la distribución posterior conjunta de  y


2
será:

p(  ,  / y)α p( y2 /  ,  ). p(  ,  )
2 2 2
2

 v s2   1  

exp   exp  (    )' M (    )
p(  ,  / y)α  2    2
2 2
2

2
  2 v / 2 1

k

Donde:

v = n1 + n2 – k M X X X X M X X
'
1 1
'
2 2 0
'
2 2


  ( X 1' X 1  X '2 X 2) 1 ( X 1' y1  X '2 y2)  M 1 ( X 1' y1  X '2 y2)
   
( y1  X  )' ( y  X  )  ( y  X  )' ( y  X  )
s 
2 1 1 1 2 2 2 2

v

Con s2 y  estadísticas conjuntamente suficientes para  y


2
. En esta expresión, el primer término corresponde a la distribución

posterior marginal p( 2 / y2 ) y el segundo término corresponde a la

31
distribución posterior condicional p(  /  2 , y2 ) , las cuales quedan

definidas como: p( 2 /  v v s2 


y2)  Gamma  Inv , 
2 2 

p(  /  2 , y2)  N ( , M )
k
2 1

Análogamente al caso anterior, se puede concluir que:

 La distribución posterior marginal de  , p( / y2 ) es una

t (v,  , s M ) .
2 1
k

 La distribución posterior marginal para un conjunto 1 de k1


elementos de , p(1 / y2 ) es una t k (v,  1, H 11*) donde H 11*
1

contiene los elementos de s2M-1 correspondientes a las varianzas y

covarianzas de 1 .

 La distribución posterior marginal para un elemento i de ,



p(i / y2 ) es una t (v,  i, hii*) donde h ii* es el elemento (i, i) de

s2M-1. correspondientes a las varianzas y covarianzas de 1 .

 La distribución posterior marginal para un elemento i de ,


p(  i / y 2 ) es una t (v,  i, hii*) donde h ii* es el elemento (i, i) de

s2M-1.

Como se comentó anteriormente, debido a la naturaleza

secuencial del teorema de Bayes, la distribución posterior puede ser

corregida indefinidamente conforme nueva información muestral sea

disponible. Según lo expuesto en esta sección, esta corrección se realiza

32
sólo mediante una actualización de los parámetros de las distribuciones

Gamma Inversa y Normal iníciales.

 y :
2
Sean las siguientes distribuciones para


  2

y )  Gamma  Inv v , v s  p( /  , y0)  N k ( 0 , M 0 )


2 2 1
p( 2 / 0 0 0

2 2 
0

Las expresiones a continuación presentan la forma en la que los

v0 , M 0 ,  0
2
parámetros y s 0
son actualizados por la nueva

información muestral (X, y, n) para obtener los valores posteriores


 2
v, M ,  y s .

1) v = v0 + n

2) M = M0 + X’X
 
3)   ( M 0  X ' X ) 1 ( M 0  0  X ' y )

 '  ' 

v s  y' y   0 M 0  0   0 (M 0  0  X ' y)
2

s  0 0
2
4)
v

E.- Distribución predictiva posterior.

Ahora se calculará la función de densidad de probabilidad

predictiva para un vector de “q” futuras observaciones

y  (~
~ yn1 , ~
yn 2 ,.., ~
yn q ) las cuales pueden ser representadas por el

siguiente modelo:

~ ~  ~
y  X (6)

Desde que ~ ~ Nq [0, σ2 I] y por (6), se tiene que:

1  1 
y /  ,  2) 
p( ~ y  X~ )' ( ~
exp  2 ( ~ y  X~ )
2  
q/2 q
 2 

33
y a partir de este resultado y de la distribución posterior conjunta de 

 ~y , 
2
y , se puede calcular la distribución posterior conjunta para

y :
2

y ,  ,  2 / y )  p( ~
p( ~ y /  ,  2) p(  ,  2 / y )

Ahora, para obtener la distribución posterior de ~y será necesario

integrar y ,  , 2 / y)
p( ~ con respecto a  y 
2
, tras lo cual se

obtiene:

(vq) / 2
 
 1   
p ( y / y ) 1  ( y  X  ) H ( y  X  ) 
 v 
 

F.- Varianzas heterogéneas y correlaciones.

El modelo tratado hasta el momento parte del supuesto de que

los errores son independientes y normalmente distribuidos con media


2
cero y varianza común . Cuando las varianzas son heterogéneas y

los errores correlacionados, la verosimilitud de los datos es:

y ~ N [ X ,  
n y

Donde Σy es una matriz nxn, simétrica, definida positiva.

Gelman (4) y Séller (9) presentan metodologías similares para este

caso.

34
Cuando la matriz de varianzas Σy es conocida y partiendo de una

distribución a priori uniforme no informativa para , la distribución

posterior podrá ser obtenida multiplicando ambos lados de (7) por el

factor de Cholesky  1/ 2
y
(Gelman(4)), con lo cual se obtiene:

 1/ 2
y
y~ N [ n
1/ 2
y
X , I 

y la distribución posterior condicional p (  /  y , y ) será una

N [ , ( X '  X ) 
 

k
1
y
1
con   ( X '  y1 X ) 1 X '  y1 y.

Si la matriz de covarianzas Σy es desconocida, el análisis

consistirá en dividir el problema de inferencia en dos partes, la

inferencia posterior para  dada  y


que ya fue tratada y la

inferencia posterior para  y


.Sin embargo, el tratamiento de este

problema será complicado desde que tanto ˆ como ( X '  y1 X ) 1

dependen de  y
y a la vez determinan una distribución a priori para

 y
.

El problema de heterocedasticidad es un caso particular en el

  Q
2
que la matriz de covarianzas y y
, con la matriz Q y

conocida y el parámetro desconocido. A partir de la distribución a priori

no informativa p (  ,  2) α 
2 1 / 2
, será necesario calcular Q y
y

repetir el procedimiento planteado cuando  y


es conocida, esto es,

35
1 / 2
multiplicar ambos lados de (7) por Q . En este caso, las estadísticas
y

 y
2
conjuntamente suficientes para son:

1 1
  ( X ' Qy X )' X ' Qy X Estimador de Mínimos Cuadrados

Generalizados

 y  X  ' Q1  y  X  
  y  v=n–k
y s  (8)
2

y un análisis similar al expuesto en 3. resultará con las siguientes

distribuciones posteriores:

v   
p 2 / y   Gamma  Inv , vs  p(  /  , y )  N k   /  , X ' Q y X    
1
2
1
2 2
(9)
2 2  

Por último, el modelo de regresión lineal ponderada es un caso

particular del modelo de regresión lineal general tratado en esta sección

en el que  y
es una matriz diagonal con sus elementos dados por:

 
2

ii
w i

w1, w2,..., wn son conocidos como pesos o ponderaciones. Luego, los

resultados dados en (8) y (9) pueden ser adecuados a esta situación

haciendo:

 1 1 
Q  diag w ... w 
1
Q  diag  ...  y 1 n
 w1 wn 
y

G.- Inferencia Bayesiana.

G.1 estimación puntual

Desde la perspectiva Bayesiana, el estimador máximo verosímil

de un parámetro es la moda más grande de la distribución posterior

36
p ( / y ) . Sin embargo, la media y la mediana de p ( / y ) pueden

ser también buenos estimadores de  y su cálculo a partir de una

forma funcional conocida para p ( / y ) por lo general resulta

 
2
sencillo. Como la distribución posterior condicional de dado ,


p(  /  2 , y ) , es una N ( , s M )
k
2 1
y la distribución posterior

 v,  , 2
 , p(  / y ) s M  , la media de
1
marginal de , es una tk 


 es , valor que coincide con la moda y la mediana debido a la

simetría de las distribuciones Normal y t.


2
Para el caso de , la moda de la distribución

Gamma  Invv / 2, v s2 / 2 es:

v s2
 
2
mod
v  2
Dado que p( 2 / y) no es simétrica, la media posterior

 / y    difiere del valor de la moda. Si bien este estimador no es



2
p 2
E

2
el valor más probable de , si es el de menor varianza posterior por

lo que seria conveniente observar ambos estimadores junto a sus

respectivas varianzas posteriores.

Desde las propiedades de la distribución Gamma Inversa, se puede

calcular la media y la varianza posterior de  :


2

 / y  
   vvs
2
v

2

E 1
p p 2
para
2 2

37
V E
p p  2
/y   2
 
p 2

2 v2 s 4
v  2 v  4
2
para
v
2
2

V V  
p p p
Donde , es la varianza posterior del estimador . La
p

varianza posterior para la moda es:V p



2
mod
V p   p
  2mod 
2

G.2 Regiones HPD.

La característica principal de los intervalos HPD es que

cualquier punto contenido en la región tiene una densidad de

probabilidad mayor o igual a la de cualquier punto fuera del intervalo.

Así, dado un parámetro , una región R deberá cumplir con las

siguientes condiciones para ser una región HPD con contenido de

probabilidad (1-α) para  .

a) Pr    R / y  1  

b) p i / y   p j / y  i  R,  j  R. (10)

Un problema con las regiones HPD es que no son invariantes a las

transformaciones 1 a 1, a no ser que la transformación sea lineal. Una

alternativa a este problema son los intervalos centrales de probabilidad

posterior (Gelman (4)), cuyos límites corresponden en el caso de un

intervalo de (1-α) a los cuantiles (α/2) y (1-α/2) de la distribución

posterior.

Dado que la distribución posterior para un i con 


2
desconocido es

una t  v,  i , h  , los límites inferior y superior para una región HPD



*

 ii 

con contenido de probabilidad (1-α) para i estarán dados por:

38

 iI
 t  / 2 hii  
*

i (11)
 
 iS
 t 1   / 2 hii    t  / 2 hii  
* *

i i

Donde t(α/2) y t(1-α/2) son los cuantiles (α/2) y (1-α/2) de la

distribución t de Student con v grados de libertad.


2
Para el cálculo de una región HPD para , dado que la distribución

posterior Gamma Inversa no es simétrica, será necesario recurrir a

métodos numéricos.

G.3.- Prueba de hipótesis.

En pruebas de hipótesis clásicas, dada una hipótesis planteada

H 0 :   0 y una alternativa H1 :   1 , un procedimiento de

prueba es evaluado en términos de las probabilidades de contener un

error tipo I y de tipo II. En el análisis Bayesiano, será necesario calcular

las probabilidades posteriores  0


 Pr  0 / y y

1  Pr  1 / y correspondientes a H0 y H1, y tomar una

decisión de acuerdo a estos valores.

Sean  0 y 1 que denotan las probabilidades a priori para H0 y H1. La

cantidad:

B  0
/ 1  0 1

 0 /  1  1 0
es llamada el factor de Bayes a favor de H0.

El interés en el factor de Bayes está en que representan la razón

de verosimilitud de H0 a H1 dada por los datos muestrales, ya que:

39
f  y /  0  1 f  y /  0
B  0 1   0 
 1 0  1
f  y /  1 0 f  y /  1

De esta manera, si B es mayor que 1 entonces la información

muestral habrá favorecido a la hipótesis planteada.

Una prueba de hipótesis de un lado para i puede ser evaluada

fácilmente en términos de estas probabilidades. Sean las hipótesis

H :    y H 1 : i  1 , donde  está enteramente a un


0 i 0 0

lado de 1 . Se sabe que la distribución posterior marginal de i ,

p(i / y) , es una t
 v,  i , hii 

 , por lo que estandarizando, las


*

 

probabilidades posteriores pueden ser calculadas de la siguiente manera

 0    t  v,  i , hii  i   t v t



* 1  1   0
  
*
0 0

, donde *0 es el espacio paramétrico trasformado tras la

estandarización. Si la distribución a priori p(  i ) es conocida, 0 y

 1 pueden calcularse de manera similar.


El caso de una hipótesis planteada de la forma H :  
0 0
es

un poco más complicado, pues resulta poco razonable desde un punto

de vista Bayesiano que  , que es una variable aleatoria continua, sea

igual a 0 exactamente. Así, las probabilidades posteriores α0 y α1

serian 0 y 1 respectivamente sin importar los valores de las hipótesis a

probar y la distribución posterior. Berger (2), expone que más razonable

sería plantear H :  
0 0
, con 0    b,   b , donde b es

40
un vector de constantes escogidos tal que si  esta en 0 pueda ser

considerado indistinguible de 0 . Luego, el problema obvio consiste

en determinar que tan grande debe ser b.

Una solución de interesante al problema es la presentada por

Box (3). Su planteamiento consiste en calcular una región HPD de

    10 ,  20 ,...,  k 0  está
'
contenido (1-α) para y verificar si 0

dentro o fuera de la región.

En (10) se vió que dada R, una región HPD, para todo  i  R ,

 j  R , se cumple que:

p(  i / y )  p(  j / y )

   10 ,  20 ,...,  k 0  y dada R, una región HPD


'
Entonces, dado 0

de contenido (1-α) para  se tiene que:

si Prp( / y)  p( 0 / y)  1   entonces

0  R y si

Prp (  / y )  p (  j / y )  1   entonces

0  R

N   ,  M 

Dado que p (  / y )  k
2 1
es una función monótona

decreciente de la cantidad:


   

' M 
   


   
2
ks

41
p(  / y ) será mayor que p( 0 / y) si y sólo si el valor F(k,v) es

    ' M     
menor que    0  . Por lo tanto,  estará dentro
0

2 0
ks

de la región HPD si:

  
 0    ' M 
 0   
 

 
   
Pr  F ( k , v)   1
 k s2 
 
 
  

  0   ' M   0    
     F ( k , v,1   )
k s2

Supóngase ahora que el interés esta en un conjunto de k 1

elementos de  agrupados en el vector 1 , cuya distribución posterior

marginal es una t  v,  1 , H  . Entonces, siguiendo el mismo



*
k1 
11 

desarrollo anterior, 
'

10
  10
,  20 ,..., 
k 10
 estará dentro de la
región HPD de contenido (1-α) si:

 
'  

  10    H 11   10   k 1 F k 1 , v,1   
1
*

 1
  1

Este procedimiento constituye una justificación Bayesiana para

el análisis de varianza clásico. A partir de estos resultados Box (3)

presenta la descomposición de la variabilidad para una hipótesis

planteada de la forma   0 . En el cuadro Nº 1 se presenta el

ANVA para la hipótesis usual en regresión,

H :     ...    0 , sin considerar el intercepto 1 .


0 2 3 k

42
Cuadro: Análisis de varianza para evaluar la significancia del modelo de
regresión.
Fuentes de Suma de Cuadrados
G.L. Razón de Cuadr. Medios
Variabilidad Cuadrados Medios

     
Parámetros
 ' s H 11 
2 1  ' s H 11 
2 1
*
 ' s H 11 
2 1

~F(k-1,v)
1 1 *
*
1 1
1 1
k–1 k 1
Residual
vs 2
2 k 1
v
s

2.2.3. Técnica.

Las técnicas de recolección de datos utilizados fueron:

Primer paso: Recopilación de la información inicial ósea la muestra a

priori para luego hacer la predicción y explicación en el análisis de

regresión múltiple bayesiana, una forma de modelo lineal general que

es una técnica estadística de análisis multivariante utilizada para

examinar las relaciones entre una única variable criterio y un conjunto

de variables independientes.

Segundo paso: Obtención de la información muestral revisar los

aspectos del diseño de la investigación, es decir, el éxito en la

aplicación del análisis de regresión lineal múltiple bayesiana requiere

tener en cuenta varias cuestiones.

Tercer paso: Combinación de la información inicial o a priori y la

información muestral a través del teorema de Bayes para la obtención

de la información a posteriori, interpretación de los resultados, si la

regresión lineal múltiple bayesiana es estadísticamente significativa y la

precisión en la clasificación es aceptable y realizar la validación de los

43
resultados, para asegurar que los resultados tengan validez tanto interna

como externa.

Al mismo tiempo, se hizo uso de las siguientes pruebas estadísticas.

LA PRUEBA DE MARDIA PARA NORMALIDAD

MULTIVARIADA.

Este estadístico es utilizado para la justificación del supuesto de

normalidad multivariada, y esta propuesto de la siguiente manera:

Consideremos que X'j (j=1,2,....,n) representan las observaciones en la

muestra, y si se consideran “p” variables predictoras, entonces cada X'j

es un vector columna p-dimencional. Deseamos probar que el vector

aleatorio X=(X1,X2,...,Xp), se distribuye en forma normal multivariada.

Mardia basa su prueba en la estimación de la siguiente medida:

1 n
   
X j  X )´ S 1 ( X j  X 
2
b
n j 1

Si la hipótesis nula Ho: X es normal multivariada en la muestra,

entonces se puede mostrar que para “n” grande:

b  p( p  2) 
 N (0,1)
8
  p( p  2)
n

HETEROCEDASTICIDAD

CONTRASTE DE GOLDFELD Y QUANDT

44
En el contraste de Goldfeld y Quandt (1965), frente a la

hipótesis nula de homoscedasticidad, se considera la hipótesis

alternativa de que la varianza de las pertubaciones es una función

monótona creciente de una variable explicativa. Designando por Xj a

dicha variable explicativa, la H0 y la H1 se formulan mediante las

siguientes expresiones:

H :        
2 2 2 2
0 1 2 T

H :  f X 
2
1 t c jt

El contraste de Goldfeld y Quandt también se puede aplicar a

casos en que, en lugar de una sola variable, se considere una

combinación de variables. Además se puede adaptar al caso de que la

función sea monótona decreciente.

Se calcula el estadístico:

T  k
GQ  SCR2 2

SCR T 1 1
 k

Bajo la hipótesis nula el estadístico GQ tiene la siguiente

distribución:

GQ  F
T 2  k ,T 1 k

Para un nivel de significación ≈, y designando por


FT k , al valor que deja a su derecha ≈ de la masa
2 T 1 k

probabilística en la distribución señalada, la decisión a tomar es la

siguiente:

45

Si GQ  F T 2
k ,
T 1 k j
se rechaza la H 0


Si GQ  F T 2
k ,
T 1 k j
no se rechaza la H 0

Así pues, cuanto más elevados sean los valores del estadístico

GQ más posibilidades existen de rechazar la hipótesis nula de

homocedasticidad.

Para la interpretación de los resultados de este contraste, téngase

en cuenta que se está contrastando la hipótesis nula de

homoscedasticidad, frente a la hipótesis alternativa de que la

heterocedasticidad está provocada por la variable Xj. Si no se rechaza la

hipótesis nula, no quiere decir que las perturbaciones sean

homoscedásticas, sino simplemente que no existen evidencias empíricas

para aceptar el esquema concreto de heterocedasticidad postulado en la

hipótesis alternativa.(Ezequiel Uriel-2005).

MULTICOLINEALIDAD.

La detención del grado de multicolinealidad se considera más

precisa siguiendo el procedimiento de comparación de correlaciones

bivariante, de dos variables por separado, mediante la matriz de

correlación. Ellos de debe, precisamente, a que se analiza de manera

simultánea la correlación de cada variable independiente con las demás

independientes. A favor de este procedimiento de detención de

multicolinealidad también está la facilidad de su ejecución gracias al

estadístico llamado tolerancia y mediante su reciproco, el factor de

inflación de la varianza.

46
La tolerancia se define como la cantidad de variabilidad de la variable

independiente que no es explicada por otras variables independientes.

Su valor se obtiene de la siguiente manera.

TOLi  1  Ri2

Donde, Ri2 es la correlación múltiple cuadrada de la variable

independiente X i y las otras variables independientes.

TOLi tiene un rango de valores de 0,0 a 1,0. Un valor próximo a 1,0

denota la ausencia completa de multicolinealidad: la variable X i no

presenta ninguna correlación con el resto de las variables predictoras.

Un valor de tolerancia inferior a 0,20 es , en cambio, indicativo de un

grado elevado de multicolinealidad. Si el valor desciende a 0,10, la

multicolinealidad es muy alarmante y exige la adopción de alguna

medida para reducirla. El valor 0,0 expresa multicolinealidad perfecta.

En consecuencia, interesan valores de tolerancia elevados porque son

indicativos de una baja multicolinealidad.

El factor de inflación de la varianza (FIV), es el inverso de la tolerancia.

Su definición es la siguiente:

1
FIVi  TOLi 1 
I  Ri2

Al ser inverso de tolerancia interesan valores de FIVi bajos, cuando


más se aproxime a 1,0 mejor. Un valor de FIV de 1,0 indica la
inexistencia de relación entre las variables predictoras. Valores

47
superiores a 10,0 expresan multicolinealidad severa.

AUTOCORRELACIÓN.

Un contraste muy importante para detectar la autocorrelación es

el contraste de Durbin-Watson, según el cual el estadístico:

  0
T  
 (u  u t 1 )2  DW  2

si

DW  t 1
T
 2(1   )   DW  0 si  1 
u
i 1
2
t

 DW  4 si   1 

Se puede adoptar la regla no demasiado rigoroza de que si DW

vale 0 hay autocorrelación perfecta positiva; si DW se aproxima a 2 no

hay autocorrelación y si DW se aproxima a 4 hay autocorrelación

perfecta negativa. No obstante DW se encuentra tabulado, y según la

franja en la que caiga su valor, se acepta o rechaza la hipótesis de

autocorrelación. En la tabla de DW elegimos la columna relativa a k

(número de variables en el modelo) y la fila relativa a T (tamaño

muestral), lo que nos da los valores d L y dU . Se tiene:(C. Pérez López)

DW < d L  se rechaza  = 0 y se acepta  > 0.

DW > 4- d L  se rechaza  = 0 y se acepta  < 0.

d L < DW < 4- dU  se rechaza  = 0.

4- d L < DW < 4- dU ó d L < DW < dU  Indeterminación.

autocorrelación ...........no autocorrelación


........ positiva ......?....... autocorrelación ......?........ ......negativa
dL dU dL dU

48

S-ar putea să vă placă și