Sunteți pe pagina 1din 17

Revista Facultad Nacional de Agronomía -

Medellín
ISSN: 0304-2847
rfnagron_med@unal.edu.co
Universidad Nacional de Colombia
Colombia

Echavarría Sánchez, Hernán; Correa Londoño, Guillermo; Patiño Díez, Juan Fernando; Acosta
Jaramillo, Juan José; Rueda Restrepo, Jairo Alberto
EVALUACIÓN DE MÉTODOS ESTADÍSTICOS UTILIZADOS EN TRABAJOS DE GRADO Y TESIS
DE LOS PROGRAMAS DE LA FACULTAD DE CIENCIAS AGROPECUARIAS, EN UN PERÍODO DE
TRES AÑOS
Revista Facultad Nacional de Agronomía - Medellín, vol. 59, núm. 2, 2006, pp. 3565-3580
Universidad Nacional de Colombia
Medellín, Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=179914075012

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
EVALUACIÓN DE MÉTODOS ESTADÍSTICOS UTILIZADOS EN TRABAJOS
DE GRADO Y TESIS DE LOS PROGRAMAS DE LA FACULTAD DE CIENCIAS
AGROPECUARIAS,
AGROPECUARIAS, EN UN PERÍODO DE TRES AÑOS

Hernán Echavarría Sánchez1; Guillermo Correa Londoño2; Juan Fernando Patiño Díez3;
Juan José Acosta Jaramillo4 y Jairo Alberto Rueda Restrepo5
__________________________________________________________________________

RESUMEN

Se hizo un censo de los métodos estadísticos usados en los trabajos de grado y tesis realizados en
un periodo de tres años (1999-2001) en la Facultad de Ciencias Agropecuarias de la Universidad
Nacional, sede Medellín. En casi la mitad de los trabajos evaluados se encontró al menos un error
(49,2 %). A nivel de pregrado, en el programa de Ingeniería Forestal se observó el menor
porcentaje de trabajos con al menos un error; mientras que el mayor porcentaje fue observado en
Ingeniería Agrícola. La mayoría de los errores se originaron en la poca claridad sobre el papel de la
estadística como herramienta para la consecución de los objetivos planteados en los trabajos, lo
cual se reflejó en que los trabajos incluyeran resultados estadísticos que en nada contribuían al
cumplimiento de los objetivos, en que se omitieran resultados relevantes para su satisfacción y/o
en que habiéndose generado resultados pertinentes, no se les diera discusión alguna.

PALABRAS CLAVE:
CLAVE Evaluación de métodos estadísticos, trabajos de grado, tesis.
________________________________________________________________________________________

ABSTRACT

EVALUATION
EVALUATION OF STATISTICAL METHODS USED IN FINAL PROJECTS AND THESIS OF THE FACULTAD
DE CIENCIAS AGROPECUARIAS, OVER A THREE-
THREE-YEAR PERIOD

A census of the statistical methods used in the final projects and thesis of the Facultad de Ciencias
Agropecuarias of the Universidad Nacional de Colombia, Sede Medellín over a three-year period
was done (1999-2001). In almost half of the evaluated works (49,2 %), at least one error was
found. At the undergraduate level, the smallest proportion of at-least-one-error works was

1
Profesor Asistente. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <hechavar@unal.edu.co>
2
Profesor Asociado. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <gcorrea@unal.edu.co>
3
Ingeniero Forestal. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias. A.A.
1779, Medellín, Colombia. <jfpatino@unalmed.edu.co>
4
Ingeniero Forestal. Smurfit Kappa Cartón de Colombia S.A. Cl 15 18-109 Puerto Isaacs Yumbo, Cali, Colombia.
<juan.acosta@smurfitkappa.com.co>
5
Instructor Asociado. Universidad Nacional de Colombia, Sede Medellín. Facultad de Ciencias Agropecuarias.
A.A. 1779. <jarueda@unal.edu.co>

Recibido: Febrero 24 de 2006; aceptado: Agosto 10 de 2006.

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3465-3580. 2006.


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

observed in the Ingeniería Forestal program, whereas the higher proportion was observed in the
Ingeniería Agrícola program. A great bulk of errors was originated in the lack of conscience about
the role of statistics as a tool for the achievement of objectives. As a consequence, some works
included statistical results that had nothing to do with the objectives; they omitted relevant
results and/or failed to discuss them when they appeared.

Key Words:
Words Statistical methods evaluation, Final projects, Thesis.
________________________________________________________________________________________

INTRODUCCIÓN principales errores conceptuales en que


incurrieron los estudiantes al hacer uso
En los trabajos de grado y tesis, de los métodos estadísticos, a fin de
requisitos parciales para obtener el proponer los cambios necesarios en los
título académico en programas de cursos de Bioestadística I (3000009),
pregrado y Maestría, respectivamente, Bioestadística II (3000010) y Métodos
los estudiantes hacen uso frecuente de Estadísticos para la Investigación
la estadística inferencial y, en menor (3000021).
medida, de la estadística descriptiva,
para el análisis y presentación de sus
resultados. En cualquier caso, los mé- MATERIALES Y MÉTODOS
todos deben ser seleccionados con
base en definiciones precisas de los Se realizó un censo de los trabajos de
objetivos específicos, la población ob- grado y tesis realizados en la Facultad
jetivo y las restricciones existentes en la de Ciencias Agropecuarias durante el
toma o generación de la muestra. periodo 1999–2001. No se tomaron en
consideración los trabajos realizados en
La Universidad Nacional de Colombia la especialización en Ciencia y Tecnología
tiene un compromiso con la comunidad de Alimentos, pues la exigencia para
en general, en cuanto a la veracidad del éstos es de una monografía, la cual
conocimiento que se genera a través de generalmente no implica un análisis
los trabajos de grado y tesis de sus estadístico. Inicialmente se consideraron
estudiantes; de ahí la importancia de 189 trabajos, de los que se analizaron
detectar los principales errores concep- los 179 que usaron métodos esta-
tuales en que se está incurriendo en los dísticos (172 trabajos de grado y 7 tesis
análisis estadísticos que estos conllevan, de Maestría), distribuidos así: 16
con el fin de aplicar algunas medidas trabajos de grado de Ingeniería Agrí-
preventivas que eviten la continuación cola, 55 de Ingeniería Agronómica, 45
de tal situación y que den validez de Ingeniería Forestal, 56 de Zootecnia
externa a su producción académica. y 7 tesis de la Maestría en Bosques y
Conservación Ambiental.
Mediante este trabajo se buscó deter-
minar, para el período evaluado, el Se elaboró una base de datos en la cual
porcentaje de trabajos en los cuales el se consignó información relacionada
(los) método(s) estadístico(s) utilizado(s) con los métodos estadísticos usados en
fue(ron) inadecuado(s) e identificar los cada uno de los trabajos, se evaluó el

3566 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

uso adecuado o inadecuado de los se detectó al menos un error. En cuanto


mismos, definiendo para cada uno de a pregrados se refiere, en Ingeniería
ellos una lista de errores, carencias y Forestal se observó el menor porcentaje
violaciones evidentes a los supuestos; de trabajos de grado con al menos un
todos éstos fueron denominados con el error; mientras que el mayor porcentaje
nombre genérico de “errores”. No se fue observado en Ingeniería Agrícola. El
incluyó en tal lista el uso inadecuado o porcentaje de errores fue similar en los
impreciso del lenguaje técnico. Seguida- trabajos de grado de Ingeniería
mente, se realizó un análisis descriptivo y Agronómica y en los de Zootecnia; en
se discutieron los aspectos más rele- ambos casos, tal porcentaje es cercano
vantes. al 60 %. El menor porcentaje global de
trabajos con al menos un error se
observó en las tesis de la Maestría en
RESULTADOS Bosques y Conservación Ambiental. En la
Figura 1 se discriminan los trabajos por
Evaluación de métodos estadísticos. En programas con base en la detección de al
casi la mitad de los trabajos evaluados menos un error.

100,0

80,0
Error (%)

60,0

40,0

20,0

0,0
I. Agrícola I. Agronómica I. Forestal Zootecnia Maestría Total

Sin errores 37,5 41,8 71,1 42,9 85,7 50,8

Con errores 62,5 58,2 28,9 57,1 14,3 49,2

No. trabajos 16 55 45 56 7 179

Figura 1.
1. Porcentaje de trabajos por programa en la Facultad de Ciencias
Agropecuarias, con al menos un error, 1999 y 2001.

Identificación de los principales “errores” inadecuado incluir resultados que no se


cometidos. Entre las carencias consi- mencionaron o analizaron en el trabajo
deradas genéricamente como “errores”, y que, en algunos casos, ni siquiera
una muy frecuente consistió en indicar el contribuían al logro de los objetivos
uso de métodos o pruebas, sin incluir planteados. Por otro lado, la no
ningún tipo de resultado que respaldara especificación del diseño experimental
la discusión. Asimismo, se consideró usado o la presencia de inconsistencias

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3567


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

en las tablas de resultados también se una población binomial. También se


clasificó como “error”, ya que ello calcularon, para variables ordinales,
genera dudas acerca del grado de intervalos de confianza para los
compenetración de los investigadores parámetros µ y σ.
con la situación estudiada y, por tanto,
sobre su capacidad para usar la infor- Prueba de hipótesis para dos pará-pará-
mación disponible de manera adecuada. metros.
metros. En uno de los seis trabajos que
mencionaron este método se utilizó un
Para la mención y posterior discusión valor tabular inadecuado para la
de los diferentes errores detectados, prueba realizada.
éstos se clasificaron de acuerdo al
método estadístico en el cual fueron Diseño completamente al azar.
azar. En el
hallados. No se discuten los métodos 66,67 % de los 42 trabajos en que se
en los cuales no se detectaron errores, utilizó este diseño se presentaron errores
ni aquéllos donde se incluyeron tales como no aleatorización; no
resultados que no se analizaron o donde realización de pruebas de comparación
el error consistió en no presentar de medias a pesar de que el análisis de
resultados del método utilizado. varianza resultó significativo o viceversa;
tras obtener Análisis de Varianza no
Medidas de tendencia central. En el significativos se procedió a realizar
3,25 % de los 154 trabajos en que se nuevos análisis de varianza sobre sub-
obtuvieron, se calculó la media para conjuntos de tratamientos, con el fin de
variables medidas en escala ordinal o, buscar significancia. En un trabajo se
tratándose de variables medidas en detectó el uso de seudo repeticiones,
escala de razón, se usó la media como en otros se usó el diseño completa-
medida de tendencia central en una mente al azar, a pesar de estar
muestra conformada por datos sesgados. identificada una fuente de variación
adicional a los tratamientos. En
Medidas de dispersión.
dispersión. En 4,84 % de algunos trabajos se detectaron incon-
los 124 trabajos en que se obtuvieron, sistencias en las tablas de análisis de
se calculó la varianza para variables varianza presentadas y en un trabajo se
medidas en escala ordinal. hizo una interpretación errónea de los
estadísticos calculados.
Gráficos. En el 1,52% de los 132
trabajos en que utilizó este recurso se Diseño de bloques al azar. Entre el
usaron histogramas para graficar las 40 % de los 10 trabajos en que se usó
frecuencias de variables categóricas. este diseño se encontraron los
siguientes errores: no aleatorización;
Intervalos de confianza. En el 19,44 % se ignoró la estructura factorial de los
de los 36 trabajos en los que se tratamientos; no se realizaron pruebas
usaron, se utilizó la aproximación de comparación de medias, a pesar de
normal –con un número insuficiente que el Análisis de Varianza resultó
de observaciones– para hallar inter- significativo, y en un caso se utilizó el
valos de confianza del parámetro p de diseño experimental inadecuado.

3568 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

Diseño completamente al azar con ción para el uso de los bloques; no se


arreglo factorial. Entre el 65,22 % de realizaron pruebas de comparación de
los 23 trabajos en que se usó se medias a pesar de que el análisis de
encontró como error más frecuente el varianza fue significativo y en un trabajo
evaluar efectos principales a pesar de se utilizó como criterio de bloqueo un
que la interacción entre los factores fue factor que presentaba interacción
significativa. También se observó que evidente con los tratamientos.
no se analizaron interacciones o se hizo
de manera incorrecta; se evaluaron Diseño de cuadrados latinos con
efectos de factores que no fueron arreglo factorial. Sólo un trabajo
significativos en el análisis de varianza; incluyó este diseño pero se ingnoró la
se llego a incluir menos factores de los estructura factorial de los tratamientos.
que realmente se usaron en el
experimento; se ignoró la autocorre- Diseño de parcelas divididas en el
lación entre los errores de diferentes tiempo. En seis de los 10 trabajos que
lecturas tomadas en el tiempo; se incluyeron este tipo de análisis se encon-
evaluaron efectos simples cuando la traron los siguientes errores: interpreta-
interacción entre los factores no había ción errónea de los estadísticos calcula-
sido significativa; se declararon diferen- dos; desconocimiento de la auto-
cias significativas entre los tratamientos correlación entre los errores de diferentes
sin haber realizado pruebas de com- lecturas tomadas en el tiempo; no se
paración de medias; en un trabajo no se evaluó un efecto principal significativo;
realizaron pruebas de comparación de análisis individuales en el tiempo sin el
medias a pesar de que el Análisis de respaldo de un análisis conjunto en el
Varianza fue significativo. En otros casos que se incluyera el tiempo como uno de
se usó el diseño completamente al azar, los factores; conclusiones inconexas con
a pesar de estar identificada una fuente los resultados estadísticos; declaración de
de variación adicional a los tratamientos; diferencias significativas sin el respaldo
se hizo interpretación errónea de los de las correspondientes pruebas de
estadísticos calculados o se detectaron medias, y en un trabajo el análisis de las
inconsistencias en las tablas de análisis interacciones fue incorrecto.
de varianza presentadas.
Diseño cross–
cross–over.
over. Este diseño se utilizó
Diseño en bloques al azar con arreglo en cinco trabajos y en tres de ellos se
factorial. En tres de los seis trabajos detectaron los siguientes errores: el
que usaron este diseño, el error que diseño era inadecuado para la situación y
más se presentó fue el no analizar las no se realizaron pruebas de comparación
interacciones o hacerlo de manera de medias, a pesar de haberse obtenido
incorrecta; además se evaluaron efectos un análisis de varianza significativo.
principales a pesar de que la interacción
entre los factores resultó significativa; Prueba de Kruskal–
Kruskal–Wallis. En uno de los
se detectó una fuente de variación cuatro trabajos que utilizaron esta
adicional a los tratamientos y los blo- prueba, el diseño experimental no era
ques. En un trabajo no había justifica- completamente al azar.

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3569


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

Pruebas de comparación de medias. Se presentó un modelo polinómico en el


realizaron 76 de este tipo de pruebas, cual el término de mayor orden no fue
de las cuales 31 presentaron algún tipo significativo; se hizo extrapolación; en
de error. En este informe se consi- un trabajo las conclusiones no
eraron de manera agrupada pues el correspondían con los resultados; en
error sistemático fue su uso a pesar de otro, se detectó una posible auto-
que el análisis de varianza no fue correlación de errores pues se hicieron
significativo. Adicionalmente, en un medidas repetidas en el tiempo sobre
trabajo se informó haber usado la los mismos individuos; y en dos de los
prueba de Duncan para la evaluación trabajos, se identificó que los resi-
de contrastes y en otro trabajo se duales presentaban varianzas hetero-
detectó una interpretación errónea de géneas.
las comparaciones realizadas.
Correlación. Este tipo de análisis se
Regresión simple.
simple. Se detectaron los realizó en 25 trabajos y en el 56 % de
siguientes errores en 16 de los 36 ellos se detectaron errores tales como
trabajos en que se uso el método: se usar los resultados del análisis de
usaron modelos de línea recta para correlación como prueba de causalidad
modelar asociaciones evidentemente y el uso del coeficiente de correlación
curvilíneas; se detectaron extrapola- lineal en una asociación no rectilínea.
ciones; se detectaron situaciones en que
los residuales presentaban varianzas Análisis de conglomerados. En cuatro
heterogéneas; en un trabajo se inclu- de los 16 trabajos que utilizaron este
yeron resultados que no coincidían con el método se realizaron agrupamientos
problema planteado y en otro las dentro de un mismo dendrograma con
conclusiones no correspondían con los base en diferentes puntos de corte.
resultados estadísticos.
Muestreo
Muestreo aleatorio simple. En uno de
Regresión múltiple.
múltiple. En casi el 46 % de los ocho trabajos en que se mencionó,
los 24 trabajos que utilizaron este se utilizó este esquema muestral,
método se encontraron las siguientes cuando existían estratos claramente
fallas: se realizaron extrapolaciones; se identificados.
presentó un modelo final en el cual
algunos de los coeficientes no eran Muestreo estratificado. En el único
significativos; se detectó una posible trabajo en el que se encontró este
autocorrelación de errores pues se esquema muestral se utilizó una
hicieron medidas repetidas en el tiempo fórmula incorrecta para calcular el
sobre los mismos individuos y en otro número de unidades muestrales.
trabajo, se detectó que los residuales
presentaban varianzas heterogéneas.
DISCUSIÓN
Regresión polinómica. Se detectaron
los siguientes errores entre 5 de los 11 Una discusión integral de los errores
trabajos que utilizaron el método: se detectados tendría que analizar el

3570 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

porqué de los mismos, lo cual se dificulta métodos en los cuales no se detectaron


por tratarse de eventos relacionados con errores, ni aquéllos donde el error
conductas académicas, más que con consistió en incluir resultados que no se
fenómenos naturales y por la forma en analizaron o en no presentar resultados
que se colectó la información. Es posible del método utilizado. Esta última situa-
mencionar algunos eventos que, com- ción también fue encontrada por Olsen
binados entre sí o de manera aislada, son 2003, en 14 % de los artículos revisados
determinantes en dicho proceso. El en la revista Infection and Immunity.
problema puede tener origen en una
deficiente formación en la aplicación de El hecho de que en 3 de los 5
los métodos estadísticos, lo cual a su vez programas evaluados, los trabajos con
podría deberse a un inadecuado enfoque al menos un error superaran los
de las correspondientes asignaturas o a trabajos en los que no se detectaron
la poca conciencia por parte del errores y que en general casi la mitad
estudiante de la importancia de tales de los trabajos evaluados (49,2 %)
herramientas para su transcurrir acadé- contenía al menos un error, constituye
mico en la Universidad y su posterior una alerta para estudiantes, directores
desempeño profesional. Estos errores de trabajos y jurados, pues la veracidad
podrían, asimismo, estar asociados con la del conocimiento que se generó a
inadecuada o inexistente asesoría esta- través de tales trabajos se vio afectada,
dística, así como con un deficiente no haciéndose un uso óptimo de la
seguimiento de las instrucciones suminis- información en los casos más favorables,
tradas en una adecuada asesoría o llegando a conclusiones totalmente
estadística. A partir de la revisión de los incorrectas en los casos más extremos.
informes finales, no les es posible a los
autores de este estudio determinar Aunque estos resultados son inferiores
cuáles de las anteriores circunstancias a los hallados por otros autores en
aplican a cada trabajo. estudios similares, ello no significa que
la situación sea menos preocupante,
Además, en los casos en los que las sólo evidencia que no se trata de un
conclusiones no corresponden con los problema local. Kanter y Taylor 1994, al
resultados del método estadístico, no revisar 57 artículos de la revista
es posible discernir si se trata de Transfusion, encontraron que el 75 %
errores involuntarios por parte del de los mismos presentaba algún tipo
estudiante o de un desconocimiento de de error estadístico; MacArthur y
la adecuada interpretación de los Jackson 1984, quienes evaluaron 114
resultados. artículos del Journal of Infectious
Diseases, encontraron que un 95 % de
Por lo anterior, la presente discusión se los mismos presentó algún tipo de
centra en ilustrar las implicaciones de error estadístico. Los resultados más
los principales errores detectados y en similares serían los de Olsen 2003,
brindar recomendaciones en muchos quien encontró errores en al menos la
de los casos, más que en el porqué de los mitad de los 141 artículos revisados en
mismos. En tal sentido, no se discuten los la revista Infection and Immunity.

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3571


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

Teniendo en cuenta el compromiso de la media y la desviación estándar como


la Universidad con la comunidad y los medidas de resumen, pues dado que en
importantes recursos invertidos en el este tipo de variables la distancia entre
desarrollo de los trabajos, se hace los diferentes niveles o categorías no es
urgente tomar acciones correctivas que constante, la media aritmética no
eviten la continuación de tal situación y refleja la verdadera tendencia central
que den validez externa a la producción de los datos. Consecuentemente, la
académica de la Facultad. desviación estándar tampoco resulta
adecuada, por ser una medida basada
en la media. En estos casos, deben
IDENTIFICACIÓN DE LOS usarse la mediana y la desviación
PRINCIPALES ERRORES mediana como medidas de resumen.

Estadística descriptiva. Al evaluar el uso Aunque los estadísticos de forma se


de medidas de resumen, se encontró utilizan frecuentemente como valores
que en algunos trabajos en los que se de referencia para inferir sobre la
incluyeron medidas de tendencia central, distribución normal de un conjunto de
éstas no se acompañaron con al menos datos, no se recomienda su uso aislado
una medida de dispersión. Aunque el uso para tal fin; en estos casos es preferible
aislado de una medida de tendencia utilizar una prueba formal de bondad
central no se considera erróneo per se, de ajuste. Una aplicación adecuada y
ésta debe ir acompañada por un poco frecuente de los estadísticos de
estadístico de dispersión siempre que forma, en particular del coeficiente de
ello sea posible, con el fin de describir asimetría, es orientar sobre la medida
de manera más completa el conjunto de tendencia central más adecuada
de datos. Esta carencia puede deberse para el conjunto de datos, pues la
al hecho de que las medidas de media, que es la medida de tendencia
tendencia central, a diferencia de las central más utilizada, sólo resulta
medidas de dispersión, tienen una adecuada cuando no se presenta una
interpretación más directa, aún por asimetría muy marcada; en caso
aquellas personas que tomaron sus contrario, se recomienda el uso de la
cursos de estadística hace mucho mediana. Por lo anterior, se sugiere
tiempo. usar siempre el coeficiente de asimetría
como guía para la elección de la
Los errores relacionados con las medidas medida de tendencia central (y, en
de tendencia central y de dispersión se consecuencia, de dispersión) más
asocian con el uso indiscriminado de la adecuada.
media y la varianza sin tomar en
consideración algunas características de En lo que a las herramientas gráficas de
los datos, como la escala de medición y la estadística descriptiva se refiere,
la simetría de los mismos. existen dos figuras que por su forma a
menudo son confundidas: los histo-
Al evaluar características medidas en gramas de frecuencias y los diagramas
escala ordinal, resulta inadecuado utilizar de barras. Los histogramas de frecuen-

3572 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

cias se usan cuando se tienen variables sentido, se considera que los intervalos
cuantitativas; en éstos las barras son de confianza deberían usarse más a
adyacentes y su ubicación corresponde menudo como complemento a otros
con el orden intrínseco de la variable. métodos; en particular, en la pre-
Los diagramas de barras se deben utilizar sentación final de los resultados, donde
cuando se tienen variables cualitativas; aportarían valiosa información adicional
en éstos las barras están separadas y su sobre los parámetros de interés, bien sea
ubicación no responde a un orden en el ámbito del diseño de experimentos,
particular. El uso de un histograma para la regresión o el muestreo.
la caracterización de una variable
cualitativa podría generar la falsa idea El uso de la aproximación normal para
de continuidad de dicha variable. obtener intervalos de confianza del
parámetro p de una población bino-
Una situación detectada cuando se mial resulta especialmente inadecuado
hacía uso de métodos descriptivos cuando el tamaño de la muestra es
consistió en hacer afirmaciones propias pequeño. En tales casos, lo más
de la estadística inferencial, sin usar las adecuado es obtener el intervalo de
herramientas propias de ésta. Cabe confianza exacto, usando la distribución
recordar que para generalizar a las binomial. De manera general, dada la
poblaciones los comportamientos de actual disponibilidad de herramientas
las muestras que las representan, no tecnológicas, se recomienda obtener en
basta con reportar la magnitud de las todos los casos el intervalo de confianza
diferencias observadas; deben usarse a partir de la distribución exacta.
métodos inferenciales, los cuales per-
miten cuantificar la probabilidad de Tras calcular medidas de resumen para
error de las aseveraciones realizadas. variables ordinales (mediana y des-
viación mediana), no es adecuado
construir intervalos de confianza para
ESTADÍSTICA INFERENCIAL los parámetros µ y σ. Lo anterior resulta
más evidente si se tiene en cuenta que µ
Estimación. En diversos campos de las y σ son los parámetros de una dis-
Ciencias Agropecuarias, como la tribución normal, la cual resulta
producción, el mejoramiento y la inadecuada para modelar fenómenos
modelación de fenómenos naturales, medidos en escala ordinal. Olsen 2003,
entre otros, con frecuencia se busca también menciona esta situación en
estimar parámetros. Si bien, tal artículos médicos, donde se usaron
estimación puede realizarse de manera métodos que requerían la distribución
puntual, los intervalos de confianza normal de los datos y éstos tenían una
representan un método más completo, distrbución sesgada.
pues además de suministrar info.-
mación sobre la tendencia central y la Pruebas de hipótesis. El usar valores
dispersión de la variable de interés, se tabulares inadecuados, ya sea por
conoce la probabilidad de acierto en la errores en el nivel de significancia, en
estimación del parámetro. En tal los grados de libertad o en la distribución

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3573


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

requerida, hace que las probabilidades “significativo”, realizando un nuevo


reales de error no coincidan con las análisis de los datos con base en el
nominales, lo que conlleva la sobre- análisis de varianza de una vía (Diseño
estimación o subestimación del riesgo Completamente al Azar).
de error o incluso la toma de decisiones
incorrectas acerca del juego de hipó- Acorde con Manly 1992, la no
tesis planteado. aleatorización y/o el uso de seudo repeti-
ciones generan falta de independencia,
Diseño de experimentos. Se presentan lo cual afecta la estimación del error
las siguientes consideraciones relaciona- experimental y la validez interna del
das con los errores detectados en ensayo, propiciando que los efectos de
algunos de los trabajos en los que se los tratamientos se confundan con
realizaron experimentos diseñados. Uno efectos de otros factores no conside-
de los errores más básicos consiste en rados en el experimento (factores de
usar un diseño experimental inadecuado, confusión). Dos acciones erróneas que
bien sea por la no inclusión de fuentes de hacen que el nivel de significancia real
variación reconocidas o por la inclusión de la prueba supere el nivel de
de supuestas fuentes de variación significancia nominal son: realizar
dentro del modelo con el ánimo de pruebas de comparación de medias
disminuir el error experimental o para un factor cuyo efecto no resultó
simplemente por tradición. significativo (Lentner y Bishop 1986,
Steel y Torrie 1995) y realizar nuevos
Un caso particular de la situación análisis de varianza sobre subconjuntos
planteada anteriormente se presenta de tratamientos, con el fin de buscar
cuando el experimento es sometido al significancia. Estas acciones responden
esquema de aleatorización restringida a la creencia común de que en todo
propio del Diseño de Bloques al Azar ensayo experimental se deben hallar
(aleatorización dentro de grupos), sin diferencias significativas, desconociendo
ningún criterio para ello, manteniendo que la no detección de éstas constituye
o retirando los bloques del modelo con un resultado igualmente importante para
base en información a posteriori. En la aproximación a la comprensión del
este caso se pueden cometer dos errores: fenómeno estudiado.
por un lado, evaluar la supuesta sig-
nificancia de los bloques con base en el El caso contrario ocurre cuando a pesar
valor p generado por la mayoría de de que el Análisis de Varianza resulta
programas estadísticos, lo cual, según significativo, no se realizan pruebas de
Lenter, Arnold y Hinkelmann, citados por comparación de medias ni contrastes,
Kuehl 1994 y Petersen 1994, resulta desconociendo que el análisis de
incorrecto, pues no existe una prueba varianza es una prueba general que en
válida para evaluar la significancia de ningún caso permite concluir que
tal efecto. El otro error que puede existen diferencias entre todas las
cometerse en esta situación resulta de medias; su significancia sólo implica
retirar el efecto de los bloques del que al menos dos de las medias
modelo cuando dicho efecto no resulta comparadas difieren, sin especificar

3574 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

cuáles son las medias causantes de la factor no permanecen constantes a


significancia de la prueba. través de cada uno de los niveles de los
otros factores, resulta incorrecta la
En ensayos experimentales que invo- obtención de una diferencia promedio.
lucran dos o más factores de interés, en Por tanto, la evaluación de efectos
ocasiones se ignora la estructura principales sólo procede cuando la
factorial de los tratamientos y se realiza interacción no es significativa y el factor
el análisis de varianza que corres- sí lo es. De la misma manera, resulta
pondería a una estructura unifactorial. inadecuado evaluar efectos simples
Aunque tal forma de análisis no conlleva cuando la interacción no es significativa.
errores matemáticos, puede conside-
rarse un error metodológico, pues se En el área biológica son frecuentes los
desaprovecha la capacidad de tales ensayos en los que se realizan lecturas
estructuras de tratamientos para evaluar de una variable sobre una misma
las posibles relaciones existentes entre unidad experimental a través del
los factores evaluados y dificulta, en tiempo. Con ello se genera una
caso de que tales relaciones existan, estructura de covarianzas entre los
presentar recomendaciones específicas errores correspondientes a las diferentes
para cada uno de los niveles de los lecturas de una misma unidad
factores relacionados. Algo similar experimental. Para el análisis de este
ocurre cuando se ignora(n) alguno(s) de tipo de ensayos deben usarse métodos
los factores involucrados inicialmente en que permitan modelar dicha estruc-
el experimento. tura, la cual no es manejable a través
del análisis clásico que asume que las
Otro error detectado cuando se rea- covarianzas entre errores son cero
lizan experimentos con estructura (errores independientes). Para tal
factorial de tratamientos consiste en efecto, pueden consultarse Littell et al.
evaluar efectos principales, a pesar de 1998, Littell et al. 1996 y SAS 1999,
que la interacción entre los factores entre otros.
resulte significativa (Petersen 1994).
Una interacción implica que las Un procedimiento que ha sido usado
diferencias entre los niveles de un por los investigadores para intentar
factor cambian, dependiendo de la obviar la modelación de la estructura
combinación de niveles de los demás de covarianzas consiste en realizar
factores. La evaluación de un efecto análisis individuales para cada uno de
principal consiste en comparar las los tiempos. Debe advertirse que este
medias de cada uno de los niveles de método no permite evaluar las ten-
un factor; estas medias se obtienen dencias de la variable respuesta a través
promediando todas las combinaciones del tiempo, por lo que no constituye un
que contengan el nivel de interés, verdadero método de análisis de me-
estando allí involucrados todos los didas repetidas y, si bien puede resultar
niveles de los demás factores. Puesto útil para un análisis exploratorio, no es
que, en presencia de interacción, las adecuado como método final de análisis
diferencias entre los niveles de un (Littell et al. 1998).

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3575


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

Uno de los supuestos del diseño de sólo puede evaluarse de manera objetiva
bloques al azar es la aditividad; esto es, la cuando se tienen repeticiones de los
no existencia de interacción entre valores de la variable independiente. En
bloques y tratamientos. Cuando este caso contrario, que es lo más frecuente,
supuesto no se cumple, el estimador del este supuesto se evalúa a través del
error experimental es inadecuado, pues gráfico de residuales estandarizados; aún
corresponde en realidad al efecto de tal así, este procedimiento a menudo es
interacción. En estos casos, no es posible omitido. Cuando las varianzas no son
estimar el verdadero error experimental, homogéneas, no es posible obtener un
a menos que cada tratamiento esté estimador adecuado de la varianza
presente más de una vez dentro de cada promedio de las subpoblaciones de la
bloque (Lentner y Bishop 1986). variable dependiente para cada nivel de
la variable independiente, razón por la
cual la inferencia realizada en tales
REGRESIÓN Y CORRELACIÓN situaciones resulta inadecuada.

Regresión simple.
simple. Uno de los errores Regresión múltiple. Las consideraciones
detectados obedece a que existe la hechas para los modelos de regresión
creencia de que la significancia de un simple, en general aplican también a los
modelo de regresión lleva implícito el modelos de regresión múltiple. Vale la
buen ajuste del mismo. Esto, desde pena, sin embargo, resaltar algunos
luego, no es cierto, ya que la significancia aspectos adicionales.
de un modelo de regresión lineal simple
sólo indica la presencia de un efecto El uso de modelos de regresión múltiple
lineal significativo, pero no da ninguna para predecir valores de la variable
información acerca de posibles efectos dependiente a menudo conlleva extra-
cuadráticos. polaciones, las cuales tienen las mismas
implicaciones anotadas para el caso de
Otro error frecuente en el uso de los regresión simple. Su detección, sin
modelos de regresión es utilizarlo para embargo, no es tan directa, pues no es
predecir valores de la variable respuesta a suficiente que los valores usados para la
partir de valores de la variable predictora predicción estén incluidos en el rango
que están por fuera de la región usada de valores usado para cada una de las
para ajustar el modelo. Esta acción no es variables independientes, sino que ten-
recomendable, ya que el comporta- dría que verificarse que la combinación
miento de un fenómeno en una región evaluada esté en una región que haya
determinada no garantiza que dicha sido usada para el ajuste del modelo.
tendencia se mantenga por fuera de la
misma, lo cual puede causar que las Exceptuando aquellos casos en los
estimaciones así realizadas estén cuales deba respetarse el principio de
bastante alejadas de la realidad. jerarquía, un modelo final de regresión
sólo debe contener términos sig-
Uno de los supuestos para el análisis de nificativos, pues de lo contrario se estaría
regresión es la homocedasticidad. Ésta viciando el modelo con relaciones

3576 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

inexistentes, las cuales afectarían la interpretación de éste como prueba de


capacidad predictiva del mismo, así causalidad, situación errónea pues
como la estimación de los coeficientes dicho coeficiente sólo refleja la exis-
de regresión, que miden el grado de tencia de asociaciones lineales entre las
asociación entre las demás variables variables analizadas, sin que de ningún
independientes y la variable respuesta. modo la significancia de una corre-
lación implique que el comportamiento
Para el caso de los modelos de de una de las variables sea responsable
regresión, el principio de jerarquía de los valores que tome la otra.
mencionado anteriormente establece
que si un término de orden k resulta Como su nombre lo indica, el coeficiente
estadísticamente significativo, el mo- de correlación lineal simple sólo es ade-
delo deberá contener todos los cuado para caracterizar relaciones
términos de orden inferior a k, aunque lineales entre variables, por lo que resulta
éstos no sean significativos. Este principio erróneo el uso del mismo para carac-
también es aplicable a aquellos modelos terizar otros tipos de relaciones. Por lo
que incluyen interacciones significa- anterior, al evaluar correlación entre dos
tivas, en cuyo caso el modelo deberá variables, se recomienda acompañar el
incluir cada uno de los términos uso del coeficiente de correlación con el
involucrados en la interacción, aun si correspondiente gráfico de dispersión.
éstos no son significativos.
Por lo anterior, la no significancia del
Una situación ya mencionada en el coeficiente de correlación -sin el corres-
contexto de diseño de experimentos, pondiente diagrama de dispersión- no
consistente en el uso de medidas podrá interpretarse como ausencia de
repetidas en el tiempo sobre una misma relación entre las dos variables. Sólo
unidad experimental, aparece también podría decirse que no existe relación
en el contexto de regresión, con las lineal entre las mismas.
mismas implicaciones allí anotadas (en
este caso se habla de autocorrelación de
errores). Además de verse afectada cada ESTADÍSTICA MULTIVARIADA
lectura por los valores registrados en los
tiempos anteriores, lo que va en contra Al representar una clasificación jerár-
del supuesto de independencia, los quica de individuos por medio de
modelos ajustados carecerían de validez dendrogramas, la escogencia de los
externa, es decir, que no podrían utili- grupos, para un método de agrupa-
zarse para describir el comportamiento miento dado, debe estar acorde con la
de la población, pues en realidad se medida de similitud/disimilitud elegida.
habría modelado el comportamiento de Si bien pueden plantearse diferentes
unos individuos. agrupamientos dependiendo del nivel
de detalle establecido, una vez que éste
Correlación. Al evaluar relaciones entre se elija, deberá usarse para todas las
variables a través del coeficiente de agrupaciones dentro de ese nivel de
correlación, un error consiste en la detalle. No es adecuado, por tanto, al

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3577


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

usar métodos de clasificación jerárquica, consecución de los objetivos plan-


fusionar subgrupos cuya disimilitud sea teados en los trabajos, lo cual se reflejó
mayor que la existente entre otros en que éstos incluyeran resultados
grupos declarados como diferentes. estadísticos que en nada contribuían al
cumplimiento de los objetivos, en que
Otros. Al plantear el esquema de se omitieran resultados relevantes para
muestreo para la caracterización de una su satisfacción y/o en que habiéndose
variable, la presencia de condiciones generado resultados pertinentes, no se
que puedan afectar su comportamiento, les diera discusión alguna.
generando subpoblaciones, hace ne-
cesario el uso de un esquema de El principal error detectado en el uso
muestreo acorde, esto es, un muestreo de los métodos de estadística des-
estratificado. El uso del esquema de criptiva consistió en obtener medidas
muestreo aleatorio simple en tales casos de resumen no adecuadas para la
desaprovecha el conocimiento de tales naturaleza de los datos, ya fuera por
relaciones, haciendo ineficiente y posible- que éstos presentaban sesgo o porque
mente sesgada la caracterización de la se midieron en escala ordinal.
variable de interés.
En inferencia para una población, se
detectó que a pesar de la actual
CONCLUSIONES Y disponibilidad de herramientas tecno-
RECOMENDACIONES lógicas que facilitan la obtención del
intervalo de confianza exacto para el
En este trabajo se definieron una serie parámetro p de una población bino-
de falencias conceptuales, carencias y mial, se sigue obteniendo el intervalo
violaciones evidentes a los supuestos, de confianza mediante la aproximación
al aplicar métodos estadísticos. Todos a la distribución normal, lo cual resulta
éstos fueron tratados y discutidos con más inadecuado cuando el tamaño de
el nombre genérico de “errores”. En muestra es pequeño.
casi la mitad de los trabajos evaluados
(49,2 %) se detectó al menos un error. Los errores encontrados en los trabajos
A nivel de pregrado, en Ingeniería en los que se aplicaron métodos de
Forestal se observó el menor porcentaje inferencia estadística para los pará-
de trabajos con al menos un error; metros de una y de dos poblaciones,
mientras que el mayor porcentaje fue pueden resumirse en uso inadecuado de
observado en Ingeniería Agrícola. El la aproximación normal. En algunos de
porcentaje de errores es similar en los los trabajos revisados en esta inves-
trabajos de Ingeniería Agronómica y en tigación se obtuvieron intervalos de
los de Zootecnia; en ambos casos, tal confianza con base en dicha aproxima-
porcentaje es cercano al 60 %. ción, sin tener en cuenta el tamaño de
muestra; en otro caso, se usó tal
Muchos de los errores se originaron en aproximación para modelar variables
la poca claridad sobre el papel de la ordinales, generando incluso intervalos
estadística como herramienta para la de confianza para µ y σ.

3578 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006


Evaluación de métodos estadísticos...

En lo concerniente a los experimentos Este proceso debe emprenderse desde el


diseñados los principales errores estu- principio de la carrera, involucrando, no
vieron asociados con una aleatoriza- sólo a los miembros de la Sección de
ción deficiente o nula, en el uso Bioestadística, sino a todos los encar-
incompleto de las técnicas del análisis gados de las asignaturas donde se
de varianza, dejándose de usar los requiera el uso de tales métodos.
contrastes de medias para responder
las preguntas planteadas en los Específicamente, se considera oportuno
objetivos, o usando pruebas de medias que en la asignatura Bioestadística I se
forzadas (con análisis de varianza no haga más énfasis en el capítulo de
significativo). El mayor porcentaje de inferencia estadística, especialmente en
errores se observó en experimentos con lo relativo a pruebas de hipótesis, lo
estructura factorial donde la Inter.- cual podría hacerse a expensas de
pretación de las interacciones en disminuir el énfasis dado a la unidad de
algunos casos no fue adecuada, pues álgebra de probabilidades, limitando
no se evaluaron efectos simples cuando ésta a la presentación de las definiciones
correspondía o se evaluaron cuando en básicas y de las distribuciones de
realidad se debía analizar los efectos probabilidad más usadas.
principales.
En relación a la asignatura Bioestadística
Entre los errores detectados al usar II, se considera innecesario continuar
métodos de regresión, los principales incluyendo en el programa el diseño de
estaban relacionados con el no cum- cuadrado latino, dado su poco uso. En
plimiento de supuestos tales como cambio debe incluirse información
homocedasticidad e independencia. Con relacionada con el análisis de medidas
menor frecuencia se presentaron mo- repetidas en el tiempo.
delos definitivos con términos no
significativos y la extrapolación de con- Aunque al momento de realizar el censo
clusiones por fuera del área analizada, no existían trabajos de la Maestría en
además del uso de modelos de línea Ciencias Agrarias, se considera que sus
recta para modelar asociaciones tesis podrían exhibir errores similares a
evidentemente curvilíneas. los detectados en los demás programas
de la Facultad, dado que las interac-
El principal error detectado en el uso de ciones entre estudiantes, profesores,
coeficientes de correlación tuvo que ver directores y jurados son, asimismo,
con su uso como prueba de causalidad. similares. Por tanto, el curso de Mé-
En un solo trabajo se identificó su uso todos Estadísticos para la Investigación,
para caracterizar una relación no manteniendo sus particularidades, de-
rectilínea. berá enfocarse también en prevenir
sobre los errores más frecuentemente
Como recomendación general, se consi- encontrados.
dera necesario concientizar al estudiante
sobre la importancia del adecuado Se considera muy importante la parti-
dominio de los métodos estadísticos. cipación de los directores de trabajos

Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006 3579


Echavarría, H.; Correa, G.; Patiño, J.F.; Acosta, J.J.; Rueda, J.A.

de grado y tesis en una revisión más Littell, R. C., Henry, P. R. and Ammer-
detallada de la metodología estadística, man, C. B. 1998. Statistical analysis of
con la realización de las correspondientes repeated measures using SAS pro-
consultas especializadas cuando la cedures. En: Journal of Animal Science.
situación lo amerite. Con base en los Vol. 76; p. 1216–1231.
correctivos que se sugieran, podrían
optimizarse los recursos invertidos en los Littell, R. C.; Milliken, G. A.; Stroup, W.
trabajos, obteniéndose la mayor infor- W. and Wolfinger, R. D. 1996. SAS®
mación posible que apunte al logro de system for mixed models. Cary North
los objetivos y/o que pueda dar lugar a Carolina, USA: SAS Institute. 633 p.
nuevos proyectos.
Mac Arthur, R. D. and Jackson, G. G.
1984. An evaluation of the use of
RECONOCIMIENTOS statistical methodology in the Journal
of Infectious Diseases. En: Journal of
Infectious Diseases. Vol. 149, no. 3; p.
Este trabajo fue realizado con el apoyo 349-354.
financiero de la Dirección de
investigación de la Universidad Nacional Manly, B. F. J. 1992. The design and
de Colombia, Sede Medellín –DIME- analysis of research studies. New York:
proyecto 030802611. Cambridge University Press. 353 p.

Olsen, C. H. 2003. Review of the use of


BIBLIOGRAFÍA statistics in infection and immunity. En:
Infection and Immunity. Vol. 71; p.
6689-6692.
Kanter, M. H. and Taylor, J. R. 1994.
Accuracy of statistical methods in Petersen, R. G. 1994. Agricultural field
transfusion: a review of articles from experiments: design and analysis. New
July/August 1992 through June 1993. York: Marcel Dekker. 409 p.
En: Transfusion. Vol. 34, no. 8; p. 697-
701. SAS Institute. 1999. SAS/STAT. Guide
for personal computers. Versión 8.
Kuehl, R. O. 1994. Statistical principles Cary, NC: SAS. 378 p.
of research design and analysis. Belmont,
USA: Duxbury Press. 686 p. Steel, R. G. y Torrie, J. H. 1995.
Bioestadística: principios y procedi-
Lentner, M. and Bishop, T. 1986. mientos. Mexico: McGraw Hill. 622 p.
Expemimental design and analysis.
Blacksburg, USA: Valley Book Zar, J. H. 1984. Biostatistical analysis.
Company. 557 p. New Jersey: Prentice-Hall. 718 p.

3580 Rev.Fac.Nal.Agr.Medellín. Vol.59,No.2. p.3565-3580. 2006

S-ar putea să vă placă și