Sunteți pe pagina 1din 6

Clase 12 de salud comunitaria

Si bien las formas de análisis están muy relacionadas, ellas tienen propósitos diferentes:
El de correlación es útil para presumir y medir la intensidad de la relación entre variables, es decir se
considera que dos variables están relacionadas entre sí cuando los valores de una de ellas, varían de forma
sistemática, con respecto a los valores de la otra.
Mientras que el de regresión sirve para buscar la ecuación matemática que mejor describe dicha relación,
como podrán ver posteriormente con el caso de la regresión lineal simple.
Además por observación simple de su representación gráfica se puede llegar a inferencia en la relación
entre dos variables.

La relación entre dos o más variables tiene de forma general tres componentes fundamentales que son:
La Fuerza
El Sentido y
La Forma
Las que pueden ser observadas gráficamente, una de estas graficas más utilizadas es el diagrama de
dispersión.
La fuerza mide el grado en que dos variables se relacionan.
Por ejemplo en los estudios de regresión lineal simple, si al situar los puntos se agrupan de forma estrecha
y alargada, con la simple observación podemos inferir que la relación es fuerte.

El sentido por su parte se refiere a cómo varían los valores de una variable con respecto a otra.
Si al crecer los valores de una variable, lo hacen los de la otra, esta relación es positiva o directa, mientras
que si al aumentar los valores de una variable disminuye los de la otra, entonces el sentido de dicha
relación es negativo o inverso.
Por último la forma se refiere a la figura geométrica del tipo de línea que mejor se ajusta a la distribución
de los puntos en un plano cartesiano, que puede ser una recta pero también una línea curva.

Como vimos anteriormente utilizamos el diagrama de dispersión que constituye la representación gráfica
de la relación entre de dos variables cuantitativas.
Esta representación es en realidad semejante a la representación de puntos en el plano, que usa ejes de
coordenadas rectangulares, en él una de las variables se muestra sobre el eje horizontal y la otra sobre el
eje vertical. Cada pareja de valores da lugar a un punto en el plano.
Se debe recordar que el patrón general de los puntos dibujados sugiere la relación general entre ambas
variables.

Las formas típicas de los diagramas de dispersión son las que aparecen en la imagen, observen que:
En A la relación es presumiblemente lineal positiva ,
En B presumiblemente lineal negativa,
Mientras que en C no se aprecia relación lineal aparente y
Por último en D no existe relación lineal aparente, la relación entre variables es de otro tipo y podría
ajustarse una línea curva
En todas ellas se pueden apreciar los tres componentes: Fuerza, sentido y forma.

Entre las principales características que ayudan a comprender el valor de esta herramienta están:
Su impacto visual, ya que a simple vista brinda la posibilidad de detectar la existencia de relación entre
dos variables.
La factibilidad para la comunicación, pues simplifica el análisis de situaciones numéricas complejas.
Y por último su valor como guía en la investigación, ya que facilita el análisis de datos, proporcionando
mayor información que el simple análisis matemático de la relación y además sugiere posibilidades y
alternativas de estudio, basadas en la necesidad de conjugar datos y procesos.
Los diagramas de dispersión no sólo muestran la relación existente entre variables, sino también resaltan
las observaciones individuales que se desvían de la relación general. Este es uno de los usos del diagrama
de dispersión, que serán detallados a continuación.

El Diagrama de dispersión se puede utilizar para estudiar:


Las relaciones causa-efecto
También son usados para establecer relaciones entre dos efectos.
Otro uso radica en la posibilidad de utilizar un efecto como sustituto de otro, sobre todo para controlar
efectos peligrosos o costosos de medir.
Reiteramos que el Diagrama de dispersión, es una herramienta gráfica útil en la comprobación de teorías,
que tienen como base la suposición de que existe una relación entre dos variables.

En la interpretación de los diagramas de dispersión se comenten errores que limitan su alcance, entre los
más frecuentes están:
Usarlo sin tener un soporte lógico ya que ellos muestran solamente relaciones estadísticas.
Usar la interpretación más allá del recorrido de los datos, es decir usarlo fuera de los límites donde se
realizaron las observaciones.
Deficiencias en las escalas de alguno de los ejes puede enmascarar una relación o hacer ver relaciones
inexistentes.
Por último se hará referencia a una limitante que ningún procesador estadístico puede resolver: los datos
inexactos o imprecisos, si los datos son deficientes o insuficientes, la interpretación del diagrama de
dispersión tiene, por fuerza, que serlo también.

Ahora comenzaremos con la correlación lineal entre variables cuantitativas, que es un método estadístico
con el que se pretende dilucidar la intensidad de la asociación entre dos variables cuantitativas, medidas
en la misma unidad de observación la que se concibe como el individuo, el objeto o el proceso en el cual
se centra la investigación.
Es decir, dos variables están correlacionadas cuando los cambios de una de ellas se acompañan de
cambios en la otra variable en una misma unidad de observación.
Hay veces que de la simple observación del diagrama de dispersión o del conocimiento del fenómeno
estudiado se puede inferir la existencia de relación entre las variables.
Ahora estudiaremos otra forma de inferir de forma cuantitativa la correlación lineal entre dos variables.

Karl Pearson propuso una medida, que es usada de manera habitual para el análisis de correlación lineal
simple. En su honor es llamada coeficiente de correlación lineal de Pearson, que mide el grado de
asociación lineal entre dos variables cuantitativas continuas.
Se denota con la letra griega ro (ρ), pero este coeficiente tiene su estimador muestral puntual que se
denota por la letra “erre” minúscula.

Entre las propiedades del coeficiente de Pearson están:


No tener unidades de medida, es adimensional.
Toma valores entre -1 y 1, en el intervalo numérico que pueden observar en la imagen
Sus valores extremos señalan que existe dependencia lineal perfecta entre ambas variables “equis” y
“ye”, si es -1 la relación es negativa perfecta y + 1 resume la relación positiva perfecta.
El valor 0 señala que no existe dependencia lineal alguna entre ambas variables, aunque es bueno destacar
que puede existir una dependencia funcional de otro tipo. Es por esto, que este coeficiente debe utilizarse
con cuidado a la hora de interpretar los resultados de un estudio.
El signo positivo indica que ambas variables aleatorias crecen o decrecen simultáneamente y el signo
negativo indica que cuando una variable crece, la otra decrece, o sea, que es inversa su relación.

A continuación se presentan gráficamente algunos diagramas de dispersión:


En A se ve una fuerte correlación lineal positiva, r está cerca de 1,
En B se observa fuerte correlación lineal negativa, r está cerca de -1 y
en C se puede apreciar que no existe correlación lineal aparente, r está cerca de cero (0)
Finalmente se debe insistir en que la evidencia de correlación entre dos variables a través del diagrama de
dispersión o el coeficiente de correlación, no se debe interpretar como un sinónimo de causa, el juicio
para atribuir que un fenómeno es causa de otro debe justificarse con argumentos científicos más sólidos.
Una manera de verificar si el resultado del coeficiente de correlación expresa realmente la asociación es
mediante la prueba de hipótesis para el coeficiente de correlación lineal.

Para la prueba de hipótesis del coeficiente de correlación lineal de Pearson utilizaremos el siguiente
ejemplo
En un estudio realizado en 25 pacientes con Hipertensión Arterial esencial, se desea conocer la intensidad
de la relación entre las cifras de la tensión arterial utilizando dos métodos diferentes para su medición. En
la tabla que muestra la imagen se presentan los resultados de las cifras obtenidas por ambos métodos.
En este caso para tratar de verificar si el coeficiente de correlación lineal de Pearson (ro) es
estadísticamente diferente de cero, es decir, si hay correlación lineal entre las variables en estudio, se
utilizan los mismos pasos lógicos que se utilizaron para pruebas de hipótesis.
El primero de ellos, la formulación de la Hipótesis a evaluar se plantearía como aparece en la imagen
H0: ρ = 0 (No hay correlación lineal entre las variables en estudio, es decir, no hay correlación lineal
entre los 2 métodos de medir la tensión arterial ).
H1: ρ ≠ 0 Existe correlación lineal entre las variables en estudio, es decir, hay correlación lineal entre los
2 métodos de medir la tensión arterial ).
El segundo paso corresponde a la elección de la prueba estadística, para este caso se aplica la prueba de
hipótesis sobre el coeficiente de correlación lineal de Pearson, ro.

La especificación del nivel de significación alfa (α), constituye el tercer paso y generalmente los
investigadores seleccionan un 0,05.
El cuarto paso se relaciona con la elección y cálculo del estadígrafo de la prueba con su distribución
muestral asociada, si la muestra fue extraída de una población con distribución normal bivariada, en este
caso el estadígrafo que se utiliza es la t calculada que en este ejemplo es igual a 15,37, basado en la
distribución de probabilidad t de Student, elaborada por William Gosset Químico inglés discípulo de
Gauss, que publicó este trabajo de estadística bajo el seudónimo de Student.
Como quinto paso quedaría la definición de la región de rechazo, que como recordarán queda definida al
seleccionarse por el investigador el nivel de significación alfa (α).
La región que se encuentra entre las regiones críticas corresponde a la región de no rechazo.

En sexto lugar se encuentra la toma de la decisión correspondiente, la cual puede hacerse de dos maneras,
una teniendo en cuenta la t calculada y la otra utilizando el valor de p asociado a la t calculada.
En este ejemplo utilizaremos el valor de p asociado a la t calculada, obtenido por el sistema estadístico
MedCalc.
Recordemos que la regla de decisión es:
Si p ≤ α alfa se rechaza la hipótesis nula
Si p > α alfa no se rechaza la hipótesis nula
La probabilidad p asociada al estadígrafo t calculado es en este ejemplo muy baja (0,0000) y es menor
que α (alfa) (0,05) por lo que se rechaza la hipótesis nula.

Por ultimo se formula la conclusión de que la correlación entre los dos métodos es significativa, es decir
en este estudio existe correlación lineal entre los dos métodos de medir la tensión arterial con un nivel de
significación alfa de 0,05.
Es importante ser cuidadoso a la hora de concluir e interpretar, porque la decisión investigativa o clínica
hecha sólo a partir de evidencias estadísticas es errónea, recuerden que la estadística es una ciencia que
ayuda a decidir pero no decide en el campo de la investigación clínico epidemiológica.

Ahora le explicaremos como se realizarían los diferentes pasos con el uso del programa MEDCALC:
Al abrir el programa aparece en la pantalla la ventana inicial, deben mover el mouse y seleccionar la
opción para introducir los datos.
Cuando presione el botón izquierdo del mouse aparece otra ventana y debe seleccionar la primera opción
que se coloreará de azul, para abrir hoja de cálculo

Presione nuevamente el botón izquierdo del mouse aparece la hoja de calculo lista para introducir los
datos.
Las celdas de la primera fila son de encabezamiento, en ella escribirá el nombre de la variables que se
corresponden con los métodos de determinación de la tensión arterial.

Comience a introducir los datos verificando que correspondan con las observaciones, recuerde que ningún
procesador estadístico puede resolver imprecisiones del operador y si los datos son deficientes la
información que generan no será útil.
Las observaciones del método 1 y el método 2 deben corresponderse siempre para el mismo objeto de
estudio, en este caso una misma persona.
En la imagen aparece con un recuadro en rojo la forma en que quedan introducidos los datos para el
ejemplo que estamos usando.

Como estamos realizando un análisis de correlación, debemos mover el mouse hasta dicha opción y luego
seleccionar en la ventana emergente hacia la derecha la opción de coeficiente de correlación y
Aparece una nueva ventana para seleccionar indistintamente las variables a correlacionar, método 1 en la
parte superior y método 2 en la parte inferior, Presione el boton OK para que se realicen las operaciones
en el programa.
En la ventana principal del programa se brinda la información del procesamiento que incluyen:
Las variables,
El tamaño de la muestra,
El coeficiente de correlación lineal muestral erre, y su valor de p asociado, así como
El intervalo de confianza para dicho coeficiente.
Como se observa el valor del coeficiente de correlación lineal muestral es 0.9546, que indica una alta
correlación lineal positiva entre las variables estudiadas, su valor de p asociado es 0.0000 muy inferior al
nivel de significación alfa, por lo que se rechaza la hipótesis nula, es decir en este estudio existe
correlación lineal entre los dos métodos de medir la tensión arterial con un nivel de significación alfa de
0,05.

El programa ofrece la posibilidad de tener la representación gráfica de esta relación, está vez se despliega
la opción estadística nuevamente y se selecciona la opción correlación, se despliega un submenú, donde
para la confección del diagrama se selecciona la opción de Diagrama de dispersión, presionamos el botón
izquierdo, apareciendo la imagen que ven en la pantalla.

Resumiendo podemos decir que en el análisis de correlación lineal simple se debe tener presente que:
Para las variables aleatorias incorrelacionadas, esto equivale a decir que son independientes.
Las variables deben se medidas en la misma identidad física o conceptual, llamada unidad de
observación, es decir, se deben medir en el mismo individuo, lo contrario es incorrecto.
La relación que se establece no es cualitativa o funcional, ni de causa efecto.
Los test estadísticos contribuyen a dar valor al coeficiente de correlación.

En la mayoría de las situaciones prácticas, el investigador no se conforma con saber si la relación entre las
variables es lineal o no, sino que quiere ir más allá y conocer la función matemática que la describa,
teniendo en cuenta esto, es necesario acudir a la regresión.
Definida como el Método o técnica estadística que nos permite buscar la ecuación matemática que mejor
describe la relación entre las variables de estudio. Consiste en cuantificar la relación que existe entre
dichas variables con el fin de predecir cuáles serán los valores de una variable cuando se conocen los
valores de la otra.

Este término se le atribuye a Francis Galton, y aparece por primera vez en su libro (Herencia Natural)
publicado en 1889, refiriéndose a la “ley de la regresión universal”.
El análisis de regresión lineal simple trabaja con variables cuantitativas continuas y tiene como objetivo
cuantificar el efecto que tiene una variable sobre otra, esto se logra a partir de determinar la ecuación de
regresión para predecir los valores de una variable en función de otra.
Una variable es llamada dependiente que se denota por la letra (Ye) y la otra se le denomina
independiente denotada por la letra (equis X) que también se nombra como variable predictora.

Dentro de las funciones de la regresión lineal simple tenemos:


Describir la dependencia de una variable Y a partir de una independiente X.
Demostrar los cambios de Y que tienen que ver con X.
Definir propósitos predictivos de Y en términos de X.

Habitualmente se utiliza el “método de los mínimos cuadrados” para encontrar la recta de regresión, este
método se basa en la determinación de la distancia mínima entre los puntos y la recta que equidista a
dichos puntos a través de su función matemática.
La función que define a cualquier recta esta dada por la expresión:
Y = a + bX
Donde:
a es el intercepto, o sea, donde la recta corta el eje de las Y, puede tomar cualquier valor positivo o
negativo, y no tiene otra interpretación.
b es la pendiente de la recta, es decir, la pendiente de la línea, o sea, el incremento de Y por cada unidad
que se incrementa X.
A partir de esta función matemática se puede estimar los parámetros de la recta de regresión muestral,
b denominada coeficiente de regresión cuantifica el efecto sobre la variable X que modifica a la Y.

Estos parámetros se estiman mediante los denominados estimadores mínimos cuadrados , existen
fórmulas que calculan estos estimadores para a y b con los datos que encontramos en la muestra que se
denominan a0 y b0, sus valores pueden obtenerse a través de los programas de computación para el
tratamiento estadístico de los datos como por ejemplo el Medcalc u otros.
La recta de la regresión muestral queda como pueden apreciar en la imagen.

A continuación desarrollaremos un ejemplo, en un estudio antropométrico en adolescentes del sexo


masculino, cuyas edades estaban entre los 12 y 14 años de edad, se le realizaron mediciones de la talla en
cm y el peso en Kg, con el objetivo de determinar si la talla es un buen predictor de su peso corporal. Los
resultados de las mediciones para ambas variables se muestran en la tabla que aparece en la imagen.

Una vez introducido los datos como ya ustedes conocen se procede a seleccionar la prueba estadística

Se despliega un submenú donde se selecciona nuevamente regresión, presionamos el botón izquierdo y

Aparece una nueva ventana para seleccionar las variables a correlacionar, basta con tocar con el mouse y
se despliegan las opciones Equis y ye, para la superior tomamos ye dependiente (incremento de peso) y
en la parte inferior x (talla en cm) variable independiente.
Presione el boton OK para que el programa realice las operaciones.

En la ventana principal del programa se brinda la información del procesamiento que incluyen:
Las variables dependiente e independiente
Tamaño de muestra
Ecuación de regresión
Los parámetros: intercepto y pendiente que sirven de base para determinar la ecuación de regresión de la
recta, en este caso como pueden observar es y= - 82, 1213 + 0,9137 X.
La información sobre el análisis de varianza que aparece en la hoja resumen, no es objeto de estudio en
esta asignatura.

El programa ofrece la posibilidad de tener la representación gráfica de la regresión lineal simple para las
variables de estudio, para ello:
Seleccione la opción estadistica, la secuencia muestra como primero aparece la opción regresión y se
despliega un submenú donde se selecciona Diagrama de dispersión con línea de regresión.

Repetimos la introducción del tipo de variable como se hizo para el calculo de la prueba

Presionamos el botón izquierdo, y aparece la imagen que ven en pantalla, con el diagrama de dispersión y
la recta de regresión para las observaciones realizadas. Observen como en este caso los puntos se alinean
en una franja estrecha del plano.

El análisis por técnicas de correlación y regresión ha demostrado su utilidad en muchas investigaciones


que se realizan en las diferentes disciplinas de las ciencias médicas y de la salud, que centran su atención
en la identificación de la relación existente entre variables, con el objetivo de describir, explicar y/o
predecir el comportamiento del fenómeno objeto de estudio, es ahí precisamente donde radica su
importancia para las investigaciones en salud.
Como ejemplos tenemos los estudios para evaluar:
el estado nutricional relacionando indicadores bioquímicos y antropométricos,
la eficacia según dosis respuesta de medicamentos,
El riesgo ambiental a partir de la concentración de agentes químicos peligrosos, entre otros.

A continuación le proponemos la siguiente tarea docente que le ayudará en su autopreparación durante el


estudio independiente:
Se condujo un experimento con el fin de estudiar el efecto de un cierto medicamento en bajar la
frecuencia cardiaca en adultos. La variable independiente es la dosis en mg del medicamento y la variable
dependiente es la diferencia entre la frecuencia cardiaca más baja siguiente a la administración del
medicamento y la que tenía la persona antes de administrar el medicamento.
Los datos se muestran en la tabla.

Plantee la prueba de hipótesis para el coeficiente de correlación lineal de Pearson.


Calcule utilizando el programa MEDCALC el coeficiente de correlación lineal muestral r, suponiendo
que la muestra fue extraída de una población con distribución normal bivariada.
Tome una decisión con el valor de p asociado al estadígrafo para un nivel de significación (a) igual a
0.05).
¿ A qué conclusiones llega con las evidencias estadísticas encontradas?

Al finalizar la actividad orientadora de hoy podemos concluir que:


El análisis de correlación y de regresión constituyen procedimientos que emplean técnicas estadísticas
para investigar la existencia de relación entre variables, expresadas en su fuerza, sentido y forma.

El diagrama de dispersión constituye una herramienta gráfica útil en las investigaciones clínico
epidemiológicas por su impacto visual, la factibilidad para la comunicación de información, así como la
posibilidades que brinda en la búsqueda de alternativas en el análisis y solución de problemas de salud.

La importancia de la regresión lineal simple en las investigaciones clínico epidemiológicas radica en su


poder predictivo dado por la posibilidad de demostrar el efecto de los cambios de una variable en función
de la otra.

S-ar putea să vă placă și