Sunteți pe pagina 1din 6

Instituto Nacional de Salud

Oficina General de Investigación y Transferencia Tecnológica

RECODIFICACIÓN DE VARIABLES
En estadística es frecuente que los investigadores sientan necesidad de agrupar (categorizar) un
conjunto de valores cuantitativos (numéricos) según rango particular, a este proceso se le
conoce como “Recodificación de Variables”; un ejemplo podría darse cuando tenemos un
conjunto de valores de hemoglobina (g/dl) tales como vemos a continuación:

n Dosaje de Hemoglobina (g/dl)


1 14.2
2 9.7
3 11.0
4 10.3
5 13.7
6 12.7
7 9.9

Si observamos esta información podríamos identificar un valor promedio para los 7 casos
evaluados, pero a nivel diagnóstico también sería favorable conocer el estado hematológico de
los individuos según su presencia de anemia (Sin Anemia / Con Anemia); en este caso podríamos
usar los datos cuantitativos para generar una nueva variable cualitativa (“Presencia de Anemia”),
para ello debemos establecer un valor referencial que delimite las categorías (punto de corte)
en este caso estableceremos que del valor mínimo hasta 10.9 estaremos ante pacientes “Con
Anemia”, mientras que de 11.0 a más se considerará a los individuos como “Sin Anemia”. Todo
este procedimiento nos permitiría obtener los siguientes resultados:

n Dosaje de Hemoglobina (g/dl) Presencia de Anemia


1 14.2 Sin Anemia
2 9.7 Con Anemia
3 11.0 Sin Anemia
4 10.3 Con Anemia
5 13.7 Sin Anemia
6 12.7 Sin Anemia
7 9.9 Con Anemia

Tal como se puede observar, hemos generado una nueva variable, sin perder o eliminar la
original, esto es algo de suma importancia al hacer este tipo de procedimientos.

En el presente módulo de apoyo didáctico, veremos paso a paso como hacer la recodificación
de la variable cuantitativa “Índice de Masa Corporal”, hacia una de naturaleza cualitativa
(“Estado Nutricional”), tanto con el software SPSS como con STATA, tomando en consideración
los siguientes valores:

• Bajo peso <18.5


• Normal 18.5 – 24.9
• Sobrepeso 25.0-29.9
• Obesidad 30.0-39.9
• Obesidad Mórbida ≥40.0

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud
Instituto Nacional de Salud
Oficina General de Investigación y Transferencia Tecnológica

RECODIFICACIÓN DE VARIABLES CON SPSS


Lo primero que debemos hacer en este caso es identificar la variable que queremos categorizar,
en este caso “Índice de Masa Corporal”, luego nos dirigiremos al menos “Transformar”, en cuyas
alternativas escogeremos “Recodificar en Distintas Variables”, tal como se muestra a
continuación:

Luego de darle clic, visualizaremos una nueva ventana en cuyo sector izquierdo aparece el
listado de todas la variables contenidas en la base de datos; en ella deberemos seleccionar la
que deseamos recodificar, para posteriormente hacer clic en el ícono con forma de flecha, tras
ello veremos que la variable seleccionada se ha posicionado en el espacio en blanco del centro;
acto seguido procederemos a ingresar el nombre que tendrá la nueva variable que queremos
crear (sin espacios) y su respectiva etiqueta (nombre bien escrito y con espacios), una vez hecho
esto presionaremos el botón con el texto “Cambiar”. Lo último que haremos en esta ventana es
dirigirnos a la parte inferior del sector blanco del medio, donde presionaremos el botón que
señala “Valores Antiguos y Nuevos”; tal como vemos en la siguiente secuencia:

5 4

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud
Instituto Nacional de Salud
Oficina General de Investigación y Transferencia Tecnológica
Luego de los pasos previos, veremos como aparece una nueva ventana donde nos piden
especificar los rangos de valores que conformarán cada categoría; para este ejemplo
empezaremos con el grupo de “Bajo Peso” que según la referencia nos dice que corresponde a
pacientes con valores menores a 18.5 de índice de masa corporal, si tenemos en cuenta que la
expresión es “menores a” comprenderemos que hace alusión a quienes tienen desde el valor
registrado más inferior hasta 18.49 (importante considerar un decimal más para reducir el error
en la recodificación), para ello escogeremos en el sector izquierdo (Valor Antiguo) la opción
“Rango, INFERIOR hasta valor” en el que especificaremos el valor del límite superior, luego en el
campo de la derecha (Valor Nuevo) ingresaremos en el campo “Valor” el código que asumirá
esta nueva categoría, finalmente pulsaremos en el botón “Añadir”; veamos esto a continuación:

1
3

Para las categorías de “Peso Normal”, “Sobrepeso” y “Obesidad” sin contamos con un rango
preciso entre dos valores puntuales, es por ello por lo que, para estas categorías usaremos la
opción “Rango”. A continuación, se muestra la secuencia de imágenes:

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud
Instituto Nacional de Salud
Oficina General de Investigación y Transferencia Tecnológica

Para la categoría de “Obesidad Mórbida”, se considerará a todos los sujetos que tengan valores
de 40.00 hacia el valor más superior registrado, tal como veremos a continuación:

1 3

Al finalizar este proceso deberemos tener todas las categorías conformadas, tras ello
presionaremos en el botón continuar, con lo que saldremos de esa ventana, regresando a la
anterior en la que presionaremos la opción “Aceptar”.

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud
Instituto Nacional de Salud
Oficina General de Investigación y Transferencia Tecnológica
Una vez finalizado todos estos pasos, encontraremos que se ha creado una nueva variable, a la
cual se le deberá corregir la cantidad de decimales y asignar sus valores.

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud
Instituto Nacional de Salud
Oficina General de Investigación y Transferencia Tecnológica

RECODIFICACIÓN DE VARIABLES CON STATA


En caso de trabajar con el paquete estadístico STATA, tras cargar la base de datos, deberemos
crear un duplicado de la variable “Índice de Masa Corporal” a la cual le pondremos de nombre
“EN”; esta variable nueva será la cual modificaremos para no alterar la original, este proceso
requiere que usemos el comando “gen” bajo la siguiente estructura de sintaxis:

gen variable_nueva=variable_original

Traducido al ejemplo sería de la siguiente forma:

gen EN=ÍndicedeMasaCorporal

Tras tener esta nueva variable deberemos recodificarla, para ello usaremos el comando
“recode”, este comando amerita construir una sintaxis bajo la siguiente lógica

recode variable_nueva (min/max=1) (min/max=2) (min/max=3) …

De forma aplicada, la expresión sería como se ve a continuación:

recode EN (min/18.49=1) (18.50/24.99=2) (25.00/29.99=3) (30.00/39.99=4) (40.00/max=5)

Una vez ejecutada esta secuencia de comandos, habremos generado y categorizado una variable
nueva; quedando pendiente al investigador solo consignar su etiqueta y valores.

Material de Apoyo Consultor Externo en Temas de Investigación


Dr. Gilmer Solis Sánchez y Estadística en Salud