Sunteți pe pagina 1din 14

BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

CAPÍTULO 1

CONCEPTOS BASICOS

Sumario

1. Introducción

2. Clasificación

3. Variables Dependientes e Independientes

4. Variables Discretas y Continuas

5. Variables Nominales, Ordinales, Intervalicas y Proporcionales.

6. Otra clasificación de las variables

7
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

OBJETIVOS ESPECÍFICOS

Al finalizar el estudio del presente capítulo, el estudiante será capaz de:

 Conocer la importancia de la Estadística en Medicina.

 Distinguir claramente qué es una variable.

 Identificar los distintos tipos de variables y relacionarlas con una determinada clasificación.

8
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

1. INTRODUCCION

Muchas veces los estudiantes de Medicina nos hacemos las siguientes preguntas: ¿Por qué es
necesario estudiar estadística en medicina? ¿Para qué estudiamos números si en toda la carrera
solo vamos a ver músculos, huesos o tejidos? ¿Es esta una materia que realmente me va a servir
en mi vida profesional o es simplemente un relleno del Plan de estudios?

Supongamos que después de haber terminado tus estudios universitarios y haberte graduado
como Médico Cirujano, consigues un trabajo ya sea como: Docente de una materia en la Facultad
de Medicina, como Gerente de Salud, como Docente Investigador, te asocias con otros médicos
para administrar un hospital y prestar tus servicios profesionales en él o simplemente abres tu
consultorio particular para consulta externa.

En el caso que seas Docente de una materia en la Facultad de Medicina, elaborarás exámenes
para medir el rendimiento de los alumnos, pero qué sucede con la elaboración misma del examen,
es decir: ¿Las preguntas que hiciste a tus alumnos son las más adecuadas?, ¿Cómo saber si una
o más preguntas están mal planteadas?, ¿Cuáles fueron las preguntas que se respondieron
correctamente?, ¿Cuáles fueron las preguntas que se respondieron de manera incorrecta?, ¿Qué
porcentaje de alumnos aprobó el examen?, ¿Cuál es la nota promedio del Curso? , ¿Entre qué
rango de notas está la nota promedio y cuántos alumnos están en ese rango?, ¿Qué porcentaje
de los buenos alumnos aprobó o reprobó el examen?, ¿Qué porcentaje de los malos alumnos
aprobó o reprobó el examen?......

Como Gerente de salud estás encargado de reunir todos los datos que se dan en los distintos
Centros de Salud, los cuales deben ser procesados para mandarlos a un Gerente de Salud
Regional y estos a su vez al Ministerio de Salud para que este, de acuerdo a los datos que se le
envíen solicite recursos económicos ya sea del Gobierno o de otros países para poder actuar
frente a una determinada enfermedad. Por ejemplo se necesitan enviar datos de los distintos
Centros de Salud como ser edad, sexo, enfermedad, cantidad de medicamentos suministrados,
cantidad de personal actual, laboratorios, etc. Para que mediante un análisis de estos datos se
proceda a hacer un desembolso económico para un programa determinado, por ejemplo: Solicitar
apoyo económico del Gobierno para hacer efectivo el Programa de Control de Tuberculosis en
Cochabamba.

¿Estarán correctos los datos que le envío al Gerente de Salud Regional?, ¿Podrá contar un
determinado Centro de Salud, con más enfermeras y médicos, para atender mejor a los
pacientes?, ¿Un determinado Centro de Salud, podrá tener un mejor presupuesto el siguiente año?

Si trabajas como Docente Investigador, y te indican que investigues “La evolución del VIH/SIDA en
Bolivia” por ejemplo, entonces seguramente tendrás que hacer un estudio de la población (sexo,
raza, religión, edad, ocupación, ingresos económicos, nivel de estudio, estado civil, etc.), investigar
en los distintos Hospitales los casos de Sida registrados, registrar esa información, ordenarla,
tabularla y con los datos que tienes responderte a las siguientes preguntas: ¿Cuántos casos de
Sida hay en Bolivia actualmente?, ¿Se incrementará el número de casos de Sida en los próximos
cinco años?, ¿Qué departamento tendrá el mayor índice de casos de Sida?, ¿Los mecanismos de

9
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

control de la enfermedad están dando resultados satisfactorios?, ¿El personal con que se cuenta
es el suficiente?, ¿Cuántos casos de mortalidad por VIH/SIDA existen al año?, etc.

Si te asocias con otros médicos para administrar y/o prestar tus servicios profesionales en un
hospital, te conviertes en un socio activo del mismo y tienes que velar tanto por tus intereses como
por los intereses del hospital, la idea es que este funcione de manera exitosa y tenga la mayor
cantidad de servicios y de una atención de calidad al paciente, entonces aquí, nos planteamos las
siguientes preguntas:¿Qué tipo de personas vienen a ser atendidas al hospital (sexo, raza, estado
civil, profesión)?, ¿ Qué tipos de enfermedades son las más frecuentemente atendidas?, ¿Cuántas
cirugías se practican a la semana, al mes, al año?, ¿Qué tipo y cantidad de alimentación se da al
paciente (líquida, blanda, normal)?, ¿Cuántos cuartos se utilizan en el hospital al día, a la semana,
al mes, al año?, ¿Cuáles son los costos de funcionamiento del Hospital (Luz, agua, teléfono)?,
¿Cuáles son los beneficios económicos que genera el Hospital?, ¿Cuáles las pérdidas?, ¿Cuántas
son las cuentas canceladas y las Cuentas por cobrar?, ¿De aquí a cuantos años se podrá
recuperar la inversión económica hecha en el hospital?, ¿El personal que trabaja en el hospital es
el adecuado o se necesita más médicos, enfermeras, administrativos?, ¿Están los sueldos de
acuerdo al trabajo que realizan los empleados?, etc.

O si simplemente abres tu consultorio (como hace la mayoría de los médicos, alquilas un consultorio
en algún lugar de la ciudad) para brindar tus servicios en consulta externa, tienes que cuestionarte lo
siguiente: ¿Cuántos pacientes se atiende por mes?, ¿Cuál es la enfermedad más común que tiene
un paciente?, ¿Cuál es el promedio de cirugías que realizo?, ¿Cuántos pacientes son particulares?,
¿Cuántos pacientes tienen seguro médico?, ¿Cuánto es mi ingreso promedio por mes?, ¿Cuánto
gasto de agua, luz, teléfono?, ¿Me conviene seguir atendiendo en este consultorio o busco otro más
céntrico?, etc.

Como estamos viendo, la estadística aplicada a la medicina, es una herramienta muy útil que sirve
al estudiante actual (aplicándola en distintas materias, como en trabajos de investigación,
Proyectos, Ferias Científicas, etc.), como también al futuro médico a lo largo de toda su vida
profesional.

Una vez convencidos de esto, empecemos entonces a ver qué es Estadística y algunos conceptos
básicos que nos permitirán ir comprendiendo de una mejor manera la misma.

El motivo por el que surge la estadística, es porque el mundo está lleno de variaciones, por ejemplo
varia la edad de las personas, la altura, su estado civil, su color de ojos, el tipo de enfermedad que
puedan tener, varia su tratamiento, el tipo y número de celular que utilizan, etc. Es así que debido a
esas variaciones surge la estadística, la cual se va a ocupar de estudiar dichas variaciones para
sacar una determinada conclusión.

Antes de definir qué es Estadística, veremos qué es Ciencia:

CIENCIA: Es el conocimiento exacto y razonado de ciertas cosas.

10
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

La Lógica Matemática, Biología, Química, son ejemplos de Ciencias.

Ahora que sabemos qué es una Ciencia, pasemos a definir qué es Estadística.

ESTADISTICA: Es una ciencia que tiene por objeto agrupar metódicamente todos los
hechos que se prestan a una valuación numérica.

Los impuestos, la población, la tasa de mortalidad infantil en Bolivia, cantidad de pacientes por
Centro de salud, son ejemplos de hechos que se pueden agrupar para ser evaluados
numéricamente.

Ahora se presentan tres nuevos conceptos que nos van a ayudar a entender mejor cómo
trabaja la estadística.

POBLACION: Es el conjunto de elementos (humano o no) respecto del cual se desea


realizar una investigación determinada.

UNIVERSO: Es el grupo de personas con características comunes que se toman en cuenta


de una población para realizar una investigación.

MUESTRA: Es una fracción representativa de un grupo de personas consultadas en una


encuesta. Para estimar el tamaño de la muestra y que esta sea representativa se procede
a hacer un cálculo complejo que no se pretende explicar en este libro, nos limitaremos a
decir que esta va a ser el 10% del Universo.

Por ejemplo, de la población de todas las mujeres en edad fértil entre 15 y 49 años, se toma
un universo, el de todas estas mujeres que asisten a la Maternidad “Germán Urquidi” de la
ciudad de Cochabamba en el mes de Febrero para tener un parto normal, que pueden ser: 900
mujeres. La muestra significativa o representativa de este universo sería: 90 mujeres.

11
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

2. CLASIFICACION

Se va entender por clasificación a la distribución de un conjunto de elementos de acuerdo con un


principio de jerarquía lógica, es decir identificar las formas en que los objetos son similares ya sea
por tamaño, color, forma, etc.

Básicamente la clasificación es una forma lógica de ordenar algo, pero hecha por alguien, esto
significa que uno clasifica las cosas u objetos de acuerdo a su necesidad y nunca hay que decir
que esa es la única clasificación y no hay otras más, la idea es no “casarse” con una clasificación
sino mas bien ver que existen muchas clasificaciones de acuerdo a las necesidades de la persona
que realiza dicha tarea.

De lo anteriormente dicho se procede a dar una clasificación tanto de la estadística como varias
clasificaciones de las variables de acuerdo a la utilidad que se les quiera dar.

La Estadística, nos va permitir describir a la persona “media”, comprobar cómo dicha descripción
encaja o no en otras personas y ver hasta qué punto podemos generalizar nuestras conclusiones
tras el estudio de unos cuantos individuos a toda una población.

De lo anteriormente mencionado, podemos clasificar a la estadística según el esquema 1:

ESTADISTICA

DESCRIPTIVA INFERENCIAL

Esquema 1: Clasificación de la Estadística

ESTADISTICA DESCRIPTIVA: Se dedica a la presentación, organización y resumen de


los datos.

En esta parte vamos a aprender a tabular los datos recogidos de una investigación,
representarlos de manera gráfica para tener de esta manera una idea de lo que estos datos
representan y por último vamos a aprender a resumir ese conjunto de datos en unos pocos
números que van a ser significativos para nosotros.

12
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

Pasemos a definir Estadística Inferencial como sigue:

ESTADISTICA INFERENCIAL: Nos permite generalizar los datos de una muestra a un


número más grande de individuos.

Población, Universo, Muestra y estadística Inferencial siempre van agarrados de la mano:

Por ejemplo, si tengo el dato que en la ciudad de Cochabamba existen 10.000 bachilleres
(Población) , y quiero saber aproximadamente cuántos de estos bachilleres estudiarán Medicina el
próximo año (Universo), perdería mi tiempo preguntándoles a cada uno de ellos que estudiará el
siguiente año, lo que se hace es escoger una muestra de 1.000 bachilleres (Colegios Fiscales y
Particulares) y se les pregunta si estudiarán Medicina el próximo año, lo que ellos respondan se
generaliza para los 10.000 bachilleres (Estadística Inferencial) y de esta manera se tiene de
manera aproximada la cantidad de personas que estudiarán Medicina el siguiente año.

3. VARIABLES DEPENDIENTES E INDEPENDIENTES

Como su nombre lo indica es algo que varía, algo que se puede medir, que puede tomar dos o más
valores, por ejemplo la estatura de una persona (1.70, 1.83, 1.20, etc.), el color de ojos (cafés,
negros, verdes, celestes, azules), el sexo (masculino, femenino), una silla (madera, fierro,
plástico), una nota musical (do, re, mi fa, sol), el estado civil (soltero, casado, viudo, divorciado),
tipo de hospital (primer nivel, segundo nivel, tercer nivel), etc.

Podemos entonces hacer la siguiente definición:

VARIABLE: Es todo lo que está siendo observado o medido.

Se pueden clasificar a las variables en:

VARIABLES

DEPENDIENTES INDEPENDIENTES

Esquema 2: Clasificación de las variables

13
VARIABLE DEPENDIENTE: Es FRANZ
BIOESTADISTICA el objeto de interés
JORDAN PARRADOque varía en respuesta
TALLER a alguna
DE BIOINFORMATICA
acción.

VARIABLE INDEPENDIENTE: Es la intervención o lo que está siendo aplicado.

Analicemos el siguiente caso:

Supongamos que soy un Investigador y consigo veinte estudiantes de Lógica Matemática a los
cuales les encanta tomar cerveza Taquiña. Entonces hago un experimento científico con ellos y los
llevo al Prado; ahí nos espera un carro cisterna lleno de cerveza, les digo que consuman todo lo
que quieran y que en unas dos horas yo vuelvo para ver que tal están. Como la cerveza es gratis,
toman todo lo que pueden y a las dos horas regreso y encuentro el siguiente cuadro: Un grupo de
estudiantes está bailando, otro grupo está llorando, otro grupo está riendo, otro grupo está
durmiendo, unos cuantos se están peleando, otro grupo me pide más cerveza……

Me hago la siguiente pregunta: ¿Cuál la variable dependiente y cual la independiente de mi


experimento científico?

Comparo las definiciones anteriormente mencionadas y veo que tengo dos variables:

a) Cerveza Taquiña,
b) Estudiantes (bailando, llorando, riendo, durmiendo, peleando, pidiendo más cerveza).

Lo que actúa sobre mis estudiantes (interviene o es aplicado) es la Cerveza Taquiña, por lo tanto
esta es la variable Independiente.

Los objetos de interés que varían en respuesta a alguna intervención (Cerveza Taquiña) son mis
estudiantes, por lo tanto ellos son la variable Dependiente.

14
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

4. VARIABLES DISCRETAS Y CONTINUAS

Ahora ya tenemos una idea clara de lo que es una variable, y sabemos que esta puede tomar
distintos valores como por ejemplo la altura: (1.70 mts., 1.83 mts., 1.20 mts., etc.) o el sexo:
(masculino, femenino). En esta sección nos vamos a concentrar en el número de valores que una
variable puede tomar.

Para eso vamos a dividir a las variables en dos tipos:

VARIABLES

DISCRETAS CONTINUAS

Esquema 3: Clasificación de las variables

VARIABLE DISCRETA: Toman valores que son siempre números enteros.

Solamente pueden tomar valores en un conjunto finito de datos.

Veamos los siguientes ejemplos de variables discretas y los valores que pueden tomar de un
conjunto finito de datos:

a) Cara de un dado= {1, 2, 3, 4, 5, 6} Toma 1 de 6 valores posibles.

b) Dientes de una persona= {1,2,..,32} Toma 1 de 32 valores posibles.

c) Número de operaciones realizadas por un médico al año = {1, 2, 3,…50} Va a tomar un


número entero, no puede haber realizado 14 ½ operaciones al año, no tendría sentido.

d) Lista de las especialidades existentes en Medicina = {1, 2, 3,…,80}.

e) Número de habitaciones en un hospital= {1,2,3,4,….,30}

VARIABLE CONTINUA: Puede tomar cualquier valor de un intervalo determinado.

Por ejemplo, estudiemos la variable, estatura de una persona:

a) Estatura = 13,5 metros.

b) Estatura = -2,3 metros.

c) Estatura = 1,72 metros.

15
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

El caso a) y el caso b) son casos imposibles ya que una persona no puede medir 13,5 metros o
no puede tener una estatura negativa. Entonces debemos delimitar el intervalo de la siguiente
manera:

Estatura=1.72 Metros; se encuentra en un intervalo inferior de 50 centímetros o su


equivalente en metros que sería 0.5 metros (supongamos que es la estura mínima de un bebe
al nacer) y un intervalo superior hasta 3 metros (supongamos que es la estatura máxima que
una persona puede alcanzar).

Vale decir: estatura = {0.5 metros,….., 3 metros}

Cualquiera de los valores que se encuentren en ese intervalo para la variable estatura es
permitido, es decir: (estatura=1.34; 2.5; 1, 1.72; 2, 2.5, 3; etc.).

Si una persona mide 2 metros, igual sigue siendo un valor continuo, pues la variable estatura
es continua.

Más ejemplos de datos continuos:

a) Estatura = {0.5,..,3} Metros.

b) Peso de una persona= {1,..,200} Kilogramos.

c) Sueldo de una persona Ej. 3.920,14 Bolivianos.

d) La hora Ej. 04:45:10 A.M.

e) La presión sanguínea.

f) La cantidad de litros de agua que ingiere una persona en el día.

g) La cantidad de gramos de azúcar que te colocas en una taza de café, etc.

En realidad muchas de las técnicas estadísticas que aprenderás, no se fijan si los datos
son discretos o continuos; ya que un número no es más que un número. Sin embargo
hay casos en los que esta distinción es esencial, todo esto se lo verá a su debido tiempo.

16
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

5. VARIBLES NOMINALES, ORDINALES, INTERVALICAS Y


PROPORCIONALES

Aquí vamos a pensar en las variables de otra manera distinta y las vamos a ver según el siguiente
esquema:

VARIABLES

NOMINALES ORDINALES INTERVALICAS PROPORCIONALES

Esquema 4: Clasificación de las variables

VARIABLE NOMINAL: Consiste en categorías a las que se asigna un nombre sin que
exista ningún orden implícito en ellas.

El Sexo= {Masculino, Femenino} es una variable nominal, pues no importa el orden de sus
valores, pues no se gana ni pierde información si intercambiamos sus valores Sexo=
{Femenino, Masculino}.

Lo mismo podemos decir de las siguientes variables que se encuentran en la Libreta del
Servicio Militar:

a) Color de Ojos ={Azules, Verdosos, Pardos, Negros}

b) Nariz = {Aguileña, Recta, Respingada, Normal}

c) Boca = {Chica, Mediana, Grande}

d) Cabellos = {Rubios, Blancos, Castaños, Negros}

e) Labios = {Gruesos, Delgados, Medianos}

17
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

VARIABLE ORDINAL: Consiste en categorías ordenadas, de manera que las diferencias


entre categorías pueden no ser iguales.

En este tipo de variables el orden de las categorías sí es importante y los intervalos o diferencias
entre las distintas categorías no siempre son iguales, para tener una idea exacta de este tipo de
variables, daremos el siguiente ejemplo:

Después que un estudiante de la Carrera de Informática, defiende su Tesis, el Tribunal Calificador


se reúne y delibera la Nota que le va a colocar, pero el gran problema del tribunal es que por una
nueva orden de Dirección académica, este no puede colocar una nota numérica sino más bien un
equivalente de la misma que tenga uno de los siguientes valores: Reprobado, Aprobado, Aprobado
con Felicitaciones y Aprobado con Honores.

Pero el tribunal solo sabe colocar notas numéricas entre 1 y 100 puntos (con una nota de 51, ya
aprobó la Tesis), es así que se debe hacer una serie de categorías ordenadas (ya que por ejemplo,
aprobado con Honores es más importante que Aprobado solamente) y darle ciertos intervalos a
esas categorías que tengan equivalencia con la notas numéricas.

¿Así, un estudiante que se saco 78 a qué categoría correspondería?

Para responder esta pregunta podemos hacer la siguiente tabla:

Categoría Intervalo
Aprobado con Honores Entre 91 y 100 puntos.
Aprobado con Felicitaciones Entre 71 y 90 puntos.
Aprobado Entre 51 y 70 puntos.
Reprobado Entre 1 y 50 puntos.

Tabla 1: Categorías de calificación de la Carrera de Informática

Como vemos en este ejemplo los intervalos no son iguales, existen diferencias entre ellos y el
orden de las categorías si es importante, pues como dijimos anteriormente, no es lo mismo que al
Alumno que defiende la Tesis le digan: Reprobado que Aprobado con Honores.

De esta manera, el estudiante que se saco 78 en la defensa de Tesis, corresponde a una Nota de:
Aprobado con Felicitaciones.

18
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

VARIABLE INTERVALICA: Es aquella que tiene distancias iguales entre sus valores, pero
el punto cero es arbitrario.

El ejemplo clásico para este tipo de variables es el de la temperatura. La escala en grados Celsius,
para medir la temperatura usa de referencia el punto de congelamiento del agua como temperatura
cero grados Centígrados (Punto cero arbitrario) y el punto cero de ebullición como temperatura 100
Grados Centígrados.

En cambio, la escala en grados Fahrenheit, toma el punto de congelamiento del agua como 32
grados Fahrenheit (Punto cero arbitrario) y e punto de ebullición del agua como 212 Grados
Fahrenheit. ¿Cuál es la razón?, ninguna en especial, simplemente porque así les gustó a sus
diseñadores. En realidad cualquiera puede formar su propia escala.

Pero la propiedad que hay que recalcar de la temperatura, es que se da a intervalos


idénticos, sin importar la escala que use.

VARIABLE PROPORCIONAL: Es aquella que tiene intervalos iguales entre sus valores,
pero el punto cero es significativo.

En las variables proporcionales aparece un cero significativo, que es el mismo para cualquier
escala. Por ejemplo, al comprar carne de vaca en el mercado, no importa en qué escala la pesen,
cero kilos serán siempre cero kilos, cero arrobas, cero libras, etc. Ahora bien si compramos 435
gramos de carne, eso equivaldría a una libra de carne; de ahí el nombre de variables
proporcionales.

6. OTRA CLASIFICACIÓN DE LAS VARIABLES

VARIABLE ALFANUMERICA: Este tipo de variable se caracteriza por mezclar números y


letras al mismo tiempo.

Por ejemplo, las variables:

Designación de salas un hospital: {S-1, S-2, S-3,.., S-20}

Designación de camas de un hospital: {101- C, 102 – C,…, 250 - C}

Placas de un automóvil: {000AAA,..,234NEI,..,900SNX,.., 999ZZZ}

19
BIOESTADISTICA FRANZ JORDAN PARRADO TALLER DE BIOINFORMATICA

VARIABLE CUANTITATIVA: Que se refiere específicamente a las cantidades; se


encuentra dividida en dos escalas:

Primera escala: Se encuentran

 Las variables Discretas (que admiten números enteros).


 Las variables Continuas (que admiten números enteros y decimales para cierto intervalo
de datos).

Segunda escala: Se encuentran

 Las datos Intervalicos


 Los datos proporcionales

VARIABLE CUALITATIVA: Se refiere básicamente a las cualidades. Entre estas se


pueden citar a:

 Los Datos Nominales (que no mantienen un orden jerárquico).


 Los Datos Ordinales (que siguen un orden determinado).

Ahora bien, de acuerdo a esta clasificación, las variables tienen características, como por ejemplo:
que cualquiera de ellas puede ser: dependiente o independiente.

Como se dijo anteriormente solo con clasificaciones que son utilizadas de acuerdo a la necesidad
de la persona que trabajará con una determinada variable.

20

S-ar putea să vă placă și