Sunteți pe pagina 1din 4

MODULO 1.

ESTADISTICA DESCRIPTIVA
Glosario

aleatorio
random: al azar, estocstico. Este trmino representa una idea que debe ser
expresada en trminos del concepto de probabilidad. Tenemos la nocin de que un
fenmeno ocurre en forma aleatoria cuando no sigue un patrn particular que se
pueda describir directamente por ecuaciones. As no podemos hacer una
prediccin perfecta del resultado que se obtendr del fenmeno. Al decir que un
proceso es aleatorio estamos diciendo que sigue alguna distribucin de
probabilidad
aleatoriamente
randomly: actividades o mtodos producidos o llevados a cabo simulando un
comportamiento al azar
ambigedad
ambiguity: es el resultado del estudio estadstico de un conjunto de datos o
valores que permite llegar a diferentes conclusiones. Ejemplo: Al determinar las
causas de la desercin estudiantil, se toma como indicador la vocacin profesional
del bachiller. Al llegar a la conclusin se determina que las causas de la desercin
especficamente son: crisis econmica, rendimiento
apareamiento por
group matching: mtodo de apareamiento empleado durante el proceso de
grupos
asignacin en una investigacin en la cual los individuos del grupo de estudio y del
grupo de control se seleccionan de tal forma que la distribucin de cierta variable o
variables sea prcticamente idntica en ambos (sinnimo: apareamiento por
frecuencias)
asignacin al azar
randomization: mtodo de asignacin en el cual los individuos tienen una
probabilidad conocida, aunque no necesariamente igual, de ser asignados a un
grupo determinado, sea el de estudio o sea el de control. Se diferencia de la
seleccin al azar en que los individuos que se asignan pueden ser o no
representativos de la poblacin (sinnimo: asignacin aleatoria)
diseo de la muestra
sampling design: plan definitivo, determinado por completo antes de recopilar
cualquier dato, para tomar una muestra de una poblacin particular
diseo experimental
experimental design: puede ser experimento controlado o diseo
completamente aleatorio. En el experimento controlado todas las variables, excepto
la que se considera, se maneja como fijas. En el diseo completamente aleatorio
todas las variaciones debidas a factores extraos no controlados pueden, por tanto,
incluirse en el trmino de variacin debida al azar
distribucin de
frequency distribution: es una especificacin de cmo las frecuencias de los
frecuencias
elementos de una poblacin o muestra estn distribuidos de acuerdo con los
valores observados. Se puede representar en forma de tabla, grfica de barras o
histograma. Nos dice cuantos elementos tienen el mismo valor o caen en el mismo
intervalo
distribucin de
probability distribution: en el caso de una variable aleatoria discreta, da la
probabilidad
probabilidad de observar que la variable X asume un valor x , es decir,
Pr ( X = x ) . Se expresa como funcin de x : f ( x ) = Pr ( X = x ) . La funcin f ( x)
se llama funcin de probabilidad. En el caso de una variable aleatoria continua, la
distribucin de probabilidad se representa por una funcin g ( x ) llamada funcin

[ ]
de densidad. En este caso, si tenemos un intervalo pequeo, x, x + a , entonces,

1
Pr ( x < X x + a ) es aproximadamente igual a: a g ( x ) . En todo caso, la funcin
de probabilidad siempre en un valor no negativo y su suma o integral sobre todos
los valores de x siempre es igual a 1
distribucin de
cumulative probability distribution: es una funcin de x que nos dice cual es
probabilidad
acumulativa la probabilidad de observar un valor de la variable menor o igual a x . Es decir,
F ( x ) = Pr ( X x ) . Es una funcin no decreciente con F ( ) = 0 y F ( ) = 1
encuesta
survey: mtodo de obtener datos de una poblacin o muestra, sin ejercer
control alguno sobre los factores que pueden afectar las caractersticas de inters o
resultados de la encuesta
encuesta por
sampling survey: encuesta en la que participa slo una porcin de la
muestreo
poblacin
error de medicin
measurement error: ocurre cuando las preguntas que se hacen en el
cuestionario no miden la variable que se quiere medir
error de no respuesta se introduce este error cuando los miembros de la poblacin no responden a una
encuesta. Por ejemplo, encuestas por correo, la persona no est en casa cuando
llega el encuestador, no contestan el telfono ...
error de respuesta ocurre cuando las personas encuestadas no proveen una contestacin correcta a la
pregunta. Ocurre con frecuencia cuando se quiere medir alguna variable cuya
contestacin puede ser ntima o "problemtica". Por ejemplo, si la persona no
confa en el uso en que se le dar a los resultados de sus preguntas
error de respuesta ocurre cuando una encuesta no se conduce en una muestra seleccionada al azar,
voluntaria pero se invita a las personas a llenar un cuestionario publicado en una revista,
peridico, estacin de radio o televisin
error de seleccin la lista de miembros de la poblacin, el marco, que se usa para seleccionar la
muestra no incluye o enumera a toda la poblacin. Esto introduce un sesgo.
Elementos de la poblacin con determinadas caractersticas no son incluidos en la
muestra o tienen una probabilidad distinta a la deseada de ser seleccionados
error muestral
sampling error: es la diferencia entre un estadstico y su parmetro
correspondiente. Es una medida de la variabilidad de las estimaciones del
parmetro usando muestras repetidas en torno al valor de la poblacin, nos da una
nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una
muestra se aleja del valor que se hubiera obtenido por medio de un censo
completo. Un estadstico ser ms preciso en cuanto y tanto su error es ms
pequeo. Podramos decir que es la desviacin de la distribucin muestral de un
estadstico y su fiabilidad
error no muestral son errores que ocurren en la seleccin, recoleccin, anotacin y tabulacin de los
datos. Son usualmente resultado de error humano
espacio muestral es el conjunto de todos lo posibles resultados de un experimento
estadstica
statistics: es una funcin real de los datos, concretamente, es un valor que se
calcula a partir de los datos. Ejemplos: suma, producto, mediana, mximo,
desviacin absoluta media de los datos
estadstica descriptiva
descriptive statistics: mtodos que usamos para describir los datos que se
han obtenido de la muestra o poblacin. Nos sirve para presentar una idea de la
realidad y para hacer inferencia informal
estadstica inferencial
inferential statistics: mtodos probabilsticos que usamos para tomar
decisiones, estimar, predecir o hacer generalizaciones sobre una poblacin
basados en una muestra
estudio observacional
observational study: los investigadores meramente observan los valores de
algunas caractersticas de la muestra. No manipulan ni establecen condiciones.

2
Estos estudios slo pueden describir o revelar asociacin entre dos o ms
variables. No pueden determinar causa y efecto. Para esto ltimo es necesario un
experimento debidamente diseado
evento
event: conjunto o coleccin de uno o ms posibles resultados de un
experimento. Un evento ocurre cuando cualquier resultado contenido en el evento
es observado. Es un conjunto que es miembro del lgebra sigma generado por el
experimento
eventos
independent events: dos eventos son independientes si el que uno ocurra no
independientes
afecta la probabilidad del que el otro ocurra. Matemticamente hablando, dos
eventos A y B son independientes si y slo si Pr ( A y B ) = Pr ( A ) Pr ( B ) , o
casi equivalentemente, Pr ( A | B ) = Pr ( A )
eventos mutuamente
mutually exclusive events: son dos o ms eventos que no pueden ocurrir
excluyentes
simultneamente. Si A y B son eventos mutuamente excluyentes,
Pr ( A y B ) = 0 siempre. Por ejemplo, al lanzar un dado no es posible observar el
evento {1, 2} y el evento {3} a la vez
experimento
experiment: es un proceso que cuando lo llevamos a cabo resulta en uno y
slo uno de los posibles resultados que podramos obtener (probabilidad).
Generalmente, datos son observados de los miembros de la poblacin o muestra
ejerciendo control sobre uno o ms de los factores que podran alterar la
caracterstica de inters o los resultados del experimento (ciencia)
experimento diseado
designed experiment: es un experimento donde controlamos la asignacin de
los elementos a los distintos grupos de tratamiento. El valor del tratamiento que
recibe cada individuo de la muestra es seleccionado (variable manipulada) por la
persona que efecta el experimento
hiptesis nula
null hypothesis: es una aseveracin sobre el valor de un parmetro
desconocido de una poblacin. Se presume cierta hasta tanto se demuestre lo
contrario. Usualmente indica que no hay cambio, que no hay diferencia (por eso se
llama nula). Esta hiptesis se rechaza o no (no decimos se acepta) dependiendo
del valor de la estadstica prueba o del valor p al nivel de significancia deseado
hiptesis alterna
alternative hypothesis: es una aseveracin sobre el valor de un parmetro
desconocido de una poblacin. Es la hiptesis de investigacin, es lo que
deseamos demostrar con el experimento o estudio. Cuando rechazamos la
hiptesis nula lo hacemos a favor de sta
intervalo de
probability range: proporcin de casos entre dos valores definidos de la
probabilidad
muestra
p (valor p ) p value: el nivel de significacin observado en el test. Cuanto ms pequeo
sea, mayor ser la evidencia para rechazar la hiptesis nula
poblacin
population: grupo numeroso compuesto con frecuencia, pero no
necesariamente, por individuos. En estadstica, el objetivo es extraer conclusiones
acerca de una o ms poblaciones mediante la obtencin de subgrupos o muestras
compuestos por individuos pertenecientes a la poblacin
poblacin objetivo
target population: grupo de individuos a los que se desea extrapolar o aplicar
los resultados de una investigacin. La poblacin objetivo puede ser, y de hecho lo
es frecuentemente, distinta de la poblacin de la que se extrae la muestra de una
investigacin
prevalencia
prevalence: proporcin de individuos con una enfermedad determinada en un
momento dado. La prevalencia tambin puede interpretarse como la probabilidad

3
de que un individuo elegido al azar de una poblacin tenga la enfermedad
(sinnimo : probabilidad anterior a la prueba)
probabilidad
probability: Proporcin en la cual el numerador es el nmero de veces que
ocurre un suceso y el denominador, ese mismo nmero sumado al nmero de
veces que no ocurre ese suceso
probabilidad subjetiva
subjective probability: se interpreta como evaluacin personal. Refleja la
opinin personal acerca de las incertidumbres implcitas y se aplican, en especial,
cuando hay poca o ninguna evidencia directa, de modo que en realidad no hay otra
alternativa que considerar informacin colateral (indirecta), suposiciones
razonables y tal vez la intuicin y otros factores subjetivos
sesgo de seleccin
selection bias: sesgo que se produce en el proceso de asignacin cuando la
forma como se escogen los grupos de estudio y de control determina que estos
grupos difieren en uno o ms de los factores que afectan al desenlace del estudio.
Tipo especial de variable de confusin que surge ms como consecuencia del
diseo del estudio que por azar (vase variable de confusin)
tasa
rate: habitualmente se emplea para indicar cualquier medida de la frecuencia
de la enfermedad o desenlace. Desde un punto de vista estadstico, las tasas son
aquellas medidas de la frecuencia de la enfermedad que incluyen una medida de
tiempo en el denominador (por ejemplo, la incidencia)
tasa de incidencia
incidence rate: tasa en la cual los nuevos casos de la enfermedad se
contabilizan por unidad de tiempo. La tasa de incidencia se calcula tericamente
como el nmero de individuos que desarrollan la enfermedad en un perodo
determinado dividido por el nmero de aos-persona en riesgo
tasa de mortalidad
mortality rate: es una medida de la incidencia de muerte. Esta tasa se calcula
dividiendo el nmero de muertes que han ocurrido durante un perodo por el
producto del nmero de individuos y el nmero de unidades de tiempo del perodo
de seguimiento
valor p
p -value: es la probabilidad de observar un valor tan grande o ms que el
obtenido de la estadstica prueba si la hiptesis nula es cierta. Por ejemplo, si en
una prueba z donde la hiptesis alterna es H a : > 0 , se obtiene un valor de la
estadstica prueba z = 1,83 , entonces el valor p es igual a
Pr ( z > 1,83) = 0, 0336 . Esto indica que se debe rechazar la hiptesis nula al nivel
de significancia del 5 % pero no al nivel del 1 %. Mientras ms pequeo es el valor
p , menos probable es observar un valor tan extremo como el que hemos
observado si la hiptesis nula es cierta, por lo cual la evidencia en contra de esa
hiptesis es ms contundente