Sunteți pe pagina 1din 65

ESTADSTICA

ELI AGUILAR

CAP TULO I: LA ESTAD STICA Y SU APLICACI N


La Estad stica es una manera de pensar y tratar una problem tica que plantea la realidad de
manera m s elaborada, consciente y exacta que el pensamiento ingenuo, dando criterios de
decisin. La mayor aplicaci n de la Estad stica se basa en la posibilidad de contar con
observaciones repetidas o realizar experimentos en condiciones idnticas. Cuando las
observaciones resultan diferentes a pesar de hacerlas en condiciones id nticas existe una
inseguridad vinculada a la observacin del fenmeno. Esto lleva al problema central de la
Estadstica, la teor a de la inseguridad, estudio de la tendencia de los resultados a variar cuando
se hacen observaciones en condiciones idnticas desde el punto de vista del observador
Definicin: Estadstica es un conjunto de mtodos cient ficos con los cuales podemos recolectar,
resumir, presentar y analizar datos numricos de un conjunto de individuos, que permiten extraer
conclusiones y tomar decisiones segn dicho anlisis. Aplicamos estad stica cuando tenemos gran
cantidad de observaciones cuya aparicin se rige por las leyes del azar. Yule: datos cuantitativos
fuertemente influenciados por m ltiples causas. Gini: t cnica adecuada al estudio cuantitativo de
fenmenos colectivos cuya medicin requiere observaciones de fen menos individuales
Historia
Estad stica deriva de status que en el lat n medieval significaba estado poltico. Se us por
primera vez en Hamlet de Shaskespeare, luego en tratados de pol tica econ mica y significaba la
exposicin sistemtica y ordenada de las caractersticas del estado, los censos, que se mencionan
en textos egipcios, en la Biblia hechos por Mois s y David, en China por Confucio, en Grecia y
Roma. La iglesia y su Concilio de Trento introduce la inscripci n de matrimonios, nacimientos y
muertes. Hacia el siglo XVII adquiri autonom a y organizaci n con C nning, fundador de la
estad stica en Alemania, estad stica universitaria descriptiva. El nombre de estad stica le fue
dado por Achenwald.
Tambi n en el siglo XVII surgen en Inglaterra los aritm ticos pol ticos que pretendan una
estad stica investigativa. Graunt fue de los primeros en realizar estad sticas de la poblaci n,
analizaba la influencia de las estaciones del a o sobre la mortalidad, la afluencia de poblaci n
rural a la ciudad. De esta escuela derivaron dos: La enciclopedicomatemtica que entronca con la
aparicin del clculo probabilstico. Representantes: Huyghens y su tratado sobre la probabilidad
de xito y fracaso en las cartas y los dados. Pascal y Fermat y sus principios fundamentales del
clculo de probabilidades. Bernouilli que lo aplic a lo social. De Moivre y la formulaci n
matemtica de la curva de probabilidad integral. Laplace y Gauss demostraron el valor practico
de la curva tpica de la distribuci n de errores cometidos en las observaciones. Quetelet aplic
esta curva a datos de tipo social y biolgico originando la Antropometria. Galton, precursor de la
Psicometr a en psicolog a, extendi la estad stica a datos de tipo gen tico para el estudio de la
herencia de los caracteres som ticos y sus diferencias individuales. De l procede la escuela
inglesa de estad sticos y biometristas: Pearson, Yule, Spearman, Student, Thurstone. La otra
tendencia es la demogrfica con Sssmilch y sus leyes de movimiento de la poblacin
Variables
En la realidad observamos gran cantidad de distinciones sensibles, sobre las que podemos realizar
operaciones psicolgicas de clasificacin, seriacin, y relacin. El observador debe decidir cuales
sern sus entidades de estudio, las propiedades que quiere estudiar, las operaciones psicol gicas
que quiere realizar. Esas operaciones se realizan sobre las propiedades de las entidades. Como

estas propiedades pueden variar, se llaman variables Si en un caso particular no var an, se llaman
constantes
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

La observacin
La descripcin cientfica se pone en marcha con la observaci n, que consiste en la percepci n de
un dato sensible. Sobre los datos se pueden realizar las operaciones psicol gicas de clasificaci n,
relacin y seriacin que permiten establecer distinciones entre los estados de las variables La
matemtica por medio de la cuantificacin establece distinciones entre los estados de las
variables asignando nmeros a los estados. El recuento es muy utilizado en las ciencias sociales
cuando interesa saber el n mero de habitantes de una localidad, n mero de veces que en un
tiempo determinado interact an entre si dos individuos. La estad stica tambi n tiene muchas
veces como materia prima operaciones de recuento
Posibilidad de medicin en las ciencias sociales y de la conducta
Todo lo que existe, existe en cierta cantidad. En la investigaci n cient fica es esencial la
medicin de fenmenos porque permite ver si hay variaciones, si son concomitantes, si se
relacionan. Cuando un fsico mide, asigna nmeros a las observaciones, los nmeros pueden
analizarse por manipulaciones como contar o medir, seg n ciertas reglas. El psic logo intenta
hacer lo mismo midiendo variables de comportamiento, pero para operar con los n meros que
asigna a las observaciones, la estructura de asignar n meros debe ser isom rfica. Para eso hay
que entender la naturaleza de la matemtica.
Toda rama de las matemticas comienza con un conjunto de postulados. Un postulado es un juicio
que establece relaciones entre objetos. Un postulado es til por las conclusiones que podemos
sacar de el. En un sistema de postulados no debe haber dos que se contradigan y no deben
repetirse. Las deducciones lgicas que se sacan de los postulados son los teoremas
Postulados y teoremas est n en el reino de las ideas, no refieren al mundo real. La funci n de las
matemticas es proveer modelos convenientes para describir la naturaleza, pero esta no puede
ser descripta exactamente por modelos matem ticos, toda descripci n es una aproximaci n. La
naturaleza no obedece a leyes matemticas pero su estructura posee propiedades que son
similares, paralelas a la estructura de los sistemas l gicos matem ticos. Existe un isomorfismo o
equivalencia de estructuras.
La estad stica y la investigaci n en las ciencias sociales y de la conducta
La estadstica permite conocer y medir individuos u observaciones bajo dos puntos de vista:
1) En funci n a caracter sticas del grupo y no a cualidades particulares, dando:
a) Conocimiento preciso de la composicin del grupo por relevamiento de la caracter stica medida
b) Conocimiento de cualidades abstractas ligadas al grupo mediante el c lculo resumido en:
1. La media o valor central tpico del grupo
2. La desviacin estndar, grado de variacin de las observaciones respecto de la media
3. La forma de distribucin de las observaciones: simetra o asimetr a
4. El error est ndar que permite conocer la cantidad de casos que deben tomarse para obtener
un determinado grado de seguridad o en que medida pueden ser generalizadas las conclusiones
c) Da el grado de asociacin que puede existir entre dos variables
2) Se emplea con el fin de predecir o estimar una situaci n probable
Por eso la Estad stica puede dividirse fundamentalmente en:
Estadstica Descriptiva: Parte de un conjunto de datos y obtiene conclusiones de los mismos pero
no rebasan el conjunto de conocimientos que proporcionan esos datos.

Estadstica Inferencial: Parte de un conjunto de datos pero las conclusiones obtenidas rebasan
los lmites del grupo y permiten inferir valores para individuos o grupos dentro de ciertos l mites
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

CAPITULO II: PRESENTACI N DE OBSERVACIONES Y SISTEMATIZACI N DE DATOS


Etapas de una investigacin estadstica
1. Elaboracin del Dise o de Investigaci n: Ser distinta si es de tipo descriptiva o explicativa.
Hay que planear que instrumentos se utilizar n (encuestas, censos, test); como se utilizar n los
resultados, sistema de codificacin, tipo de tabulacin (manual o mecanizada)
2. Compilacin de los datos: relevamiento de la poblaci n o muestra. Datos primarios y
secundarios. Listado de la poblacin y seleccin de la muestra. Enumeraci n de los datos
3. Sistematizacin de los datos: Tabulacin, preparaci n de cuadros y gr ficos, presentaci n gral
4. Anlisis estad stico: hallar los estad sticos relativos a la tendencia central, variabilidad
asimetr a, error est ndar; inferencias para la poblaci n respectiva, estimaciones, decisiones
respecto al margen de error aceptable etc.
Para realizar el Anlisis es necesario conocer la frecuencia que corresponde a cada categor a de
la variable, para ello se compilan y ordenan las observaciones. Determinada la frecuencia es
necesaria su presentacin en algn sistema simblico: tabular, gr fico, o frmulas matem ticas.
Construccin de las tablas de distribuci n de frecuencias
La presentacin tabular consiste en presentar en dos columnas, las categor as de las variables de
observaci n y las frecuencias correspondientes, de manera que en cada hilera se indica una
categora y su frecuencia correspondiente. Un problema previo reside en la construcci n de las
categor as que tiene por objeto destacar la influencia por parte de cada categor as en las
variaciones de frecuencia. Esto obliga a establecer un n mero de categor as no muy grande, para
que se destaquen las variaciones de frecuencias, ni muy pequeo para que no resulten absorbidas
las diferencias que queremos destacar.
Escala Nominal: La variable de observacin corresponde a una escala nominal Los miembros de una
categor a deben ser id nticos respecto de la propiedad medida. Con estas escalas podemos
obtener frecuencias, expresarlas en t rminos de porcentajes, ver cual es la categor a de mayor
frecuencia (modo) y obtener algunas medidas de correlaci n. En un cuadro, la primera columna
corresponde a las categoras de clasificacin de la variable y la segunda a la frecuencia
correspondiente a cada categor a. En una fila particular, al comienzo o al final, se coloca la
frecuencia total. El orden de sucesin de las categor as nominales no corresponden a una
caracterstica de medicin, sino a razones de presentacin.
Escala Ordinal: Los elementos de una categor a no solo son distintos de los de otra categor a,
adems est n en alguna relaci n con ellos que se da en cierto orden. La medida de tendencia
central mas apropiada en estas escalas es la mediana. Se construyen con igual criterio que las
nominales pero la sucesi n de las categor as del cuadro est dada por el criterio de la escala
segn un orden de sucesin
Escalas de intervalos iguales y cocientes: La de intervalos iguales se caracteriza por una unidad
de medida constante que asigna un n mero real a cada par de objetos del conjunto ordenado. La
de cocientes es id ntica pero tiene en su origen tiene realmente un punto cero. Estas son
realmente escalas cuantitativas y a ellas pueden aplicarse todas las medidas estad sticas excepto
el coeficiente de variaci n a la de intervalos iguales. Se deben distinguir variables discretas de
continuas. Una variable es continua cuando entre dos valores sucesivos existen valores
intermedios. Permite cualquier grado de subdivisin (tallas, edades). Discreta es aquella en la que

entre valores sucesivos no hay intermedios (n de hijos). Los puntajes de los test son discretos
pero se trabajan como continuas pues la aptitud subyacente se considera continua
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

En la variable discreta se agrupan valores en una categor a, en la variable continua no hay un


criterio para separar dos valores sucesivos porque entre ellos siempre se puede haber otro. Para
resolver esto usamos dos criterios, uno para las variables continuas en general y otro para la
edad. Si la cifra es muy larga, tomaremos la cantidad llamada cifra significativa: si la cifra real
siguiente a la ltima significativa es 5 se desprecia la cantidad residual (4,324 ser 4,32) si la
cifra siguiente a la ltima significativa es 5 se aumenta en una unidad la ltima cifra
significativa (4,328 ser 4,33). Para la edad hay otra forma de construir intervalos, la
informacin de que alguien tiene 18 a os puede corresponder a una edad real entre 18
aos,0mes,0da,0hora, hasta 18 aos,11meses, 29d as,23horas, por lo que si se indica un intervalo
de 10-19 aos sus limites reales sern 10aos,0 mes,0da,0hora y 19 aos,11meses, 29das.
La cantidad de intervalos como regla general no debe ser menor de l0 ni mayor de 20. Se toman
los datos en bruto, se los ordena y luego se agrupan observando cuantas observaciones
corresponden a cada intervalo Para ello se construye una tabla, la de distribuci n de frecuencias
Distribuci n de frecuencias:
Si tenemos datos agrupados a cada valor de la variable la llamamos clase, y la distancia entre sus
lmites, intervalo de clase. El tama o del intervalo de clase depende de la amplitud que abarcan
los valores de la variable y la cantidad de observaciones. Con pocos intervalos desperdiciamos
informacin, con muchos agregamos trabajo Conviene utilizar igual tamao de intervalos
El punto medio, cuando el m dulo es impar, es siempre un n mero entero, lo que facilita los
clculos. Para hallarlo se suma el lmite inferior y superior, y se divide por dos.
Por el agrupamiento se pierde informaci n, ya que una vez tabuladas las observaciones no se
puede saber exactamente en que valor dentro del intervalo cae cada observaci n, se supone que
es el punto medio. Esto es el error por agrupamiento que se compensa cuando el numero de
observaciones es grande y cuando el mdulo es pequeo.
Elementos para el an lisis de distribuciones de frecuencias
El objetivo es analizar la relaci n entre las categor as de la variable y las frecuencias
correspondientes. 1) Un an lisis consiste en relacionar cada frecuencia respecto al total de
observaciones. La forma mas elemental es establecer que proporci n del total de frecuencias es
la frecuencia de esa categor a, para ello se divide la frecuencia de la categor a por el total de
frecuencias, dando como resultado (p = f / N) la frecuencia relativa de la categor a cuya suma da
igual a 1.Tiene el inconveniente de que las cantidades que resultan son menores a la unidad, por
ello muchas veces se expresan en forma de porcentajes, que se obtiene multiplicando por 100 el
producto de las proporciones. Se llama frecuencia relativa fr=f / Nx100 2) Otro an lisis consiste
en encontrar la relacin entre frecuencias correspondientes a dos categor as. Para eso dividimos
las dos frecuencias razn entre frecuencias r=fi/fj. La razn puede ser mayor que 1.
Distribuciones de frecuencias acumuladas
En escalas de niveles ordinales de intervalos o razones, se puede establecer un nuevo an lisis que
consiste en determinar para cada categora, la cantidad de observaciones menores o mayores que
ella. A trav s de las operaciones de suma y resta relacionamos una categor a con la inferior o
superior. Dada una categora, la cantidad de observaciones que son menores o mayores que ella se
llama frecuencia acumulada ascendente o descendente. Su presentaci n se puede realizar de
modo tabular o grafico; en el ltimo caso la presentaci n se llama ojiva y la figura geom trica
correspondiente es un pol gono de frecuencias acumuladas que se utiliza para escalas de

intervalos o razones.
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

CAPITULO III: REDUCCI N DE LAS OBSERVACIONES Y MEDIDAS DE POSICI N


Reducir las observaciones significa presentar en lugar de toda la distribuci n, caracter sticas que
indiquen aspectos fundamentales de esa distribuci n de frecuencias. Existen 4 caracter sticas
que definen una distribuci n: tendencia central, dispersi n, asimetr a y curtosis. En escalas
nominales y ordinales solo se determina tendencia central. El poder de reducci n est relacionado
con el nivel de la escala utilizado.
Medidas de tendencia central
La experiencia indica que para las escalas ordinales, de intervalos y razones, las observaciones de
las distribuciones de frecuencia tienden a concentrarse alrededor de un sector de la variable.
Existen criterios para representar con un valor o categor a de la distribuci n esa tendencia de
las observaciones que se llama tendencia central (modo, mediana, media aritm tica, otras)
Modo
Se define como el valor o categor a de la variable que presenta la mayor frecuencia en la
distribucin. Se puede utilizar como medida de tendencia central de distribuciones cuyas
observaciones se han medido con cualquier nivel. Se encuentra r pidamente a trav s de una
simple inspecci n ocular de la distribuci n, pero en realidad no da la tendencia de todas las
observaciones, sino que indica que la categor a de mayor frecuencia es una determinada. Para
usarse como medida de tendencia debe presuponerse que la distribucin es conocida, se sepa que
relaci n guarda con el resto de la distribuci n o bien el resto tenga frecuencias que no sean
significativas respecto a la que tiene la mayor frecuencia. El modo para datos agrupados, no es
un valor exacto pues varia con las diferentes maneras de agrupar una distribuci n. Se pueden
presentar casos de distribuciones bimodales, con dos modos y hasta mas
Mediana
Es una medida de tendencia central de un conjunto de observaciones. Es la categor a o valor de la
distribucin que posee el orden medio cuando las observaciones se ordenaron seg n los valores o
categoras de las variables. Esto hace suponer que se utiliza en escalas ordinales, de intervalos o
razones. En los datos sin agrupar medidos con escala ordinal, si el numero de observaciones es
impar, se ordenan los datos de mayor a menor y la categor a que ocupa el orden medio es la
mediana. Si el n mero de observaciones es par, la mediana es la observaci n cuya categor a es
mayor de las dos observaciones. En datos agrupados ya ordenados, se determina el orden medio
de las observaciones que es la mitad del total de observaciones. Para datos agrupados en escala
intervalar, la mec nica del c lculo es igual a la de escalas ordinales con la diferencia que se
determina, dentro del intervalo la ubicacin exacta de la mediana
Media Aritmtica
Denominamos media de la distribucin a un valor X tal que si todas las observaciones tuvieran ese
valor, la suma total de ellas sera igual a la suma de las observaciones de la distribuci n original.
Si todas las observaciones estuvieran concentradas en un solo valor de la variable, el valor de la
media, mediana y modo coincidiran en ese valor. Pero si las observaciones se van distribuyendo en
forma simtrica, a la izquierda y derecha de ese valor central manteniendo la mayor parte de las
observaciones en el, media, mediana y modo siguen coincidiendo en ese valor. La media es m s
sensible a las asimetr as que la mediana y el modo, pero tiene el inconveniente que cuando las
asimetr as son muy grandes, no define tan bien la tendencia central como la mediana, siendo
preferible utilizar esta ltima. La media es una medida de resumen mas poderosa que las

anteriores ya que tiene en cuenta las distancias que existen entre las diversas observaciones.
Solo se puede utilizar en escalas de intervalos.
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

Los valores de tendencia central en las distribuciones asimtricas


Las distribuciones emp ricas son levemente asim tricas, y la media tiende siempre a situarse
hacia las observaciones ms extremas. Con frecuencia, la mediana suele estar a las 2/3 partes de
la distancia entre el valor del modo y de la media. Una distribucin asimtrica puede ser negativa
y positiva. Es positiva cuando la mayora de las observaciones est n a la izquierda de la proyecci n
de la media y es negativa cuando la mayor a de las observaciones est n a la derecha dc la
proyeccin de la media.
Reglas pr cticas para usar las medidas de tendencia central
sese la media cuando
1 Tenemos una escala de intervalos iguales o cocientes
2. Queremos mayor confiabilidad o queremos establecer inferencias de una muestra o
poblacin
3. Se desean obtener otras medidas en la distribuci n, desviaci n estandar, correlaciones etc.
sese la mediana cuando
1. Tenemos una escala ordinal, de intervalos iguales o de cocientes.
2. Cuando existen clases de intervalos abiertas
sese el modo
1. En escalas nominales (aunque tambin puede usarse en todas las otras)
2. Si deseamos tener una idea aproximada de donde est la mayor concentraci n de
observaciones
CAPITULO IV: REDUCCI N DE OBSERVACIONES Y MEDIDAS DE DISPERSI N
Amplitud total: Es la diferencia entre el valor mas alto y mas bajo de una serie, entre el imite
superior real y el lmite inferior real de una distribuci n de frecuencias. Es la medida mas simple
y se usa cuando solo queremos una comparacin rpida entre dos distribuciones. No informa nada
de sus formas. No es muy confiable sobre todo cuando se trabaja con pocos casos o cuando
existen intervalos de frecuencia nula, solo se basa en dos observaciones extremas; el resto no
interviene en su determinacin
Desviacin media: Es la media aritmtica de todas las desviaciones respecto de la media sin tener
en cuenta los signos (su valor absoluto) pues teni ndolo en cuenta la suma de los desv os da
siempre 0. La barra indica el valor absoluto
Desviacin standard: Es la raz cuadrada de la media de los cuadrados de los desv os respecto de
su media. Siempre es positiva. Se indica con una S. Es el ndice de variabilidad m s com n y de
mayor confianza, aquel que vara menos cuando se calcula para distintas muestras extra das de la
misma poblacin o universo. Es un valor simple, un ndice que representa las diferencias
individuales de las observaciones respecto a un punto de referencia com n, que es la media
aritmtica. Cuando este valor es m s chico las diferencias de los valores respecto a la media, o
sea, los desvos son menores, y por lo tanto el grupo de observaciones es m s homog neo que si el
valor de la desviacin standard fuera m s grande. A menor dispersi n mayor homogeneidad en el
conjunto y a mayor dispersin menor homogeneidad
Coeficiente de variacin: Sirve para comparar las dispersiones de dos o m s distribuciones cuyas
observaciones han sido medidas con escalas de razones nicamente. La idea de esta medida surge
de pensar que exista cierta tendencia en las distribuciones de manera que cuanto mayor sea su

medida mayor ser su desviacin standard

Lic. En Psicologa

UC.S.

ESTADSTICA

ELI AGUILAR
TEORA DEL MUESTREO
Cu l es la diferencia entre un estad stico y un par metro?

La Estadstica descriptiva describe valores que se hallan considerando todas las observaciones
del grupo definido que se llama poblaci n, para una determinada variable. Pero casi nunca se
puede medir a todos los integrantes de la poblacin, generalmente se extrae una muestra
representativa y calculamos en ella los valores que la describen. Cuando se puede trabajar con
toda la poblacin de observaciones, los valores descriptivos hallados se llaman par metros,
cuando se trabaja con muestra, los valores descriptivos hallados se llaman estad sticos. Los
estadsticos son estimadores de los parmetros.
Qu implica el supuesto de independencia dentro de una muestra aleatoria?
La muestra simple al azar cumple el requisito probabil stico de la independencia dando a cada
elemento de la poblacin, o a toda combinacin de ellos, igual probabilidad de ser elegidos para la
muestra. Esto ocurre siempre que la probabilidad de extraer un elemento sea independiente de la
probabilidad de extraer otro, o sea que si se trata de una poblaci n finita efectuemos el
reemplazo. Si no lo efectu ramos la probabilidad de cada extracci n sucesiva no ser a
independiente. La cantidad de unidades del universo puede ser finita o infinita. Cuando se realiza
muestra de un universo finito se trabaja con muestra sin reemplazo, en cambio cuando se trabaja
con reemplazo se trabaja con un universo infinito.
En qu casos no es tan importante efectuar el reemplazo en el muestreo al azar simple?
Ejemplo
No es tan importante hacer el reemplazo cuando la diferencia entre el n mero de elementos de la
poblaci n y el numero de elementos de la muestra es grande. Es m s importante hacer el
reemplazo en una poblaci n de 1000 elementos cuya muestra es 300 que en una poblaci n de
5000 cuya muestra es 400.
Se puede obtener una muestra representativa que no sea probabil stica? Porqu ?
No es posible obtener una muestra no probabil stica que sea representativa, pues si hablamos de
representatividad, esta debe interpretar fielmente a la poblaci n, y la muestra no probabil stica
suponen un procedimiento de seleccin informal y arbitrario, y como no puede calcularse el error
estandar no puede generalizarse a la poblacin, solo se usa como una primera aproximaci n y en
trabajos de tipo piloto
En qu teor a se basa el muestreo? Porqu ?
El muestreo se basa en la Teor a de las Muestras, ya que su objeto es obtener, por camino
inferencial, conclusiones validas para la poblaci n, partiendo de la observaci n de una parte,
denominada muestra. Al decir inferencial nos referimos a que a partir de los valores hallados en
las muestras inferimos los valores m s probables para las poblaciones de las cuales provienen
dichas muestras.
Para qu se muestrea?
Se recurre a una muestra cuando no se cuenta con recursos econ micos, humanos, etc. A veces la
muestra es el nico recurso. El trabajo sobre una muestra se llama muestreo y las conclusiones
obtenidas a partir ellas permiten: A) Probar hip tesis validas para la poblaci n, con la
informacin de la muestra B) Estimar caractersticas de la poblacin, denominadas par metros, a

partir de los estadsticos

Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

Qu es el error de muestreo o error muestral?


Los resultados que se obtienen cuando se calcula algo a partir de la muestra son diferentes a los
obtenidos si se trabaja con el 100 % de los involucrados. La diferencia es el error de muestreo,
siempre que los datos se renan empleando mtodos idnticos. Para calcularlo se debe conocer la
poblacin
Mencione y explique otros tipos de errores que pueden cometerse al muestrear.
Errores de informaci n y procesamiento: Los datos b sicos pueden ser mal proporcionados,
acentados, copiados, codificados, u omitidos. Alguien podr llegar a dar distintas cifras para el
mismo tem (edad).
Errores por falta de respuestas: Son los que se dan por utilizar datos provistos solo por algunas
personas que responden a un cuestionario. No se puede suponer que los ausentes o quienes no
responden tienen la misma caracterstica y en el mismo grados que los que contestan y est n.
Error en la seleccin de las muestras: Se dan cuando la seleccin de las unidades de la muestra es
incorrecta y anticient fica. Entra en esta categor a las muestras parciales (elegidas por razones
de conveniencia), las muestras dirigidas y la muestra por cuotas
Qu son las unidades primarias de muestreo y qu son las unidades elementales de
muestreo?
No es frecuente hacer muestreo de grupos completo. Se suele seleccionar el universo en dos o
ms etapas. En una muestra de dos etapas, los grupos se seleccionan al azar, luego se toma una
submuestra al azar en cada grupo. Los primeros son las unidades primarias de muestreo y las
submuestras, unidades elementales
Qu es el esquema y con qu otro nombre lo denominan los autores?
Para poder seleccionar una muestra debemos tener el universo al alcance de la mano; a veces
esto es sencillo, otras no. Lo m s conveniente es contar con un conjunto de informaci n escrita
que permita individualizar el universo, individuo por individuo, y as elegirlos segn un mtodo. La
informaci n escrita se denomina esquema o marco de referencia y puede presentarse como
listado, mapa, registro.
Mencione y explique brevemente los pasos del muestreo, seg n Slonim
1) Determinar con toda la precisin posible la poblacin o universo que se ha de estudiar.
2) Determinar el marco de referencia de la muestra reuniendo en una lista todas las unidades del
universo.
3) Definir con exactitud y claridad los datos que se pretenden obtener en el estudio. Si no se
especifica esto, puede que los cuestionarios arrojen resultados distintos de los que en realidad se
espera. Y antes de avanzar conviene averiguar si los datos que se buscan no fueron ya obtenidos
por otro y cerciorarse de que los datos que se enumeran sean absolutamente necesarios para dar
cumplimiento a los fines del estudio.
4) Especificar el grado de precisin que desean obtener los usuarios de los datos de la muestra
5) Investigar la eficiencia relativa de distintos tipos de muestra seg n el grado de precisi n
especificado. (costo, eficiencia, factor tiempo y administrativo)
6) En caso que en el estudio se emplee cuestionario o formulario conviene pensarlos de antemano

para que se obtengan respuestas correctas para las preguntas que se formulan.
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

7) Aplicar un ensayo preliminar con los formularios, cuestionarios e instrucciones, procedimiento


barato e indispensable. Los formularios e instrucciones finales mejoran como consecuencia del
ensayo.
8) Explicar con la mayor sencillez posible los lmites de los resultados de la muestra al
presentarlos
De qu factores depende la magnitud de una muestra?
La magnitud de la muestra depende del grado de precisi n que se requiera, de la variabilidad
entre los datos que se muestrean (heterogeneidad), del m todo de muestreo que se utilice y del
procedimiento de estimacin que se use. Se examina cada mtodo de muestreo
administrativamente factibles, y se selecciona el que proporcionase el grado deseado de precisi n
a menor costo. Esto podr a entra ar la selecci n de un m todo que requiere una muestra m s
grande que otra, pero con un costo mas bajo.
Para qu se utiliza el muestreo no probabil stico?
Las muestras no probabil sticas no tienen car cter cient fico, pero pueden ser de ayuda en
estudios de naturaleza preliminar, frecuentes en sociologa y psicologa o cuando no se cuenta con
el listado del universo. Los muestreos no probabil sticos mas usados son muestreo por cuotas y
muestra autogenerada..
Cu l es la diferencia entre precisi n y exactitud en el c lculo?
En la profesin estadstica se acostumbra aludir a la precisi n y no a la exactitud de los c lculos
basados en muestras. La exactitud de un calculo es el grado en que este se aproxima a la cifra
real, mientras que la precisi n, refleja el grado en que se aproxima la cifra que se obtendr a con
un anlisis del 100 por ciento, si se empleasen mtodos idnticos de recoleccin de datos.
Cu les son los elementos que especifican el grado de precisi n que se desea de una
estimacin?
La especificacin del grado de precisin consta de dos elementos: un lmite de error que se llama
grado de tolerancia y un lmite de riesgo que se llama grado de confianza que es el porcentaje de
seguridad que existe para generalizar los resultados obtenidos, un porcentaje del 100% equivale
a decir que no existe ninguna duda para generalizar tales resultados, esto implica estudiar toda la
poblacin.
C mo se puede cometer un bias en la utilizaci n del marco de referencia dentro del
muestreo?
Se comete un bias cuando el marco de referencia de las unidades de muestreo no comprendi a
todas las unidades de la poblacin Esto sucede en el estudio real, cuando las diferencias entre los
datos del marco de referencia y los datos del universo no son desde ables, all hay un bias (error
sistemtico) en los resultados de la muestra.
Cules son las limitaciones del muestreo, seg n Slonim? Explique.
Las limitaciones del muestreo es que no siempre es til, por ejemplo si se requiere conocimiento
acerca de cada unidad del universo estad stico o cuando la poblaci n presenta un alt simo grado
de variabilidad (muy heterognea)
Cules son las ventajas y desventajas del muestreo por conglomerados?

El objeto del m todo por conglomerados consiste en dividir la poblaci n en sectores llamados
conglomerados, cuya caracter stica fundamental es que las entidades sean lo mas heterog neas
Lic. En Psicologa

UC.S.

ELI AGUILAR

ESTADSTICA

entre si dentro de cada conglomerado y que lo mas homogneos posibles entre conglomerados. La
ventaja es que las entrevistas se realizan en distancias cortas, es mas econ mica en tiempo,
dinero y recursos humanos. La desventaja es que en general, el error de muestra por
conglomerado es mayor que en el mtodo al azar simple, es mayor cuanto mas grande es el tama o
del conglomerado. Se pueden observar dos errores principales: tama o del conglomerado y la
heterogeneidad dentro de el.
Cmo debe ser la homogeneidad y heterogeneidad en muestreos estratificados y por
conglomerados?
En los muestreos por conglomerado los resultados mas precisos se obtienen cuando dentro de
cada grupo hay una mezcla lo mas variada posible y cuando cada grupo es lo mas similar posible a
los dem s. Para una muestra estratificada eficaz los estratos deben ser lo mas homog neos
posibles, y lo mas distinto (heterogneo) que se pueda entre s
Elabore un ejemplo para cada uno de los cuatro tipos de muestreo probabil sticos:
A. Muestreo al Azar Simple: Si en un curso de 50 alumnos, necesitamos elegir 2 personas para
que sean las representantes frente a las autoridades; podr amos poner en una bolsa 50 papelitos
de igual tamao, y doblarlos de la misma manera escribiendo en ellos los nombres de cada alumno.
Una persona que no este dentro de las 50, elegir dos papeles al azar. Estas personas tendr n la
misma posibilidad de ser elegidas. Una vez elegida la persona N 1 se la debe volver a introducir
en la caja o bolsita, es decir se debe realizar el reemplazo para que haya independencia entre
un papelito (elemento) y otro.
B) Muestreo Sistemtico: Si se desea muestrear Cu ntas personas de primer a o de psicolog a
(considerando que existen 3 comisiones de 100 alumnos cada una), tienen el libro de
neuropsicologa?
Podramos tomar una muestra de 60 personas; en este caso deber amos fijar el intervalo, que se
saca, dividiendo la cantidad total de elementos que componen el listado por la cantidad de
elementos que componen la muestra; entonces aqu deber amos hacer 300 (cantidad total)
dividido 60 (muestra), que dara un total de 5, as se debe tomar un elemento cada 5 personas. En
este caso al primer individuo se lo elige por el m todo del muestreo al azar simple; es decir se
saca un numero del 1 al 5(limite superior del primer intervalo) supongamos que sea 3, el pr ximo
numero elegido ser 8 y as sucesivamente.
C) Muestreo Estratificado al Azar: Si queremos saber el porcentaje de materias aprobadas en
alumnos de la carrera de Psicolog a, este procentaje est en estrecha relaci n, en la mayor a de
los casos con el ao que se encuentra cursando cada alumno. Por eso deber a hacerse un muestreo
estratificado, tomando, alumnos de 1 a o de la carrera, alumnos de 2 a o de la carrera, y as
sucesivamente. Luego puede obtenerse una submuestra por azar simple
D) Muestreo por Conglomerados al Azar: Este lo podr amos utilizar supongamos si nosotros
queremos saber Cuntas personas de entre 3 y 8 a os y cuantas de entre 40 y 65 a o
viven en cada casa del el barrio el Tribuno? Aqu deber amos dividir la poblaci n (todo el barrio
el Tribuno) en conglomerados por ejemplo cada manzana del barrio. As se elegir una muestra de
conglomerados y se observan todas las entidades dentro de cada uno de ellos. Para que esto
suceda las entidades dentro de los conglomerados deben ser lo mas heterog neas posible y los
conglomerados lo mas homogneos posible.

Lic. En Psicologa

UC.S.

10

ESTADSTICA

ELI AGUILAR
ESTAD STICA INFERENCIAL
CAP TULO I - INTRODUCCI N

Un tema central de la estadstica es la Inferencia Estad stica. Esta se interesa en: la estimaci n de
los parmetros de la poblacin y las pruebas de hiptesis. Le interesa sacar conclusiones de un gran
nmero de hechos basndose en las observaciones de una parte. Los procedimientos de la inferencia
estadstica introducen orden en una inferencia a partir del testimonio muestral. Hay condiciones en
que los testimonios deben reunirse y las pruebas estadsticas determinan cun grandes deben ser las
diferencias observadas antes de confiar que representarn diferencias reales en el grupo mayor.
Los procedimientos de la inferencia estadstica permiten determinar, en trminos de probabilidad, si
la diferencia entre dos muestras est dentro del rango en el que podra aparecer fcilmente por azar,
o si es tan grande que indica que las muestras son, probablemente, de dos poblaciones diferentes.
Otro problema es determinar la probabilidad de que una muestra de puntajes sea de una poblaci n
especfica y otro el de decidir si podemos inferir legtimamente que varios grupos difieren entre s.
Ya que los valores de poblacin son parmetros, estas t cnicas estad sticas se llaman param tricas.
Estas tcnicas conducen a conclusiones con limitaciones, Si las suposiciones respecto a la forma de la
poblacin son vlidas, entonces podemos concluir que.... Tambin se desarrollaron tcnicas de
inferencia que no hacen suposiciones numerosas ni severas acerca de los par metros. Estas nuevas
distribuciones libres o tcnicas no paramtricas permiten sacar conclusiones con menos reservas. A
Algunas pruebas no paramtricas se las llama pruebas de rango o pruebas de orden
Las tcnicas paramtricas solo se usan con puntajes realmente num ricos, las no param tricas se
fijan en el orden o rango de puntajes, no en sus valores numricos, otras se pueden utilizar con datos
que ni siquiera presentan orden. Mientras una prueba paramtrica pondr su atencin en la diferencia
entre las medias de dos conjuntos de puntajes, la no paramtrica se fijar en la diferencia entre las
medianas. Calcular la media requiere operaciones aritmticas, calcular la mediana solo exige contar
CAP TULO II USO DE LAS PRUEBAS ESTAD STICAS EN LA INVESTIGACI N
Para decidir con objetividad si una hiptesis es confirmada por un conjunto de datos, se precisa un
procedimiento que lleve a un criterio objetivo para rechazar o aceptar esa hiptesis. El procedimiento
objetivo debe basarse en la informacin obtenida al investigar y en el margen de riesgo que estemos
dispuestos a aceptar si el criterio de decisin respecto a la hiptesis resulta incorrecto. Pasos:
1) Formulacin de la hiptesis de nulidad (Ho)
2) Eleccin de una prueba estadstica para probar Ho. De las pruebas que pueden usarse en un diseo
dado hay que escoger aquella cuyo modelo se aproxima mas a las condiciones de la investigaci n y
cuyos requisitos de medicin satisfacen las medidas usadas en la investigacin
3) Especificacin del nivel de significacin y del tamao de la muestra N
4) Encuentro (o suposicin) de la distribucin muestral de la prueba estadstica conforme a Ho
5) Definicin de la regin de rechazo
6) Clculo del valor de la prueba estadstica con los datos de la muestra. Si el valor desciende a la
zona de rechazo, se rechaza Ho, si el valor cae fuera de la regin de rechazo Ho no puede rechazarse
1) Hiptesis de nulidad: La Hiptesis nula es una hiptesis de diferencias nulas. Es formulada con la
intencin de ser rechazada. Si se rechaza puede as aceptarse la hip tesis alterna Ho. La hip tesis
alterna es la aseveracin operacional de la hiptesis de investigacin. La hiptesis de investigacin es
la prediccin que deriva de la teora a probar. La naturaleza de la hiptesis de investigacin determina
como debe ser formulada Ho. Si la hiptesis de investigacin solo dice que los dos grupos difieren

respecto a las medias, entonces Ho ser 1 2. Pero si la teora predice la direccin de la diferencia,
que un grupo especfico tiene una media mayor que el otro, entonces Ho puede ser 1>2 o que 1<2
Lic. En Psicologa

UC.S.

11

ELI AGUILAR

ESTADSTICA

2) Eleccin de la prueba estadstica: La estadstica cuenta con pruebas estadsticas susceptibles de


usarse alternativamente para tomar decisiones acerca de las hiptesis.
3) Nivel de Significaci n y Tama o de la Muestra : Antes de recoger los datos, se especifica el
conjunto de todas las posibles muestras que se encuentran si Ho es verdadera. De este conjunto se
extrae un subconjunto de caractersticas tan extremas que reducen mucho la probabilidad, si Ho es
verdadera, de que la muestra que se observa est entre ellas. Por tanto, si en la investigaci n se
observa una muestra incluida en ese subconjunto, se rechaza Ho. El procedimiento es rechazar Ho
para aceptar H1 si una prueba estadstica produce un valor cuya probabilidad de ocurrencia bajo Ho
es igual o menor que una peque a probabilidad . Esta peque a probabilidad se llama Nivel de
significacin. As, si la probabilidad asociada con lo que ocurre en Ho del valor particular producido
por una prueba estadstica es igual o menor que , rechazamos Ho y aceptamos Ho.
Como el valor de juega un papel crucial al determinar el rechazo de Ho o su aceptaci n, la
objetividad exige que el valor de se indique antes de recoger los datos. El nivel que se elige para
debe determinarse por la estimacin que se haga de la incidencia de los descubrimientos.
Dos tipos de errores pueden cometerse acerca de Ho. 1) Error tipo I: rechazar Ho siendo verdadera.
2) Error tipo II: aceptar Ho siendo falsa. La probabilidad de cometer el error tipo I est dada por .
Cuanto mayor sea , mas probable es que Ho sea rechazada equivocadamente, mas probable que se
cometa error tipo I. El error tipo II se representa con . y indican tipo de error y probabilidad
de cometerlo. En condiciones ideales y determinan que tamao de muestra N escoger para
calcular la prueba estad stica que se haya elegido. Pero en la pr ctica es com n que y N se
especifiquen por adelantado. Una vez que y N se especificaron queda determinada . Como hay una
relacin inversa entre las probabilidades de cometer ambos tipos de errores, al decrecer se
incrementa para cualquier N. Si se desea reducir la posibilidad de ambos errores, se debe
incrementar N.
Potencia de una prueba: Probabilidad de rechazar Ho cuando es realmente falsa. P=1pr. error tipoII
P=1- . Las probabilidades de cometer un error tipo II () disminuye a medida que el tamao de la
muestra N se incrementa, de modo que la potencia aumenta al crecer el tamao de N
Conclusiones:
a) El nivel de significacin comprende la probabilidad de obtener en una prueba estadstica un valor
que implica el rechazo de Ho, siendo verdadera. indica la probabilidad de cometer error tipo I
b) La probabilidad de que una prueba estadstica produzca un valor conforme al cual Ho ser aceptada
cuando en realidad es falsa, es . seala la probabilidad de cometer error tipo II
c) La potencia de una prueba, 1 - , mide la probabilidad de rechazar acertadamente Ho
d) La potencia est relacionada con la naturaleza de la prueba estadstica elegida
e) La potencia de una prueba estadstica se incrementa al aumentar N
4) Distribuci n Muestral: La distribucin muestral es una distribucin terica. la obtendr amos al
tomar al azar todas las muestras posibles de un mismo tamao, extradas de una misma poblacin, es
la distribucin, conforme a Ho, de todos los valores posibles que una estad stica (como la media)
puede tomar cuando es calculada con muestras de igual tamao tomadas al azar.
5) Regin de Rechazo: Es una regin de la distribucin muestral, incluye todos los valores posibles
que una prueba estadstica puede tomar segn Ho. Es un subconjunto de estos valores de manera que
la probabilidad de ocurrencia de una prueba estadstica segn Ho, cuyo valor est en ese subconjunto
sea . Es un conjunto de valores posibles tan extremos que cuando Ho es verdadera, es muy pequea
la probabilidad de que la muestra observada produzca un valor que est entre ellos. La probabilidad

asociada con cualquier valor de la regin de rechazo es igual o menor que .


Lic. En Psicologa

UC.S.

12

ESTADSTICA

ELI AGUILAR

La localizacin de la regin de rechazo es efectada por la naturaleza de Ho. Si Ho indica la direccin


predicha de la diferencia se requiere una prueba de una cola. Si Ho no indica la direcci n de la
diferencia se requiere una prueba de dos colas. Las pruebas de una y dos colas se distinguen en la
localizacin, no en el tamao, de la zona de rechazo. En una de dos colas, la regin de rechazo est en
ambos extremos de la distribucin muestral. En una de una cola est en un extremo. El tamao de la
zona de rechazo se expresa por que es el nivel de significacin. Si = 0.05 entonces el tamao de la
regin de rechazo es el 5 % del rea total comprendida bajo la curva de la distribucin normal.
6) La decisin: Si la prueba estadstica da un valor que est en la regin de rechazo se rechaza Ho. El
razonamiento en que se apoya este proceso es simple. Si es muy pequea la probabilidad asociada con
la ocurrencia conforme a Ho de un valor particular en la distribucin muestral, podemos explicar la
ocurrencia efectiva de ese valor de dos maneras: suponiendo que la Ho es falsa o que un evento raro e
improbable sucedi. Se elige el primer razonamiento, aunque a veces el segundo puede ser correcto.
La probabilidad de que la segunda opcin sea correcta est dada por pues el rechazo de Ho cuando
es verdadera es error tipo I. Cuando la probabilidad asociada con un valor observado de una prueba
estadstica es menor o igual que el valor previamente determinado de , concluimos que Ho es falsa.
El valor observado es llamado significativo. La hiptesis en prueba, Ho, se rechaza siempre que
ocurra un resultado significativo. por tanto, se llama valor significativo a aquel cuya probabilidad
asociada de ocurrencia de acuerdo a Ho es menor o igual que
CAPTULO III ELECCI N DE LA PRUEBA ESTAD STICA ADECUADA
Cuando se disponen de varias pruebas estad sticas para un dise o de investigaci n dado, se debe
emplear un criterio de eleccin, ya se vio el de potencia, ahora se vern otros. Una prueba estadstica
es buena si es pequea la probabilidad de rechazar Ho siendo verdadera y grande la probabilidad de
rechazar Ho siendo falsa. Pero otras consideraciones adems de la potencia determinan la eleccin de
la prueba estadstica. En la eleccin debemos considerar la manera en que la muestra de puntajes fue
obtenida, la naturaleza de la poblacin de la que se sac la muestra y la clase de medicin o escala que
se emple en las definiciones operacionales de las variables usadas, es decir, los puntajes.
El Modelo Estadstico
Al haber afirmado la naturaleza de la poblaci n y el m todo de muestreo, hemos establecido un
modelo estadstico. Cualquier prueba estad stica implica un modelo y un requisito de medida. Las
condiciones del modelo estadstico de un a prueba se llaman suposiciones de la prueba. A menores o
mas dbiles suposiciones habr conclusiones generales. Pero las pruebas mas poderosas son las
apoyadas por suposiciones mas fuertes y amplias.
Potencia Eficiencia
A menores o mas dbiles suposiciones de un modelo particular, mas generales son las conclusiones
derivadas al aplicar la prueba estadstica asociada con l, pero menos poderosa es la prueba de Ho.
Esta afirmacin es generalmente verdadera para cualquier tamao de muestra, pero no se sostiene al
comparar dos pruebas estadsticas que se aplican a dos muestras de tamao desigual.
El concepto de Potencia Eficiencia se refiere al incremento en el tama o de la muestra necesario
para hacer la prueba B tan poderosa como la A. Al ser la prueba A, la mas poderosa de su tipo (cuando
se usa con datos que satisfacen sus condiciones) al ser la prueba B, que se presta al mismo diseo de
investigacin, tan poderosa con Nb casos como la pruena A con Na casos, tenemos que: PotenciaEficiencia de la prueba B = (100) Na/Nb %

Lic. En Psicologa

UC.S.

13

ELI AGUILAR

ESTADSTICA

Medicin
La medicin es la asignacin de nmeros a observaciones, de modo que los nmeros sean susceptibles
de anlisis por medio de manipulaciones u operaciones de acuerdo con ciertas reglas. La relacin entre
los objetos que se estn observando y los nmeros es tan directa que mediante la manipulacin se los
nmeros se obtiene nueva informacin acerca de los objetos. El cient fico social que toma la f sica
como modelo, para hacer operaciones con los nmeros asignados a las observaciones, no debe pasar
por alto la estructura del m todo de correspondencia de los n meros a las observaciones sea
isomrfica con respecto a alguna estructura numrica que incluya estas operaciones. La teora de la
medicin est formada por un conjunto de teoras, cada una referida a un nivel diferente de medicin.
Las operaciones permitidas con un conjunto de puntajes dado dependen del nivel de medida que se
logre. Cuatro niveles de medida son: nominal, ordinal, de intervalo y de proporcin. Cada nivel tiene
estadsticos y pruebas permitidas.
Escala Nominal: La medicin se da en un nivel elemental cuando los nmeros o smbolos se usan para la
clasificacin de objetos, personas o caractersticas. Cuando se usan con el fin de distinguir entre s
los grupos a que pertenecen varios objetos, los nmeros o smbolos constituyen una escala nominal. Ej:
las tipologas esquizofrnico, paranoico, manaco-depresivo, psiconeurtico.
Propiedades formales: En estas escalas la operacin de escalamiento consiste en partir de una clase
dada y formar un conjunto de subclases que se excluyen mutuamente. La nica relacin implicada es
de equivalencia, los miembros de cualquier subclase deben ser equivalentes en la propiedad medida. La
relacin de equivalencia es reflexiva, simtrica y transitiva.
Operaciones admisibles: Como en toda escala nominal la clasificaci n se representa por cualquier
conjunto de smbolos, es nica hasta una transformacin de uno a uno. Los signos que designan a los
diferentes grupos pueden intercambiarse sin alterar la informacin de la escala, por eso las nicas
estadsticas descriptivas posibles son las que no se alteran en este proceso: modo, frecuencia, conteo.
En ciertas condiciones podemos probar las hiptesis usando la prueba no paramtrica X, o la basada
en la frmula binomial, apropiadas para datos nominales. La medida de asociaci n mas com n es el
coeficiente de contingencia C, una estadstica no paramtrica.
Escala ordinal: Puede que los objetos de una categora de la escala no sean precisamente diferentes a
los de otra categora, sino que estn relacionados entre s. Relaciones tpicas entre clases son las que
comparan altura, dificultad, madurez. Tales relaciones pueden formularse con el signo >, que puede
usarse como mayor que, mas preferible, mas dificil.
En un grupo de clases equivalentes (escala nominal), si la relacin > se sostiene entre algunos pares de
clases, tenemos una escala parcialmente ordenada. Si la relacin > se sostiene en todos los pares de
clases que modo que surja un rango ordenado completo, tenemos una escala ordinal. Muchos
inventarios de personalidad o habilidades arrojan puntajes que tienen fuerza de rangos
Propiedades Formales: La diferencia entre escala nominal y ordinal es que esta incorpora no solo la
relacin de Equivalencia sino tambin la relacin mayor que. Es irreflexiva, asimtrica, transitiva.
Operaciones admisibles: Como cualquier cambio que conserve el orden no altera informaci n de una
escala ordinal, esta es nica hasta una transformacin monot nica, o sea, no importa que n meros
demos a una pareja de clases siempre que el mayor sea dado a los miembros de la clase mayor.
La estadstica mas apropiada para describir la tendencia central de los puntajes en una escala ordinal
es la mediana porque no es afectada por los cambios de puntaje por encima o por debajo de ella,
siempre y cuando el nmero de ambos puntajes sea el mismo. Con esta escala, las hip tesis pueden

probarse por numerosas pruebas estadsticas no paramtricas llamadas estadsticas de orden o de


rango. Los coeficientes de correlacin basados en rangos, de Spearman o Kendall son adecuados.
Lic. En Psicologa

UC.S.

14

ELI AGUILAR

ESTADSTICA

El nico supuesto necesario para algunas pruebas de rango es que los puntajes tengan como base una
distribucin continua. Las pruebas paramtricas tambin funcionan con este supuesto. Una variable
continua puede tomar cualquier valor del intervalo. Una discreta toma un nmero finito de valores.
Para algunas tcnicas no paramtricas que requieren medicin ordinal, debe haber un continuo como
base de los puntajes observados. Los puntajes reales pueden caer en categoras discretas. La rudeza
de los instrumentos de medida suele representar pobremente la continuidad base que puede existir.
Si una variable est verdaderamente distribuida en forma continua la probabilidad de que tener
puntajes iguales es cero. Si ocurren, estos reflejan la falta de sensibilidad de los instrumentos de
medida
Las pruebas estadsticas paramtricas, que usan media y desviaciones estandar no deben usarse con
datos de escala ordinal. Las propiedades de esta escala no son isom rficas al sistema aritm tico.
Cuando solo se conoce orden de puntajes, las medias y desviaciones estandar dan lugar a errores, en
la medida en que los intervalos sucesivos de la escala no son iguales. Cuando se emplean t cnicas
paramtricas de inferencia estadstica con esos datos, las decisiones de las hip tesis son dudosas.
Las declaraciones de probabilidad derivadas de la aplicacin de pruebas paramtricas a datos
ordinales son errneas si la estructura del mtodo de recoger datos no es isom rfico respecto a la
aritmtica.
Escala de intervalo: Cuando una escala tiene caractersticas de una escala ordinal y adems conocemos
la distancia entre dos nmeros cualesquiera tenemos una consideracin mas fuerte que la ordinal. La
medicin se ejecut en el sentido de una escala de intervalo. Si la asignacin de n meros a varias
clases de objetos es tan precisa que sabemos la magnitud de los intervalos (distancias) entre todos
los objetos de la escala, tenemos una medida de intervalo.
Una escala de intervalo se caracteriza por una unidad de medida comn y constante que asigna un
nmero real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la
proporcin de dos intervalos es independiente de la unidad de medida y del punto cero. En una escala
de intervalo, el punto cero y la unidad de medida son arbitrarios.
Una suposicin necesaria de los cientficos de la conducta es que la variable que se est sujetando a
escala se distribuye normalmente. As quien elabora la escala manipula sus unidades hasta que obtiene
la supuesta distribucin normal a partir de puntajes individuales. Otra suposicin es que la respuesta
si de una persona a un inciso es equivalente a su respuesta afirmativa en cualquier otro inciso.
Propiedades formales: Las operaciones y relaciones en que se origina la estructura de una escala
intervalar son tales que las diferencias en la escala son isomrficas a la estructura de la aritm tica.
Los nmeros pueden asociarse con las posiciones de los objetos en una escala intervalar de tal modo
que las operaciones aritmticas puedan realizarse significativamente con las diferencias entre esos
nmeros. Al construir una escala intervalar no solo se especifican equivalencias como en la escala
nominal, y relaciones de mayor a menor como en la ordinal, sino tambi n la proporci n de dos
intervalos cualesquiera.
Operaciones admisibles: Cualquier cambio de los nmeros aosciados con los objetos medidos en escala
intervalar debe preservar no solo el orden sino tambin las diferencias relativas entre ellos, o sea, la
escala intervalar es nica hasta una transformacin lineal. La escala intervalar es laprimera
verdaderamente cuantitativa. Todas las estadsticas paramtricas comunes (media, desviaciones
estandar, correlaciones de Pearson) se aplican a datos en escala intervalar, como las pruebas
estadsticas param tricas comunes (t, F). Si la medici n en el sentido de la escala intervalar se
ejecut en realidad y si todos los supuestos en elmodelo estadstico se cumplen, el investigador debe

utilizar pruebas estadsticas paramtricas. Los mtodos no paramtricos no suelen sacar provecho de
toda la informacin contendida en los datos de la investigacin
Lic. En Psicologa

UC.S.

15

ELI AGUILAR

ESTADSTICA

Escala de Proporcin: Cuando una escala tiene las caractersticas de una escala intervalar y adems
tiene un punto cero real en su origen se llama escala de proporcin. En ella la proporcin de un punto a
otro de la escala es independiente de la unidad de medida
Propiedades Formales: Las operaciones y relaciones en una escala de proporcin son correspondientes
a una escala isomrfica a la estructura aritmtica. Por eso las operaciones aritmticas son permisibles
en valores numricos asignados a los objetos mismos, como tambi n en los intervalos entre los
nmeros. Las escalas de proporcin mas frecuenten en las ciencias f sicas se logran cuando cuatro
relaciones son operacionalmente posibles: equivalencia, mayor a menor, proporcin conocida de dos
intervalos, proporcin conocida de dos valores.
Operaciones admisibles: Los nmeros asociados con valores de una escala de proporcin son
verdaderos nmeros con un verdadero cero, solo la unidad de medida es arbitraria. As, la escala de
proporcin es nica hasta la multiplicacin por una constante positiva, o sea, las proporciones entre
dos nmeros cualesquiera son preservadas cuando los valores de la escala son multiplicados por una
constante positiva y la transformacin no altera la informacin de la escala. Cualquier prueba
estadstica puede usarse cuando se logr medida de proporcin. Adems de las pruebas anteriores
apropiadas para escala intervalar pueden usarse estadsticas como la media geomtrica y el
coeficiente de variacin, que requieren del verdadero punto cero.

Criterios para elegir una prueba:


1) potencia de la prueba 2) aplicabilidad del modelo estadstico en que se basan los datos 3)potencia
eficiencia 4) nivel de medida logrado en la investigacin.
Ventajas de pruebas Estadsticas no paramtricas:
1) Las declaraciones de probabilidad obtenidas son probabilidades exactas (en muestras grandes
son excelentes aproximaciones) independientemente de la forma de la distribuci n de la
poblacin
2) Si los tama os de las muestras con peque os como N=6 no hay alternativa de elecci n de
prueba no paramtrica a menos que se conozca exactamente la naturaleza de la distribuci n
3) Hay pruebas estadsticas no paramtricas adecuadas para observaciones en poblaciones
diferentes.
4) Son tiles tanto para datos inherentes a los rangos como datos cuyos puntajes aparentemente
numrico tienen fuerza de rangos, o sea si el investigador solo puede decir de sus sujetos que uno
comparte en mayor o menor grado cierta caracter stica de otro, sin especificar cantidad.
5) Son tiles para datos solo clasificatorios, en escala nominal. No hay t cnica param trica para
ellos.
6) Son mucho mas fciles de aplicar que las pruebas paramtricas
Desventajas de pruebas Estadsticas No Paramtricas
1) Si los supuestos del modelo estadstico paramtrico son satisfechos y con la fuerza requerida, las
pruebas no paramtricas disipan los datos. El grado de desperdicio se expresa por la potenciaeficiencia
2) No existen an mtodos No paramtricos para probar interacciones dentro del modelo del anlisis

de varianza a menos que se hagan suposiciones especiales acerca de la aditividad.

Lic. En Psicologa

UC.S.

16

ESTADSTICA

ELI AGUILAR
Estad stica Param trica

Estad stica No Param trica

Pruebas estadsticas paramtricas son


Pruebas estadsticas no paramtricas son
aquellas cuyo modelo especifica condiciones
aquellas cuyo modelo no especifica condiciones a
de los parmetros de la poblacin de la que se parmetros de la poblacin. Algunas suposiciones
obtuvo la muestra.
seran: observaciones independientes y variable
de continuidad bsica, pero son pocas
La significacin de los resultados de estas
suposiciones y mas dbiles que las asociadas con
pruebas dependen de estas suposiciones.
pruebas paramtricas. Estas pruebas no
Estas pruebas requieren que los puntajes
requieren mediciones tan fuertes, la mayora se
surjan de una medicin con fuerza de escala
aplican a datos de escala ordinal y algunas a los
intervalar.
de escala nominal
Las pruebas de la estadstica paramtrica
estn en todos los libros

Las pruebas de la estadstica no paramtrica


estn dispersas en mas libros

Trabajan bien con escalas intervalares

Trabajan bien con escalas nominales y ordinales.


Se usa en estas escalas sin perder informacin

Trabajan con variables verdaderamente


cuantificables

No necesariamente deben trabajar con variables


verdaderamente cuantificables

Son vlidas para Distribuciones Normales

No necesitan garantizar que la Distribucin sea


Normal

Es mas eficaz cuando se cumplen las


suposiciones y se miden las variables al menos
en escala intervalar

An cuando se satisfagan suposiciones de la


prueba paramtrica, requerimientos de fuerza y
medicin, la potenciaeficiencia indica que al
aumentar el tamao de la muestra podemos usar
una prueba no paramtrica sin perder potencia
para rechazar Ho.

Si las suposiciones de la poblacin son


correctas o aproximadas tendrn una muy
buena prueba. Para ser confiables los datos
cumplen muchas caractersticas. Si los datos
no son certeros la inferencia es errada
Se establecen diversas suposiciones respecto
de la naturaleza de la poblacin
Difciles de entender
Pueden utilizarse fcilmente en experimentos
complejos con gran nmero de variables
Es significativa con No o con la poblacin

Si las suposiciones de la poblacin son falsas,


una prueba no paramtrica puede dar un
resultado mas preciso, o sea si lo que suponen es
errado, igual son confiables pues no necesitan
todas las condiciones
Se hacen pocas suposiciones acerca de la
naturaleza de la distribucin por eso son
ampliamente aplicables
Fciles de entender. Exigen conocimientos
matemticos bsicos
No se pueden aplicar en experimentos complejos
en los que se maneje gran nmero de variables
Trabaja nicamente con N

Perfecta Eficiencia, siempre en trminos de No son perfectas, sino probables, no tienen 100
precisin. Tienen el 100 % de eficacia certeza % de eficacia sino de probabilidad.

Lic. En Psicologa

UC.S.

17

ESTADSTICA

ELI AGUILAR

CAPITULO IV EL CASO DE UNA MUESTRA


Hay pruebas estadsticas no paramtricas que pueden usarse para probar hiptesis con una muestra.
Estas indican si la muestra proviene de una poblacin especifica. La prueba de una muestra es del tipo
de la bondad del ajuste. En una muestra tomada al azar probamos la hiptesis de que su extraccin viene
de una poblacin con una cierta distribucin. La tcnica paramtrica consiste en aplicar una prueba t a la
diferencia entre media observada (muestra) y esperada (poblacin). La prueba t supone que las
observaciones muestrales son de una poblacin distribuida normalmente y en escala intervalar.
Prueba Binomial
Hay poblaciones que se conciben formadas solo por dos clases, as las observaciones caern en una u
otra clasificacin. En cualquier poblacin de dos casos, al saber que la proporci n de casos en una
clase es P, la proporcin en la otra clase ser Q = 1-P. La tcnica es del tipo de la bondad del ajuste
Funcin: La distribucin binomial es la distribuci n muestral de las proporciones observadas en
muestras tomadas al azar de una poblaci n de dos clases. Da los diferentes valores que pueden
presentarse bajo Ho. Esta prueba es de tipo de la bondad del ajuste; dice que tan razonable es que
las frecuencias observadas en la muestra se hayan sacado de una poblacin con un valor especifico de
P
Mtodo: La probabilidad de obtener x
objetos en una categora y N-x en la otra

p(x)= N
x

n-x

p Q

N!
x! ( N x )!

4.1

es:
P es la proporcin de casos esperados en una categora y Q (1-P) proporcin de casos esperados en la
otra
Pero en una investigacin no nos ocuparnos de la probabilidad de
obtener exactamente los valores que fueron observados, en

p(x)=
t=0

realidad preguntamos qu probabilidad hay de obtener los


valores observados o an mas extremos?. En este caso la distribucin muestral binomial es:

N
i

n-t

4.2

pQ

Muestra pequeas: en el caso de una muestra, cuando se usa para una clase con dos categoras, una
situacin comn ocurre si P = . La tabla D que contiene las probabilidades de una cola asociadas con la
ocurrencia de valores tan extremos como x conforme a Ho de que P=Q=.. La tabla D es til si N es <=
25. La tabla D contiene las probabilidades asociadas con la ocurrencia de valores tan pequeos como x
para diferentes N (de 5 a 25). Las probabilidades (p) de la tabla D son de una cola. Se usa una prueba
de una cola cuando hemos predicho cul de las categoras contendr el menor nmero de casos. Si solo
se predice la diferencia, se usa una prueba de dos colas y se duplica la p D.
Muestras grandes: La tabla D no puede usarse con N > 25, pero a medida que N aumenta, la
distribucin binomial tiende a la distribucin normal. Esta tendencia es r pida con P cercano a y
lenta con P pr ximo a 0o1. A mayor disparidad entre P y Q, mayor debe ser N para que la
aproximacin pueda usarse para una prueba estadstica si N>25. Cuando P se acerca a 0o1, el sentido
comn indica que NPQ debe ser, al menos = 9 para ser aplicable a la prueba estadstica basada en la
aproximacin normal. Dentro de estas limitaciones la distribucin
muestral de x es aproximadamente normal, con media = NP y
z = x NP / NPQ
4.3
desviacin estandar = NPQ.

z = (x 0.5) - NP / NPQ 4.4

Resumen del procedimiento:

1- Se determina N, numero total de casos observados.


2- Se determinan las frecuencias en cada categora.
Lic. En Psicologa

UC.S.

18

ESTADSTICA

ELI AGUILAR

3- Se elige el mtodo para hallar la probabilidad de ocurrencia segn Ho de valores observados


a) N = o < 25 y P=Q= tabla D
b) P Q frmula 4.2. Tabla T es til aqu: da coeficientes binomiales ( N x) para N < = 20
c) N > 25 y cercana a , Ho se prueba usando la frmula 4.4. Tabla A
Si la p asociada con el valor observado de x , o de un valor mas externo, es = o < se rechaza Ho.
Potencia-Eficiencia: Como no hay tcnica paramtrica aplicable a datos en escala nominal, no se deduce
potencia-eficiencia de la binomial con datos nominales. Al dicotomizar un continuo, si se aplica la binomial
puede actuar disipadoramente y la binomial tiene potencia eficiencia del 95 % con N de 6
La prueba X de una muestra
Funcin: La X es adecuada cuando interesa el n mero de sujetos, objetos o respuestas que se
clasifican en diferentes categoras. Las categoras pueden ser dos o mas; la tcnica es del tipo de la
bondad del ajuste, que puede usarse para probar la existencia de una diferencia significativa entre un
nmero observado de objetos o respuestas de cada categora y un nmero esperado, basado en la Ho
Mtodo: El fin es comparar un grupo de frecuencias observado con uno esperado; a partir de la
Ho podemos deducir cuales son las frecuencias esperadas. La t cnica X prueba si las
frecuencias observadas est n suficientemente pr ximas a las esperadas que podr an
ocurrir conforme a Ho. La hiptesis de nulidad puede probarse mediante la formula:
Donde Oi= nmero observado de casos clasificados en la categora i
. Ei= nmero esperado de casos en la categora de i conforme a Ho.
seala la necesidad de sumar en todas las categora (k).

4.5

X =
i=1

( Oi Ei )
Ei

La formula nos indica sumar en las k categoras los cuadros de las


diferencias de cada frecuencia observada y cada frecuencia esperada, dividida por la frecuencia
esperada correspondiente.

Si el acuerdo entre frecuencias observadas y esperadas es grande la diferencia (Oi-Ei) ser pequea,
entonces X ser tambin pequea. Si la divergencia es grande X2 con la f rmula 4.5 tambi n ser
grande. Entonces, podemos decir que para valores mayores de X, aumentarn las probabilidades de
que las frecuencias observadas no provengan de la poblacin en la que se bas la Ho.
La distribucin muestral de X conforme a Ho calculada con la formula sigue la distribuci n de X
con gl = k-1. En la parte superior de cada columna de la tabla C encontramos las probabilidades de
ocurrencia asociadas (de 2 colas) conforme a Ho. Hay una valor diferente de X para cada gl. Hay
diferentes distribuciones muestrales para X, una para cada valor de gl. El tama o de gl refleja el
nmero de observaciones susceptible de variar despus de ciertas restricciones en los datos.
En general, en casos de una muestra, cuando Ho especifica completamente las Ei, gl = k-1, donde k
representa el numero de categoras de la clasificacin.
Para usar X en la prueba de una hiptesis en casos de una muestra, se pone cada observacin en cada
una del numero k de celdillas. El nmero total de tales observaciones ser el numero de casos en su
muestra N. Esto es, una observacin debe ser independiente de cualquier otra. As se evitan
observaciones en la misma persona. Para cada una de las k celdillas, la frecuencia esperada tambin
debe ser registrada. Si Ho supone que la proporcin de casos en cada categora es la misma entonces
Ei= N/k. Conociendo los diferentes valores de Ei y Oi, se puede computar el valor de X mediante la
formula 4.5. La significacin de este valor obtenido de X puede determinarse recurriendo a la tabla

C . Si la probabilidad asociada con la ocurrencia, conforme a Ho de la X obtenida para gl = k-1 es = o <


determinado previamente, Ho puede ser rechazada. Si no es as, Ho ser aceptada.
Lic. En Psicologa

UC.S.

19

ESTADSTICA

ELI AGUILAR
Resumen del procedimiento:

1- Se clasifican las frecuencias observadas en un numero k de categor as. La suma de las


frecuencias debe ser N, es decir, el numero de observaciones independientes.
2- A partir de la Ho se determina las frecuencia esperada para cada una de las k celdillas.
3- Con la formula 4.5 se calcula el valor de X.
4- Se determina el valor de gl = k-1.
5- Con la tabla C, se determina la probabilidad asociada con la ocurrencia conforme a Ho de un
valor tan grande como valor observado de X para el valor observado de gl. Si p es igual o
menor que , se rechaza la Ho.
Potencia: Como esta prueba suele usarse cuando no se dispone de otra alternativa, usualmente no se
puede calcular su potencia exacta. Si se usa medici n nominal o los datos est n conformados por
categoras inherentemente discretas, la nocin de potencia-eficiencia de X no tiene importancia,
entonces no hay prueba paramtrica adecuada. Si los datos permiten que pueda disponerse de una
prueba paramtrica, la X puede disipar la informacin. Cuando gl > 1 las pruebas X son insensibles a
los efectos de orden, as cuando una hiptesis tiene en cuenta el orden X puede no ser la mejor.

CAPITULO V - EL CASO DE DOS MUESTRAS RELACIONADAS


Las pruebas estadsticas de dos muestras se usan cuando el investigador desea establecer la
diferencia entre dos tratamientos o si un tratamiento es mejor q otro. El tratamiento puede ser
cualquiera de una multiforme variedad de condiciones. En cada caso, el grupo que ha sufrido el
tratamiento es comparado con el que no lo ha experimentado o que ha sufrido un tratamiento
diferente.
En comparaciones de dos grupos algunas veces se observan diferencias significativas que no son
resultado del tratamiento. Una manera de vencer la dificultad impuesta por diferencias extra as
entre los grupos es usar dos muestras relacionadas en la investigacin. Esto es, uno puede igualar o
relacionar de otra manera las dos muestras estudiadas, cosa que puede lograrse cuando cada sujeto
es su propio control o con parejas de sujetos en las que se asignan los miembros de cada pareja a las
dos condiciones.
Siempre que sea factible, el mtodo de usar a cada sujeto como su propio control (compensando en el
orden en el que le son asignados los tratamientos) es preferible al m todo de pares, debido a que
nuestra capacidad para formar parejas se ve limitada por la ignorancia de las variables pertinentes
que determinan su conducta. El problema desaparece cuando cada sujeto es usado como su propio
control; no es posible un par mas preciso que el logrado por identidad.
Las pruebas estadsticas no paramtricas para dos muestras relacionadas tienen la ventaja adicional
que no requieren una misma poblaci n de la que provengan todas las parejas. Se presentaran 5
pruebas, las cuales ayudan a seleccionar la tcnica mas adecuada p una investigacin:
LA PRUEBA Mc NEMAR P LA SIGNIFICACI N D LOS CAMBIOS
Funcin: esta prueba es mas apropiada para los diseos de antes y despus en los que cada persona
se usa como su propio control y en la medida tiene la fuerza de una escala nominal y ordinal.
Fundamento y mtodo: para probar la significacin de cualquier cambio observado con este mtodo,

se elabor una tabla de cuatro entradas de frecuencias que representa al primero y al segundo
conjunto de respuestas de los mismos individuos. Los rasgos generales de la tabla (se ilustran en la
Lic. En Psicologa

UC.S.

20

ELI AGUILAR

ESTADSTICA

tabla 5.1-pag. 86 Ver gr fico de la tabla , de antes y despus), en la que se usan + y porque
simbolizar respuestas diferentes. Ntese q los casos q muestran cambios entre la primera y segunda
respuesta aparecen en las celdillas A y D. Un individuo es clasificado en la celdilla A si cambio de + a -.
Es clasificado en la celdilla D si cambio de a +. Si no es observado ningn cambio, va a la celdilla B
(rtas. d + antes y despus) o a la celdilla C (rtas. D antes y despus).
Puesto q A + D representan el numero total de personas que cambiaron, se espera que (A + D) sea la
frecuencia esperada conforme a Ho en ambas celdillas A y D.
Resumen del procedimiento: estos son los pasos p calcular la prueba d Mc Nemar:
1.

Se ordena las frecuencias observadas en una tabla de cuatro entradas de la forma d la tabla
5.1.

2. Se determinan las frecuencias esperadas en las celdillas A y D. Si las frecuencias esperadas


son menores que 5, se usa la prueba binomial en lugar de la de Mc Nemar.
3. Si las frecuencias esperadas son 5 o mas, se calcula el valor x.
4. Se determina la probabilidad conforme a Ho asociada con un valor tan grande como el valor
observado d x en a tabla C. si se requiere una prueba unilateral, se divide en dos la
probabilidad q resulta en la tabla. Si la probabilidad de la tabla C por el valor observado de x
con df = 1 es igual o menor que , se rechaza Ho y se acepta de H1.
LA PRUEBA DE LOS SIGNOS
Funcin: la prueba de los signos debe su nombre al uso de los signos mas y menos de medicin en lugar
de cantidades. Es particularmente til cuando la medicin cuantitativa es imposible o no es practica,
pudiendo aun haber cierto orden entre los miembros de cada pareja.
La prueba de los signos es aplicable al caso de dos muestras relacionadas cuando el experimentador
desea establecer que ambas condiciones son diferentes. El nico supuesto adyacente d la prueba es la
continuidad de la variable considerada. Las diferentes parejas pueden provenir de poblaciones
distintas con respecto a edad, sexo, inteligencia, etc.; el nico requisito es q dentro d cada pareja el
experimento haya logrado igualar las variables extra as pertinentes, como se indico antes, cada
sujeto puede ser su propio control.
Mtodo: al aplicar la prueba d los signos nos orientamos en la direccin d las diferencias entre cada
Xai y Xbi, advirtiendo el signo mas o menos de la diferencia. Conforme a Ho, esperamos que el numero
de parejas por las que Xa>Xb sea igual al numero de parejas por las que Xa<Xb. Esto es, si la hiptesis
d nulidad fuera verdadera, esperaramos q cerca d la mitad d las diferencias fueran negativas y la
otra mitad positivas. Ho es rechazada si ocurren muy pocas diferencias de un signo.
La prueba de los signos puede ser de una o de dos colas. En la d una cola, se predice q signo ocurrir
mas frecuentemente. En una prueba de dos colas, solo se predice q las frecuencias con q ocurrirn los
signos sern significativamente diferentes. En esta prueba hay q duplicar los valores de probabilidad
en la tabla D.
Ligas: en la prueba d signos, se dice q una liga ocurre cuando no es posible distinguir diferencias en
la pareja igualada en la variable bajo estudio o cuando los dos puntajes obtenidos por cualquier pareja
son iguales.
Todos los casos ligados fueron desechados del anlisis de prueba de los signos, y en consecuencia el N
se redujo. Por tanto, N es el numero de parejas igualadas cuyo puntaje de diferencia tiene un signo;

xej. 14 de 17 parejas tuvieron puntajes d diferencia con signo, por lo que N = 14.

Lic. En Psicologa

UC.S.

21

ELI AGUILAR

ESTADSTICA

Muestras grandes: si N es mayor que 25, puede emplearse la aproximacin normal a la distribucin
binomial.
Resumen del procedimiento: estos son los pasos de la prueba de los signos:
1.

Se determina el signo de la diferencia entre los dos miembros d cada pareja.

2. Se determina el valor d N, numero de parejas, cuya diferencias exhiben un signo.


3. El mtodo para determinar la probabilidad asociada con la ocurrencia conforme a Ho de un
valor tan extremo como el valor observado de x depende del tamao d N. Si la probabilidad
producida es igual o menor que , se rechaza la Ho.
LA PRUEBA D RANGOS SE ALADOS Y PARES IGUALADOS DE WILCOXON
Funcin: si se considera la magnitud relativa as como la direccin de las diferencias, puede hacerse
una prueba mas poderosa. La de rangos, sealados y pares igualados de Wilcoxon: da mayor eso al par
q muestra una diferencia grande entre las dos condiciones q el par q exhibe una diferencia pequea.
Esta prueba es la de mayo utilidad p el cientfico conductual.
Fundamento y mtodo: sea di el puntaje de diferencia p cualquier par igualado, representando la
diferencia entre los puntajes del par bajo los dos tratamientos. Cada par tiene una di. Para usar la
prueba de Wilcoxon, se clasifican todas las di, sin tener en cuenta el signo as: del rango de 1 a la mas
pequea di, el rango de 2 a la siguiente menor, etc. cuando se clasifican puntajes despreciando el
signo, a una di de 1 se le da un rango menor que a una di de 2 +2.
Enseguida se aade a cada rango el signo de la diferencia, indicando que rangos procedieron de di
negativas y de di positivas.
Ahora bien, si los tratamientos d A y B son equivalentes, esto es, si Ho es verdadera, esperar amos
encontrar algunas de las di mayores favoreciendo el tratamiento de A y otras favoreciendo el de B.
Es decir, algunos de los rangos mayores procederan de las di positivas mientras otros procederan de
las di negativas. En otras palabras, rechazamos Ho si tanto la suma de los rangos de las di negativas
como la suma de los rangos para las di positivas es demasiado pequea.
Muestras pequeas: sea T la suma mas pequea de los rangos sealados. Esto es, T es la suma de los
rangos positivos cuando es menor que la suma de los rangos negativos, o viceversa. En la tabla G del
apndice hay diferentes valores de T y sus niveles asociados de significaci n. Es decir, si una T
observada es igual o menor q el valor dado en la tabla G en un nivel particular de significacin para el
valor observado de N, la hiptesis de nulidad puede rechazarse entonces a ese nivel de significacin.
La tabla G se adapta, tanto a pruebas de una cola como de dos colas.
Resumen del procedimiento: estos son los pasos de la prueba de rangos sealados y pares igualados
de Wlicoxon:
1.

Para cada par igualado, se determina la diferencia del signo (di) entre los dos puntajes.

2. Se ordenan estas di sin respetar el signo. Con las d ligadas, se asigna el promedio de los
rangos ligados.
3. Se aade a cada rango el signo (+ -) de la d q representa.
4. Se determina T, la mas pequea suma de los rangos igualados.
5. Se determina N, el numero total de d con un signo.

6. El procedimiento p determinar la significacin del valor observado d T depende del lado de


N: si N es 25 menor, si N es mayor q 25.
Lic. En Psicologa

UC.S.

22

ESTADSTICA

ELI AGUILAR
LA PRUEBA DE WALSH

Funcin: si el investigador esta en condiciones de suponer que los puntajes en diferencia observados
en dos muestras relacionados se tomaron de una poblacin simtrica, puede usar la poderosa prueba
desarrollada d Walsh. La prueba supone poblaciones sim tricas, d manera q la media representa
exactamente la tendencia central, y es igual a la mediana. La prueba d Walsh requiere mediciones por
lo menos de escala de intervalo.
Mtodo: para la prueba de Walsh, se obtienen puntajes de diferencia (di) para cada uno d los N
pares, q se colocan en orden a su tamao, teniendo en cuenta el signo d cada d. Sea d1 el puntaje de
diferencia mas bajo (puede ser una d negativa), d2 la diferencia siguiente mas baja, etc. As ,
d1d2d3d4...dn.
La hiptesis de nulidad supone q los valores de di fueron tomados de una poblacin de mediana cero (o
de un grupo de poblaciones de mediana comn de cero). En una distribucin sim trica, la media y la
mediana coinciden. La prueba d Wlash supone q las di provienen de poblaciones con distribuciones
simtricas. Por consiguiente, Ho afirma q el promedio de los puntajes de diferencia (0) es cero. Para
una prueba de dos colas, Hi supone q 2 0. Para una prueba de una cola, Hi puede ser bien 2>0, o
bien, 2<0.
La tabla H del apndice se usa para determinar la significacin se diferentes resultados conforme a la
prueba d Wlash. Para usar esta tabla, se necesita conocer el valor observado en N (el numero d
parejas), la naturaleza de Hi y los valores numricos de cada di.
La tabla H contiene los valores significativos para pruebas tanto de una como de dos colas.
Resumen del procedimiento: estos son los pasos de la prueba d Wlash:
1. Se determina el puntaje de diferencia con signo (di) para cada par.
2. Se determina N, el numero de pares igual a dos.
3. Se colocan las di, en tamaos cada vez mayores, de di a dn, teniendo en cuenta el signo.
As, di es el valor negativo mayor de d y dn es el valor positivo mayor de d.
4. La tabla H sirve para determinar si Ho se rechaza y se acepta Hi, con valores observados
de di, d2,d3...dn.
CAPITULO VI - EL CASO DE DOS MUESTRAS INDEPENDIENTES
Al estudiar las diferencias entre dos grupos, podemos usar grupos relacionados o independientes.
Aunque tiene meritos usar dos muestras relacionadas en un dise o de investigaci n, suele
resultar poco practico. Frecuentemente, la naturaleza de la variable dependiente impide usar a
los sujetos como sus propios controles. Cuando el uso de dos muestras relacionadas no es practico
ni adecuado, pueden usarse dos muestras independientes. En este dise o, las dos muestras
pueden obtenerse con la ayuda de dos m todos: a) tomadas al azar de dos poblaciones o b)
asignados al azar ambos tratamientos a miembros de alguna muestra de or genes arbitrarios. En
cualquier caso no es necesario que las muestras sean del mismo tama o.
Las tcnicas paramtricas usuales para analizar datos de dos muestras independientes consiste en
aplicar una prueba t a alas medidas de los dos grupos. La prueba t supone que los puntajes (que se
suman al calcular las medidas) son observaciones independientes de poblaciones distribuidas
normalmente con varianzas iguales, y requiere que las observaciones se midan por lo menos en una
escala de intervalo. Para una investigaci n dada, la prueba t puede ser aplicable debido a varias
razones. El investigador puede encontrar que a) las suposiciones de la prueba t son poco adecuadas
para sus datos; b) prefiere no hacer suposiciones y as dar a sus conclusiones mayor generalidad o; c)

sus puntajes pueden no ser verdaderamente num ricos y por tanto no satisfacer la medida de la
prueba t.
Lic. En Psicologa

UC.S.

23

ESTADSTICA

ELI AGUILAR
LA PRUEBA DE LA PROBABILIDAD EXACTA DE FISHER

FUNCION: Esta es una tcnica no parametrica sumamente til para analizar datos discretos
(nominales u ordinales) cuando las dos muestras independientes son pequeas. Se usa cuando los
puntajes de dos muestras recogidas independientemente al azar perteneces respectivamente a clases
mutuamente excluyentes. En otras palabras, cada sujeto en ambos grupos obtiene uno de los dos
puntajes posibles. Los puntajes se representan mediante frecuencias en una tabla de contingencia de
2X2, como la tabla 6.1. Los grupos I y II pueden ser dos grupos independientes cualquiera, tales por
ejemplo pueden ser como experimentales y control, hombres y mujeres, empleados y no empleados,
etc. Tambin en cuanto a las dos clasificaciones pude ser cualquiera ejemplo aprobado- desaprobado,
de acuerdo y en desacuerdo, etc. La prueba determina si los grupos difieren en la proporci n
correspondiente a las clasificaciones.
Ejemplo de la tabla de contingencia 2X2:

TOTAL
-

Grupo I

A+B

Grupo II

C+D

TOTAL

A+C

B+D

METODO: La probabilidad exacta de observar un conjunto particular de frecuencias en una tabla de


2X2, cuando los totales marginales se consideran fijos, esta dada por la distribucin hipergeomtrica.
Esto es, la probabilidad exacta de la ocurrencia observada se encuentra tomando la proporci n del
producto de los factoriales de los cuatro totales marginales y el producto de los factoriales de las
frecuencias de las celdillas, multiplicando por el factorial N.
Si para el investigador son suficientes los niveles de significacin en lugar de valores exactos de p
(probabilidad), puede usar la tabla I del ap ndice. Se elimina la necesidad de realizar c lculos
tediosos. Con ella se puede determinar directamente la significacin de un conjunto observado de
valores en una tabla de contingencia de 2X2. La tabla I es aplicable a los datos donde N toma un valor
de 30 o menor, y donde ninguno de los totales del margen derechos sobrepasa 15. Es decir ni A+B, ni,
C+D pueden ser mayores que 15.
Debido a su gran tamao, la tabla I es un poco m s dif cil de usar que la mayor a de las tablas de
valores de significacin. Por lo tanto, se ha incluido direcciones detallada para su uso.
1)

Se determinan los valores de A+B+C+D a partir de los datos.

2) Se encuentra el valor observado de A+B en la tabla I bajo el encabezado totales en el


margen derecho
3) En la misma seccin de la tabla, se localiza el valor observado de C+D bajo el mismo
encabezado.
4) Para el valor observado de C+D, hay en la tabla varios valores posibles de B. Se encuentra el
valor observado de B entre estas posibilidades.

5) Se observa a continuacin el valor de D. Si es igual o menor que el valor dado en la tabla de


acuerdo con su nivel de significacin, los datos observados son significativos en se nivel.
Lic. En Psicologa

UC.S.

24

ESTADSTICA

ELI AGUILAR

Deber notarse que los valores de la tabla I son aproximados. Y tambi n que los niveles de
significacin de esta tabla son para regiones de rechazo de 1 cola. Si se necesita una regi n de
rechazo de 2 colas hay que duplicar el nivel de significacin dado en la tabla I.
RESUMEN DEL PROCEDIMIENTO: Estos son los pasos para usar la prueba de Fisher:
1)

Se distribuyen las frecuencias observadas en una tabla de 2X2.

2) Se determinan los totales marginales. Cada conjunto de totales marginales se suma a N, el


nmero de casos independientes observados.
3) La eleccin del mtodo para decidir si se rechaza o no la Ho depende de que se requiera el
clculo de las probabilidades exactas.
a) Para una prueba de significacin, hay que consultar la tabla I
b) Para una probabilidad exacta, se requiere un uso recurrente de formula (6.1)
En cualquier caso, el valor obtenido ser para una prueba de una cola. Para una prueba de dos
colas, el nivel de significacin que aparece en la tabla I o la p obtenida deber duplicarse.
4) Si el nivel de significacin que aparece en la tabla I o la p obtenida es igual o menor que , se
rechaza Ho.
LA PRUEBA X PARA DOS MUETRAS INDEPENDIENTES
FUNCION: Cuando los datos de investigacin consisten en frecuencias de categoras, puede usarse la
prueba X para determinar la significacin de las diferencias entre dos grupos independientes. La
medicin implicada puede ser tan vaga como una escala nominal.
La hiptesis que usualmente se pone a prueba supone, que los dos grupos difieren con respecto a
alguna caracterstica y por lo tanto, con respecto a la frecuencia relativa con que los miembros
del grupo son encontrados en diferentes categor as. Para probar esta hip tesis, contamos el
nmero de casos de cada grupo en cada categora de un grupo con la del otro grupo. Por ejemplo
podramos probar si dos grupos polticos difieren en su acuerdo o desacuerdo con alguna opini n.
METODO: La hiptesis de nulidad puede probarse por medio de:
X = (O - E)

(6.3)

E
Donde O es el numero observado de casos clasificados y E es el numero de casos esperados conforme
con la Ho. Para encontrar la frecuencia esperada par cada casillero o celdilla se multiplican los dos
totales marginales comunes por una celdilla particular y se divide este producto por el nmero total
de casos N.
Los valores sacados despus de la formula son distribuidos aproximadamente con un gl= (k-1). (r-1)
donde k quiere decir numero de categoras y r quiere decir nmero de columnas.
Ahora bien, si las frecuencias observadas est n estrechamente de acuerdo con las frecuencias
esperadas, las diferencias (O-E) sern por supuesto, pequeas y consecuentemente el valor de X
ser pequeo. Con un valor X no podemos rechazar la hip tesis de nulidad (o nula), que supone
independientes entre si a los dos conjuntos de caracter sticas. Sin embargo, si hay una o varias
diferencias grandes, el valor de X tambin ser grande. Cuanto mayor es X tanto mas probable es
que los dos grupos difieran con respecto a las clasificaciones.

Las probabilidades asociadas con diferentes valores de chi cuadrada se encuentran en la tabla C del
apndice.
Lic. En Psicologa

UC.S.

25

ESTADSTICA

ELI AGUILAR

TABLAS DE CONTENGENCIA DE 2X2: Tal vez el uso mas comun de la prueba de X se refiere a la
posibilidad de que ocurra conforme a Ho un colapso observado de frecuencias en una tabla de
contingencia de 2X2. Cuando aplicamos a la prueba X a los datos donde tanto r como k son iguales a
2, deber usarse la formula:
N
X = N (/ AD BC/ - 2 )

(6.4)

gl= 1

(A+B). (C+D). (A+C). (B+D)


RESUMEN DE PROCEDIMIENTO: Pasos par usar la prueba de X para dos muestras independientes:
1)

Se calculan las frecuencias observadas en una tabla de contingencia k x r, usando las columnas
de k para los grupos y las filas de r para las condiciones

2) Se determina la frecuencia esperada para cada una de las celdillas para obtener el producto
de los totales marginales. Comunes a ella y dividirlo por N( N es la suma de cada grupo de
totales marginales. Representa el numero total de observaciones independientes. Las N
infladas invalidan la prueba). El paso de 2 es innecesario cuando los datos estn en una tabla
de 2x2.
3) Para una tabla de 2x2, se calcula X con una formula (6.4) cuando es mayor que 2, se calcula
X con una formula de (6.3)
4) Se determina la significacin de la X observada consultando la tabla C. Para una prueba de
una cola, se divide por dos el nivel de significacin sealado. Si la probabilidad dad por la tabla
C es igual o menor que se rechaza Ho y se acepta H1.
Cuando se usa la prueba X
El caso 2X2. Si las frecuencias estn en una tabla de contingencia 2X2, la decisin concerniente al
uso de X debe guiarse por estas consideraciones:
1) Cuando N> 40, se usa X corregida por la continuidad, es decir con la formula 86.4)
2) Cuando N esta entre 20 y 40, la prueba X (6.4), puede usarse en el caso de que todas las
frecuencias esperadas sean de 5 o mas. Si la frecuencia esperada ms pequea es menor
que 5 se usa la prueba de Fisher.
3) Cuando N<20, se usa la prueba de Fisher.
Tablas de contingencia con gl mayor que 1: Cuando k es mayor que 2 (y as gl > 1), puede usarse la
prueba X si menos del 20 por ciento de las celdillas tiene una frecuencia esperada menor que 5 y si
no hay ninguna celdilla con una frecuencia espera menor que 1. Si estos requisitos no son reunidos por
los datos en la forma en que se obtuvieron originalmente, el investigador debe combinar las categoras
adyacentes para aumentar la frecuencia esperada en las diferentes celdillas.
LA PRUEBA DE LA MEDIANA
FUNCION: La prueba de la mediana es un procedimiento para probar si dos grupos independientes
difieren en sus tendencias centrales. M s exactamente, la prueba de la mediana dar informaci n
acerca de la probabilidad de que dos grupos independientes (no necesariamente del mismo tamao) se
hayan tomado de poblaciones con la misma mediana. La hiptesis de nulidad supone que proviene de
poblaciones con la misma mediana; la hiptesis alterna puede ser que la mediana de una poblacin es
diferente de la de la otra (prueba de dos colas) o que la mediana de una poblacin es ms alta que la
de la otra (prueba de una cola). La prueba puede usarse siempre que los puntajes de los dos grupos

por lo menos en una escala ordinal de medicin.

Lic. En Psicologa

UC.S.

26

ESTADSTICA

ELI AGUILAR

FUNDAMENTO Y METODO: Al aplicar la prueba de la mediana, se empieza por determinar el puntaje


de la mediana para el grupo combinado (es decir, la mediana para todos los puntajes en ambas
muestras). Enseguida se dicotomizan os conjuntos de puntajes de la mediana combinada y se
distribuyen los datos en una tabla de 2X2, como la tabla a continuacin (6.10)
TOTAL
Grupo I
Num. de puntaj. Por encima de la mediana combinada

Num. de puntaj. por debajo de la mediana combinada


(6.10)

TOTAL

Grupo II

A+B

D
A+C

B+D

C+D
N=n1 +n2

Ahora bien, si en los grupos I y II tenemos muestras procedentes de poblacin con la misma mediana,
cerca de la mitad d los puntajes e cada grupo deber estar por encima de la mediana combinada y
cerca de la otra mitad por debajo. Es decir, esperaremos que las frecuencias A y C sean
aproximadamente iguales, y las frecuencias B y D tambin lo sean.
Puede demostrarse que si A es el numero de casos en el grupo I por encima de la mediana combinada y
si B es el numero de casos en el grupo II en la misma situacin, la distribucin muestral de A y B bajo
la hiptesis nula (Ho es A = 1 n1 y B = 1 n2) es la distribucin hipergeometrica.
2
2
P (A,B)= (A+C) . (B+D)
A
B
(n1 +n2)
A+B
(6.5)
Si el numero total de casos en ambos grupos (n1+n2) es peque o puede usarse la prueba de Fisher
para probar Ho. Si el numero total de casos es suficientemente grande puede usarse X con gl= 1.
Cuando se analizan datos divididos en la mediana, hay que guiarse por estas consideraciones al escoger
entre la prueba de Fisher y la prueba X.
1) Cuando n1+ n2 > 40 se usa X corregida por continuidad es decir con la formula (6.4).
2) Cuando n1+ n2 esta entre 20 y 40 y ninguna celdilla tiene una frecuencia esperada menor a 5
se usa X corregida por continuidad por (6.4). Si la mas peque a frecuencia esperada es
menor que 5, se usa la prueba de Fisher.
3) Cuando n1+ n2 < 20 se usa Fisher.
Puede surgir una dificultad al calcular la prueba de la mediana: puede que haya varios puntajes
exactamente, en la mediana combinada. Si sucede, el investigador tiene dos alternativas: a) si n1+ n2
es grande y si solamente unos pocos casos caen en la mediana combinada esos casos pueden retirarse
del anlisis o b) los grupos pueden dividirse en puntajes que excedan o no excedan la mediana.
RESUMEN DEL PROCEDIMIENTO: Son los pasos para usar la mediana
1) Se determina la mediana combinada de los puntajes n1 + n2.
2) Se dividen en la mediana combinada los puntajes de cada grupo. Se registran las frecuencias
resultantes en una tabla como la 6.10. Si son muchos los puntajes que quedan en la mediana
combinada, se dividen los puntajes en categoras: excedentes y no excedentes de la mediana.

3) Se encuentra la probabilidad de los valores observados por la prueba de Fisher o la X,


escogiendo entre ellas de acuerdo con los criterios ya establecidos.
4) Si la probabilidad resultante de la prueba es igual o menor que , se rechaza Ho.
Lic. En Psicologa

UC.S.

27

ESTADSTICA

ELI AGUILAR
ELECCI N DE LA PRUEBA ESTAD STICA ADECUADA

Una prueba estadstica es buena si es pequea la probabilidad de rechazar Ho siendo verdadera y


grande la probabilidad de rechazar Ho siendo falsa. Esto determina la potencia de una prueba.
Existen otras consideraciones adem s de la potencia que determinan la elecci n de la prueba
estad stica. En la elecci n debemos considerar la manera en que la muestra de puntajes fue
obtenida, la naturaleza de la poblacin de la que se sac la muestra y la clase de medici n o escala
que se emple en las definiciones operacionales de las variables usadas, es decir, en los puntajes
Las pruebas ms poderosas son las apoyadas por suposiciones mas fuertes y amplias. Las pruebas
paramtricas como la prueba t o F se basan en una variedad de fuertes suposiciones. Cuando los
datos de la investigacin pueden ser analizados adecuadamente por una prueba param trica, ese
ser el medio mas poderoso para rechazar una Ho Falsa.
Las condiciones en las que la prueba t es la m s poderosa y sin las cuales no se puede tener
confianza en cualquier aseveracin de probabilidad obtenida son:
1.

2.
3.
4.

5.

Las observaciones deben ser independientes entre s . La selecci n de un caso cualquiera


de la poblacin con miras a la inclusin en la muestra no debe afectar las posibilidades de
incluir cualquier otro, y el puntaje que se asigne a un caso cualquiera no debe influir en el
puntaje que se asigne a cualquier otro
Las observaciones deben hacerse en poblaciones distribuidas normalmente
Estas poblaciones deben tener la misma varianza ( o una proporcin de varianza conocida)
Las variables correspondientes deber n haberse medido por lo menos en una escala de
intervalo, de modo que puedan hacerse con ellas operaciones matem ticas (suma, divisi n,
clculo de las medias, etc.)
En el caso de la prueba F se agrega una condici n: Las medias de estas poblaciones
normales y homoscedsticas debern ser combinaciones lineales de efectos debidos a las
columnas y a los renglones o a ambos, los efectos deben ser aditivos

Potencia-Eficiencia
A medida que son m s d biles las suposiciones de un modelo particular son mas generales las
conclusiones derivadas al aplicar la prueba estadstica asociada con l, pero menos poderosa es la
prueba de Ho. Esta aserci n es generalmente verdadera para cualquier tama o de muestra, pero
no se sostiene al comparar dos pruebas estad sticas que se aplican a dos muestras de distinto N.
El concepto de potencia eficiencia se refiere al incremento en el tama o de la muestra necesario
para hacer la prueba B tan poderosa como la A
Potencia-eficiencia de la prueba B = 100 Na/Nb %
Al escoger otra prueba estad stica con menos suposiciones podemos evitar las suposiciones por
medio del incremento en N.
Potencia-eficiencia de las pruebas No param tricas
Potencia-eficiencia de la Binomial: En vista de que no hay t cnica param trica aplicable a datos
medidos en escala nominal, carece de sentido inquirir la potencia-eficiencia de la prueba binomial
cuando se emplea con datos nominales. Al ser dicotomizado un continuo si con los datos
resultantes se emplea la prueba binomial, puede actuar disipadoramente. En tales casos, la prueba
binomial tiene una potencia eficiencia del 95% con una N de 6 disminuyendo a una eficiencia
eventual de 2/= 63%. Sin embargo, si los datos se prestan b sicamente a la dicotom a, aunque la

variable tenga en la base una distribucin continua, la prueba binomial puede no tener alternativas
mas poderosas.
Lic. En Psicologa

UC.S.

28

ELI AGUILAR

ESTADSTICA

Potencia-eficiencia de la Prueba 2 para una muestra: En vista de que esta prueba suele ser
usada cuando no se dispone de otra alternativa clara, usualmente no estamos en condiciones de
calcular su potencia exacta. Cuando se usa la medicin nominal o cuando los datos est n
conformados por categor as inherentemente discretas, la noci n de potencia-eficiencia de la
prueba 2 no tiene importancia, en tales casos, no hay prueba param trica adecuada. Si los datos
permiten que pueda disponerse de una prueba param trica, la prueba 2 puede ser disipadora de
la informacin.
Cuando gl >1, las pruebas 2 son insensibles a los efectos de orden, y as , cuando una hip tesis
tiene en cuenta el orden, la prueba 2 puede no ser la mejor
Potencia-eficiencia dela Prueba de McNemar: Cuando la prueba de McNemar se usa con medidas
nominales, el concepto de potencia eficiencia no tiene sentido pues no hay otra alternativa. Sin
embargo, cuando la medici n y otros aspectos de los datos son tales que es posible aplicar la
prueba paramtrica t, tanto la prueba de McNemar como la binomial, tienen una potenciaeficiencia de cerca del 95% para A+D=6, que declina a medida que aumenta el tama o de A+D
hasta una eficiencia final asinttica de cerca del 63%
Potencia-eficiencia de la Prueba los Signos: La ptencia-eficiencia de la prueba de los signos est
cerca del 95% para N=6, pero declina a medida que el tama o de la muestra se incrementa hasta
una eficiencia final asinttica del 63%.
Potencia-eficiencia de la Prueba de Wilcoxon: Cuando las suposiciones de la prueba param trica t
en verdad se satisfacen, la eficiencia asint tica cercana a Ho de la prueba de rangos se alados y
pares igualados de Wilcoxon, comparada con la prueba t es de 3/ = 95,5%. Esto significa que
3/ es la proporcin lmite, de tama os de muestras, necesaria para que las pruebas de Wilcoxon
y t alcancen el mismo poder . Para muestras pequeas la eficiencia se acerca al 95%
Potencia-eficiencia de la Prueba de Walsh: Cuando se compara con la prueba mas poderosa, la
prueba paramtrica t, la de Walsh tiene una potencia-eficiencia del 95 % para la mayor a de los
valores de Ny de . Su potencia-eficiencia es del 99 % (N=9 y =0.01 en una prueba de una cola)
sin bajar del 87,5 (N=10 y =0.06 en una prueba de una cola)
Potencia-eficiencia de la Prueba de Fisher: Con la modificaci n de Tocher (considerando las
distribuciones de frecuencia mas extremas que pudieran ocurrir con los mismos totales
marginales), la prueba de Fisher es la mas poderosa de las pruebas de una cola para datos
adecuados
Potencia-eficiencia de la Prueba de 2 para 2 muestras independientes : Cuando la prueba de 2
se usa, generalmente no hay una alternativa clara, y la potencia exacta de la prueba es dif cil de
calcular. Sin embargo se demostr que el l mite de la distribuci n de potencia de 2 tiende a 1
cuando N toma un valor grande
Potencia-eficiencia de la Prueba de 2 para la prueba de la Extensi n de la mediana (k muestras
ind) Como se sabe, la extensi n de la prueba de la mediana es en esencia, una prueba 2 para k
muestras, por tanto su potencia eficiencia es similar a la 2 para 2 muestras independientes
Potencia-eficiencia del rango de Spearman: La eficiencia de la correlaci n de rango de Spearman
cuando se compara con la correlacin mas poderosa, la r de Pearson, es de cerca de 91 %. Cuando p
el r se usa con una muestra para probar la existencia de una asociacin en la poblaci n, y cuando s
la poblacin tiene una distribucin normal bivariada y la medici n se ha hecho en escala
Intervalar, r tiene una eficiencia del 91 % respecto a r para rechazar Ho. Si existe una s

correlacin entre X e Y en esa poblaci n, r necesitar 100 casos para establecer esa correlaci n s
al mismo nivel de significacin que r logra con 91 casos
Lic. En Psicologa

UC.S.

29

ESTADSTICA

ELI AGUILAR
INDICADORES DEL NIVEL DE SALUD

1-Indicadores del Nivel de Salud


Los indicadores responden a la necesidad de expresar cuantitativamente las variables que son
objeto de estudio en la ciencia. Para eso, sta debe ser correctamente definida conceptual y
operacionalmente, de modo que puedan establecerse cuales son los componentes de la variable
cuya magnitud desea medirse desde el indicador. Por ejemplo si queremos medir el nivel de
hacinamiento con fines epidemiolgicos deber tomarse la cantidad de personas por cama en cada
vivienda.
Requisitos de los indicadores
Validez: Significa que el indicador mida la variable que se pretende y no otra cosa. Por ejemplo, si
queremos medir la eficiencia de la atenci n m dica no podemos tomar para ello el nivel de
mortalidad, pues esta depende de muchos otros componentes como la educaci n, la vivienda, el
ingreso econmico y puede que una variacin notable en la mortalidad no se deba a la eficiencia de
atencin mdica
Factibilidad: Significa que los datos que se requieren para calcular un indicador est n
habitualmente disponibles o pueden obtenerse de alg n modo. Por ejemplo, los indicadores de
morbilidad son mejores que los de mortalidad, pero estos ltimos son m s factibles
Estabilidad: Significa que sean poco sensibles a las deficiencias de los datos b sicos, que no se
vean demasiado influenciados por datos bsicos deficientes o err neos
Complejidad: En caso de tratarse de variables complejas debe ser posible definir la variable en
varios componentes, entonces se puede obtener un ndice combinando diversos indicadores,
asignando a cada uno la ponderacin correspondiente
Simplicidad y Estandarizaci n: Deben ser de f cil comprensi n y presentarse normalizados en
escalas internacionales para facilitar las comparaciones
2-Medicin del Nivel de Salud
La organizaci n Mundial de la Salud define salud como, un estado de bienestar f sico, mental y
social y no solo como ausencia de enfermedad. La medicin del nivel de salud puede darse a partir
de:
a) La medicin positiva de la salud, o sea, del estado mismo de bienestar
b) La medicin de las consecuencias derivadas de la p rdida de la salud, o sea, enfermedad y
muerte
c) La medicin de los factores que determinan el nivel de salud
La medici n del estado de bienestar ha sido muy tenido en cuenta en los ltimos a os por la
creciente conciencia de las limitaciones de los indicadores basados en la morbilidad y mortalidad,
pero es an un campo de ensayo. La medicin de los factores que determinan el nivel de salud se
utiliza en la planificaci n, como parte del diagn stico de salud de una comunidad. Se relacionan
con el estado de la vivienda, la disponibilidad de servicios p blicos y m dicos, pero el modelo de
interrelaci n entre estos factores y el nivel de salud a n no se ha desarrollado, por eso se
analizan los de morbilidad y mortalidad que si son medidas que presentan una relaci n

cuantificable con el nivel de salud.

Lic. En Psicologa

UC.S.

30

ELI AGUILAR

ESTADSTICA

2.1-Indicadores basados en la Mortalidad


Ventajas: 1) La defunci n es un evento concreto, nico en la vida de una persona y definido
internacionalmente. 2) En la mayora de los pa ses existe un registro sistem tico de las muertes.
3) Los datos de poblacin requeridos generalmente se obtienen de los censos
Desventajas: 1-Deficiencia en datos bsicos 2-Errores en el registro de las causas de muerte 3Omisiones que a veces alcanzan hasta un tercio de las defunciones 4-No reflejan toda la
complejidad del fenmeno de salud de una poblacin 5-No expresan la ocurrencia de
enfermedades de baja o nula letalidad
2.1.1 Tasa cruda de Mortalidad: Refleja el n mero de defunciones anuales por 1000 habitantes y
traduce en forma global el impacto de las alteraciones letales de salud en una comunidad.
Requiere del conocimiento del total de muertes y de toda la poblaci n. Es un macroindicador y
resume los riesgos de una poblacin heterognea. No contempla aspectos como la edad y el sexo
2.1.2: Esperanza de vida al nacimiento: Si se disponen de las tasas espec ficas de mortalidad por
edad y sexo de una poblaci n se puede calcular las correspondientes probabilidades de muerte.
Con ellas se puede construir una tabla de vida que representa el curso de una generaci n de
100.000 nacidos vivos que hubieran estado expuestos a riesgos de muerte citados. El indicador
de nivel de salud derivado de la tabla de vida es la esperanza de vida al nacimiento y refleja el
promedio de aos de sobrevida al nacimiento. Este indicador resume m s comprensiblemente los
riesgos de morir observados en una poblacin, independientemente de la estructura de edad de la
poblacin. Para ello se precisa: poblacin, defunciones por edad y construccin de tabla de vida
2.1.3: Mortalidad Infantil: Es una tasa que indica el n mero de muertes que se dan antes del a o
de vida por cada 1000 nacidos vivos en una poblaci n. Aunque indica mortalidad de un grupo
etario, realmente muestra nivel de salud y vida de la poblacin ya que los menores a un a o son en
extremo vulnerables a las condiciones adversas de vida. El inconveniente de este indicador es que
no siempre se registran estas muertes y parte de las muertes del primer d a son err neamente
adjudicadas a la mortalidad fetal.
2.1.4: Mortalidad proporcional: Es el cociente entre defunciones de personas de mas de 50 a os
sobre el total de defunciones, expresado en porcentaje. Requiere de pocos datos, es poco
sensible a errores de informaci n b sica y es f cil su c lculo e interpretaci n. Se basa en la
observacin de que en los pases con bajo nivel de salud la estructura de poblaci n es joven y la
mortalidad temprana es alta. A medida que los niveles de salud y de vida aumentan, disminuye la
mortalidad por debajo de los 50 a os. Este indicador discrimina con m s eficiencia pa ses de
distinto nivel de vida y es mejor que la mortalidad proporcional calculada usando otra edad, por
ello parece un buen macroindicador
2.2. Indicadores Basados en la Morbilidad
Ventajas: No refleja exclusivamente la ocurrencia de enfermedades letales, sino el conjunto de
enfermedades y accidentes de una poblaci n. Desventajas: 1-La enfermedad es repetitiva y de
caractersticas variadas 2-Las definiciones operacionales pueden hacerse segn diversos
criterios 3-La clasificacin de las enfermedades es distinta seg n los estados. 4-Es imposible su
registro completo y sistemtico 5-No existen criterios de diagnstico uniforme 6-La clasificaci n
depende del conocimiento del m dico 7-La eficiencia de los medios para diagn stico es variable
8- La disponibilidad de los medios de diagnstico es variable 9-Los datos est n dispersos en sitios
pblicos y privados 10-La percepcin de enfermedad por parte del individuo depende de factores
culturales y sociales 11-La concurrencia o no a un centro de asistencia depender del factor

anterior 12-Solo se pueden obtener datos sobre algunas enfermedades 13-Ocurrencia de


enfermedades crnicas
Lic. En Psicologa

UC.S.

31

ESTADSTICA

ELI AGUILAR
Propuestas para medir niveles de salud

Sanders propone un indicador en el sentido de medir positivamente la salud y se basa en la


determinacin de los das en que el individuo es capaz de desarrollar el papel adecuado a su edad
y su sexo. Sullivan propone medir el nmero de das en que el individuo se encuentra en alguna de
4 categoras que van desde el enfermo cr nico hospitalizado a la incapacidad transitoria por una
afeccin aguda. Pero igualmente, hay que considerar que el hecho de que un individuo decida
suspender o reducir sus actividades debido a una enfermedad o accidente depende de factores
sociales y culturales y por tanto est sujeto a factores de variacin
El objetivo fundamental de estas mediciones es orientar acciones concretas para mejorar los
niveles de salud, en tal sentido los planes de salud, mas que un nico indicador, requieren de un
diagnstico analtico de los da os de salud de la poblaci n y de los factores que los determinan.
En tal sentido, combinan variadas fuentes de informacin y utilizan indicadores m ltiples.
Tasas, Razones y proporciones
Las tasas, razones y proporciones son los elementos mas usados en la descripci n de datos
cualitativos.. En el campo de salud p blica, el uso de valores absolutos es muy frecuente y llena
los requerimientos de muchos sectores, por ejemplo la necesidad del conocimiento del total de la
poblacin de un municipio para estimar el volumen de prestaciones que debe d rsele, como puede
ser el conocer el nmero total de nacimientos para calcular el volumen de camas que deben estar
disponibles para obstetricia
Los valores absolutos tienen innumerables aplicaciones en salud p blica, particularmente los
relacionados con nacimientos, defunciones, morbilidad, etc, ya que son ampliamente usados en los
programas de planificaci n de actividades. Sin embargo, no son suficientes cuando se desea
comparar las cifras de un rea a lo largo del tiempo o entre varias regiones entre s , porque las
poblaciones de las cuales provienen son cambiantes y los totales absolutos pierden importancia
pues no son comparables. Para ello se usan las frecuencias relativas que no son m s que
cantidades que estn referidas a otras que se usan como base de comparaci n.
Pautas para el uso de frecuencias Relativas
1) Es necesario especificar que fen menos se est n relacionando y cual de ellos se toma como
base de referencia
2) No deben calcularse frecuencias relativas sobre valores absolutos muy peque os, los
resultados seran muy inestables
3) Todo cociente debe expresarse a trav s de su valor real o puede amplificarse por un factor
que puede ser mltiplo de 10
4) Un cociente no expresa la magnitud de ninguno de los valores usados sino de la relaci n, por
eso todo cociente debe acompa arse por lo menos por uno de los valores absolutos que le dio
origen
Razn: Es todo n mero relativo que relaciona a) dos fen menos distintos o b) dos categor as
2

diferentes de un mismo fenmeno. Ej: a) Promedio de habitantes por km . b) Relaci n de sexos de


los nacidos vivos
Proporcin: Es la relacin de dos cantidades en la cual el numerador es una parte de la registrada
en el denominador y este constituye el total de las observaciones en consideraci n. El resultado
se agranda por un factor de amplificaci n que en general es 100 y esa proporci n recibe el
nombre de porcentaje. Una proporci n mide el peso relativo de una parte respecto al todo del

cual proviene. Ejemplo: Proporci n de pacientes que curaron con una droga con respecto al total
de pacientes tratados con dicha droga
Lic. En Psicologa

UC.S.

32

ESTADSTICA

ELI AGUILAR

Tasa: Es la relacin existente entre el nmero de veces que ocurri un hecho vital o de salud, y la
poblacin que estuvo expuesta al riesgo de acaecimiento del hecho mencionado en el numerador.
Tiene mayor implicancia que las razones y proporciones pues involucra el factor riesgo o
probabilidad. La mayora de las tasas miden la fuerza de acaecimiento de un fen meno y con ello
evala el riesgo inherente. Una tasa est compuesta por tres elementos: numerador, denominador
y factor de ampliaci n. En el numerador se consigna el n mero de veces que se registr un
fenmeno (total de nacimientos, defunciones, matrimonios) y en el denominador la poblaci n que
estuvo expuesta al riesgo de acaecimiento de lo asignado en el numerador. Generalmente los
datos del numerador provienen de sistemas de registro permanente y los del denominador de
recuentos censales o proyecciones hechas a partir de los censos.
Para que una tasa sea correcta se debe considerar la concordancia de numerador y denominador
en lo referente a la naturaleza, tiempo y rea de referencia. Respecto a la concordancia en la
naturaleza, en la tasa de mortalidad por c ncer de tero no se considera la poblaci n total pues
los hombres no pueden producir tales defunciones. Respecto del tiempo, los datos deben haber
sido enumerados en el mismo periodo. Respecto del rea de referencia se deben descartar
hechos acaecidos a personas no residentes en el rea, as en hospitales muy especializados los
casos que puedan registrarse pueden corresponder a personas residentes en otras reas
Tasa general: Mide la fuerza de acaecimiento de un fen meno en el total de la poblaci n e intenta
cuantificar la probabilidad de ocurrencia en el conjunto de los componentes.
Tasa espec fica: Mide un hecho registrado en un segmento de la poblaci n en relaci n a la
poblacin de ese segmento
Ejemplos:
Tasa general =
N de de nacimientos en el rea Y en el perodo Z
De Natalidad
Poblacin total del rea Y, a la mitad del perodo Z
Tasa especfica = N de nacimientos en un segmento del rea Y en el periodo Z
de natalidad
Poblacin de ese segmento a la mitad del perodo
Tasas ajustadas: Que 2 tasas generales sean iguales no implica que ambas poblaciones tengan
igual riesgo de acaecimiento del fen meno pues pueden tener estructura diferente, pero las
diferencias se compensan y los resultados finales son iguales. Ejemplo: La tasa general anual de
mortalidad por cncer en hombres en 1962-63 fue de 259.4 por 1000.000 habitantes. En Lima en
igual per odo fue de 91.9. Al comparar ambas poblaciones se ve que en La Plata un 36% de la
poblacin tiene entre 45-74 aos y en Lima solo un 20%, Lima tiene una poblaci n mas joven y por
ello menos expuesta a tal riesgo. Debe entonces eliminarse esa diferencia. Suprimiendo las
diferencias de edad, las tasas son 132.16 y 112.5, la disimilitud tiende a disminuir. Por ello cuando
se desean comparar dos poblaciones respecto a cierto riesgo deben tomarse uno de dos caminos:
1) Comparar las tasas espec ficas: Se comienza estableciendo cu l es el factor espec fico mas
importante (edad, sexo) luego se obtienen las tasas espec ficas correspondientes y luego se
comparan clase a clase, las clases de cada tramo. Esto se puede hacer cuando el n mero de
clases es pequeo sino debe optarse por el segundo mtodo
2) Comparar las tasas ajustadas: a) Se determinan cu les son los factores de variaci n posible b)
Se asla el que se supone mas probable c) Se estudia la estructura de las poblaciones tabuladas y
se detectan similitudes o diferencias d) se calculan las tasas espec ficas para cada tramo y se las
compara una a una
BIBLIOGRAFIA
Slonim, M. (1967). Muestreo: Gu a gil y precisa de Estad stica Pr ctica. Buenos Aires:
Editorial Americana.
Siegel, S. (1970). Diseo experimental no param trico aplicado a las ciencias de la
conducta. Mxico: Editorial Trillas SA.
Lic. En Psicologa

33

UC.S.

S-ar putea să vă placă și