Documente Academic
Documente Profesional
Documente Cultură
Podramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados del
anlisis no pretenden ir ms all del conjunto de datos, e inferencial cuando el objetivo del
estudio es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.
1.5.0.1 Ejemplo
Consideremos la poblacin formada por todos los estudiantes de la Universidad
de Mlaga (finita). La altura media de todos los estudiantes es el parmetro .
El conjunto formado por los alumnos de la Facultad de Medicina es una muestra
de dicha poblacin y la altura media de esta muestra, , es un estadstico.
Variables estadsticas
Cuando hablemos de variable haremos referencia a un smbolo (X,Y,A,B,...) que puede
tomar cualquier modalidad (valor) de un conjunto determinado, que llamaremos dominio
de la variable o rango. En funcin del tipo de dominio, las variables las clasificamos del
siguiente modo:
Variables cualitativas,
cuando las modalidades posibles son de tipo nominal. Por ejemplo, una variable de
color
Variables cuasicuantitativas
son las que, aunque sus modalidades son de tipo nominal, es posible establecer un
orden entre ellas. Por ejemplo, si estudiamos la llegada a la meta de un corredor en
una competicin de 20 participantes, su clasificacin C es tal que
Variables cuantitativas
son las que tienen por modalidades cantidades numricas con las que podemos
hacer operaciones aritmticas. Dentro de este tipo de variables podemos distinguir
dos grupos:
Discretas,
cuando no admiten siempre una modalidad intermedia entre dos cualesquiera de sus
modalidades. Un ejemplo es el nmero de caras X, obtenido en el lanzamiento
repetido de una moneda. Es obvio que cada valor de la variable es un nmero
natural
Continuas,
cuando admiten una modalidad intermedia entre dos cualesquiera de sus
modalidades, v.g. el peso X de un nio al nacer. En este caso los valores de las
variables son nmeros reales, es decir
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como
discreta. Este es el caso en que hay limitaciones en lo que concierne a la precisin
del aparato de medida de esa variable, v.g. si medimos la altura en metros de
personas con una regla que ofrece dos decimales de precisin, podemos obtener
En realidad lo que ocurre es que con cada una de esas mediciones expresamos que
el verdadero valor de la misma se encuentra en un intervalo de radio
. Por
tanto cada una de las observaciones de X representa ms bien un intervalo que un
valor concreto.
Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones
posibles que puede presentar la variable. A veces stas son muy numerosas (v.g. cuando una
variable es continua) y conviene reducir su nmero, agrupndolas en una cantidad inferior
de clases. Estas clases deben ser construidas, tal como hemos citado anteriormente, de
modo que sean exhaustivas e incompatibles, es decir, cada modalidad debe pertenecer a una
y slo una de las clases.
, introducimos las
Frecuencia absoluta
de la clase ci es el nmero ni, de observaciones que presentan una
modalidad perteneciente a esa clase.
Frecuencia relativa
de la clase ci es el cociente fi, entre las frecuencias absolutas de dicha
clase y el nmero total de observaciones, es decir
Obsrvese que fi es el tanto por uno de observaciones que estn en la clase ci.
Multiplicado por
clase.
o lo que es lo mismo,
Frecuencia relativa:
Frec.
Abs.
Frec.
Rel.
Frec. Abs.
Acumu.
ni
fi
Ni
Fi
c1
n1
...
...
cj
nj
...
...
ck
nk
n
N1 = n1
...
...
...
...
...
...
Nk = n
Fk = 1
1.7.4.1 Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li-1 -- li
ni
fi
Ni
0 -- 10
60 f1
60
10 -- 20 n2
0,
4
N2
20 -- 30 30 f3 170
30 -100
100 -200
n4
0,
1
N4
n5 f5 200
n
Solucin:
Sabemos que la ltima frecuencia acumulada es igual al total de observaciones, luego
n=200.
Como N3=170 y n3=30, entonces
N2=N3-n3=170-30=140.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa
correspondiente:
As:
N4=n4+N3=20+170 =190.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
ni
fi
0 -- 10
60 0,3 60
10 -- 20 80 0,4
20 -- 30 30
30 -100
100 -200
20
0
14
0
0,1
170
5
20 0,1
10
Ni
19
0
0,0
200
5
En cuanto a la eleccin de las clases, deben seguirse los siguientes criterios en funcin del
tipo de variable que estudiemos:
o bien
ai = li-li-1
Frec.
Abs.
Frec.
Rel.
Frec. Abs.
Acum.
Frec. Rel.
Acum.
ni
fi
Ni
Fi
l0 -- l1
c1
n1
N 1 = n1
F 1 = f1
...
...
...
...
...
lj-1 -- lj
cj
nj
Nj= Nj-1+nj
Fj = Fj-1 + fj
...
...
...
...
...
lk-1 -lk
ck
nk
Nk=n
Fk =1
...
...
A la hora de seleccionar los intervalos para las variables continuas, se plantean varios
problemas como son el nmero de intervalos a elegir y sus tamaos respectivos. La
notacin ms comn que usaremos para un intervalo sea
intervalos, que
.
La amplitud de cada intervalo
ai = li -li-1
A= lk - l0
1.7.4.4 Observacin
Podra ocurrir que la cantidad a fuese un nmero muy desagradable a la hora de escribir los
intervalos (ej. a=10,325467). En este caso, es recomendable variar simtricamente los
extremos,
(ej. a=10).
Recorrido:
Amplitud: ai= li - li-1
Marca de clase:
Frecuencias rectificadas:
1.7.4.5 Ejemplo
Sobre un grupo de n=21 personas se realizan las siguientes observaciones de
sus pesos, medidos en kilogramos:
58 42 51 54 40 39 49
56 58 57 59 63 58 66
70 72 71 69 70 68 64
En primer lugar hay que observar que si denominamos X a la variable ``peso de cada
persona'' esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser
ordenados los resultados en una tabla estadstica, esto se ha de hacer agrupndolos en
intervalos de longitud conveniente. Esto nos lleva a perder cierto grado de precisin. Para
que la perdida de informacin no sea muy relevante seguimos el criterio de utilizar
intervalos (no son demasiadas las observaciones). En este punto podemos
tomar bien k=4 o bien k=5. Arbitrariamente se elige una de estas dos posibilidades. Por
ejemplo, vamos a tomar k=5.
Lo siguiente es determinar la longitud de cada intervalo, ai
. Lo ms cmodo
es tomar la misma longitud en todos los intervalos, ai=a (aunque esto no tiene por qu ser
necesariamente as), donde
M.
f.a.
clase
f.r.
f.a.a
.
f.r.a.
ci
ni
fi
Ni
Fi
i=
39 -- 45,6
1
42,3
0,142
8
0,142
8
i=
2
45,6 -52,2
48,9
0,095
2
0,238
1
i=
3
52,2 -58,8
55,5
0,285
7
11
0,523
8
i=
4
58,8 -65,4
62,1
0,142
8
14
0,666
7
i=
65,4 -- 72
5
68,7
0,333
3
21
21
Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con
cantidades ms simples a la hora de construir los intervalos, es la siguiente. Como la regla
para elegir l0 y l5 no es muy estricta podemos hacer la siguiente eleccin:
M.
f.a.
clase
f.r.
f.a.a
.
f.r.a.
ci
ni
fi
Ni
Fi
i=
38 -- 45
1
41,5
0,142
8
0,142
8
i=
45 -- 52
2
48,5
0,095
2
0,238
1
i=
52 -- 59
3
55,5
0,333
3
12
0,571
4
i=
59 -- 66
4
62,5
0,142
8
15
0,714
3
i=
66 -- 73
5
69,5
0,285
7
21
21
Diagramas de sectores
(tambin llamados tartas). Se divide un crculo en tantas porciones como
clases existan, de modo que a cada clase le corresponde un arco de
crculo proporcional a su frecuencia absoluta o relativa (figura 1.3).
Pictogramas
Expresan con dibujos alusivo al tema de estudio las frecuencias de las
modalidades de la variable. Estos grficos se hacen representado a
diferentes escalas un mismo dibujo, como vemos en la figura 1.5.
El escalamiento de los dibujos debe ser tal que el rea1.1 de cada uno de ellos sea
proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos
suele usarse en los medios de comunicacin, para que sean comprendidos por el
pblico no especializado, sin que sea necesaria una explicacin compleja.
Segn hemos visto existen dos tipos de variables cuantitativas: discretas y continuas.
Vemos a continuacin las diferentes representaciones grficas que pueden realizarse para
cada una de ellas as como los nombres especficos que reciben.
1.9.4.1 Grficos para variables discretas
xi ni
fi
Ni
Fi
1/8 1 1/8
3/8 4 4/8
3/8 7 7/8
1/8 8 8/8
n=
8
1.9.4.3 Ejemplo
Clasificadas 12 familias por su nmero de hijos se obtuvo:
Nmero de hijos
1 2 3 4
(xi)
Frecuencias (ni) 1 3 5 3
ni
fi
Ni
0,083
0,250
0,416
0,250
12
12
Cuando las variables son continuas, utilizamos como diagramas diferenciales los
histogramas y los polgonos de frecuencias.
Un histograma se construye a partir de la tabla estadstica, representando sobre cada
intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular la
altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo y el rea de los mismos.
El polgono de frecuencias se construye fcilmente si tenemos representado previamente el
histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que
corresponden a las marcas de clase. Para representar el polgono de frecuencias en el primer
y ltimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma
amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que
corresponden a sus marcas de clase. Obsrvese que de este modo, el polgono de
frecuencias tiene en comn con el histograma el que las reas de la grficas sobre un
intervalo son idnticas. Veanse ambas grficas diferenciales representadas en la parte
superior de la figura 1.8.
El diagrama integral para una variable continua se denomina tambin polgono de
frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los
extremos de los intervalos en los que hemos organizado la tabla de la variable, y en
ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro
modo, el polgono de frecuencias absolutas es una primitiva del histograma. Vase la parte
1 2
2 -- 4
3 1
4 -- 6
5 4
6 -- 8
7 3 10
8 - 10
9 2 12
12
1.9.4.5 Ejemplo
La siguiente distribucin se refiere a la duracin en horas (completas) de un
lote de 500 tubos:
Duracin en
horas
Nmero de
tubos
300 -- 500
50
500 -- 700
150
700 -- 1.100
275
ms de 1.100
25
Total 500
Intervalos
ai
ni
fi
fi'
Fi
300 -- 500
20
0
50
0,1
0,1
0,10
0
0
500 -- 700
20
0
150
0,3
0,4
0,30
0
0
700 -1.100
40
0
275
1.100 -1.300
20
0
25
0,0
1,0
0,05
5
0
n=50
0
Por otro lado, mirando la figura 1.9 se ve que sumando frecuencias relativas, hasta las 900
horas de duracin hay
0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo ms directo viendo a qu altura corresponde al valor 900
en el diagrama de frecuencias acumuladas (figura 1.10).
Como en total son 500 tubos, el nmero de tubos con una duracin igual o menor que 900
horas es
Diagrama
V. Discreta
Diferencial (barras)
Integral (en escalera)
V. Continua
1.11 Problemas
Ejercicio 1..1. Clasificar las siguientes variables:
1. Preferencias polticas (izquierda, derecha o centro).
2. Marcas de cerveza.
3. Velocidad en Km/h.
4. El peso en Kg.
5. Signo del zodiaco.
6. Nivel educativo (primario secundario, superior).
7. Aos de estudios completados.
8. Tipo de enseanza (privada o pblica).
9. Nmero de empleados de una empresa.
10. La temperatura de un enfermo en grados Celsius.
11. La clase social (baja, media o alta).
12. La presin de un neumtico en
Ejercicio 1..2. Clasifique las variables que aparecen en el siguiente
cuestionario.
1. Cul es su edad?
2. Estado civil:
(a) Soltero
(b) Casado
(c) Separado
(d) Divorciado
(e) Viudo
3. Cuanto tiempo emplea para desplazarse a su trabajo?
4. Tamao de su municipio de residencia:
(a) Municipio pequeo (menos de 2.000 habitantes)
(b) Municipio mediano (de 2.000 a 10.000 hab.)
(c) Municipio grande (de 10.000 a 50.000 hab.)
(d) Ciudad pequea (de 50.000 a 100.000 hab.)
(e) Ciudad grande (ms de 100.000 hab.)
5. Est afiliado a la seguridad social?
Ejercicio 1..3.
En el siguiente conjunto de datos, se proporcionan los pesos (redondeados a
libras) de nios nacidos en cierto intervalo de tiempo:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6,
8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
1. Construir una distribucin de frecuencia de estos pesos.
2. Encontrar las frecuencias relativas.
3. Encontrar las frecuencias acumuladas.
4. Encontrar las frecuencias relativas acumuladas.
5. Dibujar un histograma con los datos del apartado a.
6. Por qu se ha utilizado un histograma para representar estos datos, en
lugar de una grfica de barras?
Variable Cuantitativa
Cuando los mdicos entrevistan a un paciente, les es importante cuantificar la medida de ciertas variables
como por ejemplo: el peso, la estatura, la edad , la frecuenica respiratoria y la frecuenica cardiaca.
El objetivo es completar estas variables y sus escalas de medicin en una Base de Datos de los expedientes de
sus pacientes.
Variable Cuantitativa Discreta.
Cuntas pulsaciones por minuto tienes o bin cuantas respiraciones por minuto. Esta medicin siempre es un
entero. Por lo tanto son variables cuantitativas discretas.
El mdico podra preguntar cuantos hijos hay en una familia, por lo cual el resultado es siempre un nmero
entero.
Las variables cuantitativas se clasifican entonces como discretas en este caso. Ejemplos: cuantas piezas
dentales tiene, cuantos dedos tiene, cuantos riones tiene,cuantas prdidas ha tenido una madre,etc.
Variable Cuantitativa Contnua:
Cuando medimos una variable como el peso necesitamos discriminar si la medicin es un entero o bin un con
nmero con decimales. El mdico podra indicarle que se coloque en una balanza, a fn de conocer cuanto
pesa.
La escala del peso se expresa en libras-onzas, por lo cual el paciente podra tener un peso de 130.5 lb. En forma
similar, la variabler estatura de un futbolista se mide utilizando una escala mtrica, por ejemplo 1.90 mt.
Analizando la variable edad, sta se mide en aos- meses-dias. La edad de un beb entonces, es 6 meses, la
edad de un nio puede ser 18 meses, lo cual equivale a 1.5 aos. Aunque la edad se expresa en nmeros enteros,
se cuantifica en escala cuantitativa contnua.
El estudiante podra practicar clasificar diferentes variables asociando su escala de medicin correspondiente
asi:
No. de glbulos Blancos
No. de Cursos Asignados
Cuantitativa contnua
cuantitativa discreta.
Nivel de medida
El nivel de medida de una variable en matemticas y estadsticas, tambin llamado escala
de medicin, es una clasificacin acordada con el fin de describir la naturaleza de la
informacin contenida dentro de los nmeros asignados a los objetos y, por lo tanto, dentro
de una variable. Segn la teora de las escalas de medida, varias operaciones matemticas
diferentes son posibles dependiendo del nivel en el cual la variable se mide. [editar] Escalas
de medicin
Escalas de medicin son una sucesin de medidas que permiten organizar datos en orden
jerrquico. Las escalas de medicin, pueden ser clasificadas de acuerdo a una degradacin
de las caractersticas de las variables. Estas escalas son: nominales, ordinales, intervalares o
racionales. Segn pasa de una escala a otra el atributo o la cualidad aumenta. Las escalas de
medicin ofrecen informacin sobre la clasificacin de variables discretas o continuas,
tambin mas conocidas como escalas grandes o pequeas. Toda vez que dicha clasificacin
determina la seleccin de la grfica adecuada.
Niveles de clasificacinB
La medicin puede definirse como la asignacin de numerales a objetos o sucesos
siguiendo ciertas reglas Stevens (1946). El autor de esta definicin desarroll un mtodo
para clasificar los diferentes resultados de las mediciones en lo que llam niveles de
medicin. Un nivel de medicin es la escala que representa una jerarqua de precisin
dentro de la cual una variable puede evaluarse, en funcin de las caractersticas que rigen
las escalas. Por ejemplo, la variable estatura puede analizarse en diferentes niveles de
medida. Un conjunto de personas pueden clasificarse en altos y bajos, A y B
respectivamente, creando dos grupos. Para ello no es necesario recurrir a ninguna cinta
mtrica, simplemente basta observar quienes destacan sobre los dems (el grupo de altos) y
el resto completarn el grupo de bajos. El nivel de medicin que corresponde a esta forma
de medir es nominal.
Tambin podran alinearse a los sujetos y ordenarlos segn su altura, el primero sera el ms
alto y el ltimo el ms bajo, el resto se organizara de forma que cada persona tuviese
delante a uno ms alto y detrs a uno ms bajo. El nivel de medicin en este caso es
ordinal. Hasta el momento no es posible decir cunto es una persona ms alta que otra.
A travs del nmero de personas que hay entre dos sujetos, por ejemplo, Andra y Juan en
la fila ordenada anteriormente. En este caso adems del orden se conoce la magnitud de la
altura. Si en lugar de utilizar el nmero de personas se recurre a una regla se puede ofrecer
otra medida de la altura. Esta forma de medir es propia del nivel de intervalos, que permite
saber la magnitud de los elementos comparando unos con otros.
La cuarta posibilidad es utilizar un metro que sita el cero en el mismo suelo y, por lo tanto,
la altura se define en funcin de la distancia desde la cabeza al suelo (valor cero absoluto
Las variables de intervalo y de razn tambin estn agrupadas como variables continuas.
a ellas, entonces pertenecen a la misma categora, y ese es el nico significado que las
medidas nominales tienen.
Esta escala comprende variables categricas que se identifican por atributos o cualidades.
Las variables de este tipo nombran e identifican distintas categoras sin seguir un orden. El
concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un nmero es para
identificar. Un nmero no tiene mayor valor que otro. Un ejemplo son los nmeros de las
camisetas de los jugadores de un equipo de bisbol. El nmero mayor no significa que tiene
el mayor atributo que el nmero menor, es aleatorio o de capricho personal a quien otorga
el nmero. tambin encontramos escala de altura,escala de perspectiva,escala de
anchura,escala de profundidad Para el procesamiento de datos, los nombres pueden ser
remplazados por nmeros, pero en ese caso el valor numrico de los nmeros dados es
irrelevante. El nico tipo de comparaciones que se pueden hacer con este tipo de variables
es el de igualdad o diferencia. Las comparaciones mayor queo menor que no existen
entre nombres, as como tampoco operaciones tales como la adicin, la substraccin, etc.
Ejemplos de medidas nominales son algunas de estas variables: estado marital, gnero,
raza, credo religioso, afiliacin poltica, lugar de nacimiento, el nmero de seguro social, el
sexo, los nmeros de telfono, entre otros.
La nica medida de tendencia central que se puede hacer es la moda. La dispersin
estadstica se puede hacer con tasa de variacin, ndice de variacin cualitativa, o mediante
entropa de informacin. No existe la desviacin estndar.
Ejemplos de variables ordinales son: la dureza de los minerales, los resultados de una
carrera de caballos, actitudes como preferencias, conservatismo o prejuicio, el nivel
socioeconmico, orden de llegada de los corredores, entre otros. Las medidas de tendencia
central de una variable ordinal pueden representarse por su moda o su mediana. La mediana
proporciona ms informacin.
Los nmeros asignados a los objetos tienen todas las caractersticas de las medidas de
intervalo y adems tienen razones significativas entre pares arbitrarios de nmeros.
Operaciones tales como la multiplicacin y la divisin tienen significado.
La posicin del cero no es arbitraria para este tipo de medida. Las variables para este nivel
de medida se llaman variables racionales. La mayora de las cantidades fsicas, tales como
la masa, longitud, energa, se miden en la escala racional, as como tambin la temperatura
(en Kelvins) relativa al cero absoluto. Las medidas de tendencia central de una variable
medida a nivel racional pueden representarse por la moda, la mediana, el promedio
aritmtico o su promedio geomtrico. Lo mismo que con la escala de intervalos, el
promedio aritmtico proporciona la mayor informacin.
Por ejemplo; el ingreso; el cero representara que no recibe ingreso en virtud de un trabajo,
la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables
racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razn
comienza desde el cero y aumenta en nmeros sucesivos iguales a cantidades del atributo
que est siendo medido.
como tambin vemos las escalas de: -escala de altura -escala de anchura -escala de
perspectiva -escala de profundidad
Para variables cuantitativas, es decir, aquellas que se miden en una escala de intervalo o de razn, las medidas de asociacin m
utilizadas son la covarianza y el coeficiente de correlacin de Pearson. Ambas medidas hacen referencia a un tipo particular d
asociacin: la asociacin lineal.
El anlisis conjunto de dos variables cuantitativas puede ir acompaado del anlisis unidimensional de cada una de ellas p
separado, as como de grficos que pongan de manifiesto el patrn de comportamiento conjunto de ambas variables.
la secuencia es:
Analizar
Correlaciones
Bivariadas
Por defecto, estn activadas las opciones Coeficiente de correlacin de Pearson, Prueba de significacin Bilateral y Marcar la
correlaciones significativas. Otras medidas de asociacin son los coeficientes Tau-b de Kendall y Spearman para variables ordinale
a los que ya se ha hecho referencia en el epgrafe anterior.
coeficiente
de
y se define como:
correlacion
de
Pearson
es
la
principal
medida
de
asociacin
lineal
entre
dos
variables
cuantitativ
Este coeficiente, cuyo valor no depende de las unidades de medida de las variables, est acotado entre -1 y +1; su signo indica
direccin, positiva o negativa, de la asociacin lineal y su valor absoluto la intensidad de la misma. En caso de asociacin line
perfecta toma el valor |1| ; si no hay asociacin lineal toma el valor 0, lo cual no implica que no pueda haber asociacin de otr
tipo.
Bilateral (a doble cola) si se contrasta la hiptesis nula de ausencia de asociacin lineal sin especificar de antemano en
hiptesis alternativa la direccin o sentido de la asociacin, en caso de que sta exista.
Unilateral (a una sola cola) si se contrasta la hiptesis nula especificando de antemano en la hiptesis alternativa
direccin de la asociacin. Si se desea un contraste unilateral es necesario activar la opcin correspondiente.
OPCIONES
Productos cruzados y covarianzas. La suma de los productos cruzados es el numerador del coeficiente de correlacin line
que dividido por n-1 recibe el nombre de covarianza cuya expresin es:
La covarianza es una medida de asociacin lineal cuyo signo indica la direccin o sentido de la asociacin, pero cuyo valor numric
El cuadro de dilogo Opciones permite modificar la forma en que se gestionan los valores missing. Por defecto, est activada
opcin Excluir casos segn pareja con la que se calculan los coeficientes de correlacin utilizando todos los casos para los que exis
informacin sobre las dos variables. Como alternativa puede activarse la opcin Excluir casos segn lista con la que se calculan lo
coeficientes de correlacin utilizando nicamente los casos para los que se dispone de informacin sobre todas las variables.
nicamente se han seleccionado dos variables en el cuadro de dilogo Correlaciones bivariadas ambas opciones proporcionan l
mismos resultados.
Dato estadstico
Un dato estadstico es cada uno de los valores que se ha
obtenido al realizar un estudio estadstico.
Si lanzamos una moneda al aire 5 veces obtenemos 5 datos:
cara, cara, cruz, cara, cruz.
Tipos de variables
Variable independiente
Una v a r i a b l e i n d e p e n d i e n t e es aquella cuyo valor no depende del de otra
variable.
La v a r i a b l e i n d e p e n d i e n t e en una funcin se suele representar por x .
La v a r i a b l e i n d e p e n d i e n t e se representa en el eje de abscisas.
Variable dependiente
Una v a r i a b l e d e p e n d i e n t e es aquella cuyos valores dependen de los que tomen
otra variable.
La v a r i a b l e d e p e n d i e n t e en una funcin se suele representar por y .
La v a r i a b l e d e p e n d i e n t e se representa en el eje ordenadas.
La variable y est en funcin de la variable x .
Variables estadsticas
Variable cualitativa
Las v a r i a b l e s c u a l i t a t i v a s se refieren a c a r a c t e r s t i c a s o c u a l i d a d e s
que n o pueden ser medidas con n m e r o s . Podemos distinguir dos tipos:
Variable cuantitativa
Una v a r i a b l e c u a n t i t a t i v a es la que se expresa mediante un n m e r o , por
tanto se pueden realizar op e r a c i o n e s a r i t m t i c a s con ella. Podemos distinguir
dos tipos:
Variable discreta
Una v a r i a b l e d i s c r e t a es aquella que toma v a l o r e s a i s l a d o s , es decir n o
admite v a l o r e s i n t e r m e d i o s entre dos valores especficos. Por ejemplo:
El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una v a r i a b l e c o n t i n u a es aquella que puede tomar v a l o r e s c o m p r e n d i d o s
e n t r e d o s n m e r o s . Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la prctica medimos la altura con dos decimales, pero tambin se podra dar con
tres decimales.
Variable aleatoria
Se llama v a r i a b l e a l e a t o r i a a t o d a f u n c i n q u e a s o c i a a c a d a
elemento del espacio muestral E un nmero real.
Ejemplo
k = 6, al lanzar una moneda 10 veces y obtener 6 caras.
variable
aleatoria
continua ,
X,
sigue
una
1.
2.
Variable estadstica
Una
variable
estadstica
es
cada
una
de
las
Variable cualitativa
Las variables cualitativas se refieren a caractersticas o
cualidades que no pueden ser medidas con nmeros. Podemos
distinguir dos tipos:
numricas
que
no
admiten
un
criterio
de
orden .
Po r
ejemplo:
El
estado
civil,
con
las
siguientes
modalidades:
soltero,
nota
en
un
examen:
suspenso,
aprobado,
notable,
sobresaliente.
Puesto conseguido en una prueba deportiva: 1, 2, 3, ...
Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un
nmero, por tanto se pueden realizar o peraciones aritmticas
c o n e l l a . Po d e m o s d i s t i n g u i r d o s t i p o s :
V a r i a b l e di s c r e t a
Una
variable
discreta
es
aquella
que
toma
valores
Variable continua
Una variable continua es aquella que puede tomar valores
comprendidos entre dos nmeros . Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la prctica medimos la altura con dos decimales, pero
tambin se podra dar con tres decimales.
Muestra estadstica
Una muestra es un conjunto representativo de la poblacin
de referencia.
El nmero de individuos de una muestra es menor que el de
la poblacin.
Muestreo
E l m u e s t r e o e s l a r e u n i n d e d a t o s q u e s e d e s e a e s t u d i a r,
obtenidos
de
una
proporcin
reducida
representativa
de
la
poblacin.
Po d e m o s d i s t i n g u i r v a r i o s t i p o s d e m u e s t r e o :
un
muestra,
se
muestreo
numeran
aleatorio
los
simple
elementos
de
para
la
obtener
poblacin
una
y
se
un
muestreo
aleatorio
sistemtico
se
elige
un
un
muestreo
aleatorio
estratificado
se
divide
la
Individuo
Un
individuo
unidad
estadstica
es
cada
uno
de
los
Todo problema de investigacin cientfica, an el ms abstracto, implica de algn modo una tarea
de medicin de los conceptos que intervienen en el mismo. Porque si tratamos con objetos como
una especie vegetal o un comportamiento humano nos veremos obligados ya sea a describir sus
caractersticas o a relacionarse stas con otras con las que pueden estar conectadas: en todo caso
tendremos que utilizar determinadas variables tamao, tipo de flor, semilla, o las variables que
definan el comportamiento de estudio- y tendremos que encontrar el valor que stas asumen en el
caso estudiado. En eso consiste, desde el punto de vista lgico ms general, la tares de medir.
DEFINICIN DE ESCALA
Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de cualquier clase;
instrumento para asignar un nmero o guarismo que indicar cunto hay de algo; un recurso de
medicin que provee un conjunto de normas (numeradas de acuerdo con ciertas reglas de trabajo)
con las que se puede comparar el objeto que ser medido, para asignarle un nmero o valor
matemtico que represente su magnitud. El trmino es de amplia aplicacin: una escala de alguna
clase est incluida en toda medicin o estimacin. Implcito en cada caso hay un conjunto de reglas
para asignar nmeros o valores: son estas reglas las que dan significado a las cantidades. Los
objetos pueden ser perceptuales o conceptuales.
Una escala puede concebirse como un continuo de valores ordenados correlativamente que admite
un punto inicial y otro final. Si evaluamos el rendimiento acadmico de estudiantes podemos
asignar el valor cero al mnimo rendimiento imaginable al respecto; al mayor rendimiento posible
podemos atribuirle un valor de 100, 20, 10 o 7 puntos, segn resulte ms prctico. Con estos dos
valores tendramos ya marcados los lmites de nuestra escala; para concluir de confeccionarla ser
necesario asignar a los posibles rendimientos intermedios puntajes tambin intermedios. Con ello
obtendremos una escala capaz de medir la variable rendimiento acadmico a travs de los
indicadores concretos de los trabajos presentados por los estudiantes, de sus exmenes, pruebas
y otras formas de evaluacin posibles.
ESCALA NOMINAL.No poseen propiedades cuantitativas y sirven nicamente para identificar las clases. Los datos
empleados con las escalas nominales constan generalmente de la frecuencia de los valores o de la
tabulacin de nmero de casos en cada clase, segn la variable que se est estudiando. El nivel
nominal permite mencionar similitudes y diferencias entre los casos particulares. Los datos
evaluados en una escala nominal se llaman tambin "observaciones cualitativas", debido a que
describen la calidad de una persona o cosa estudiada, u "observaciones categricas" porque los
valores se agrupan en categoras. Por lo regular, los datos nominales o cualitativos se describen en
trminos de porcentaje o proporciones. Para exhibir este tipo de informacin se usan con mayor
frecuencia tablas de contingencia y grficas de barras.
ESCALA ORDINAL.Las clases en las escalas ordinales no solo se diferencian unas de otras (caracterstica que define
a las escalas nominales) sino que mantiene una especie de relacin entre s. Tambin permite
asignar un lugar especfico a cada objeto de un mismo conjunto, de acuerdo con la intensidad,
fuerza, etc.; presentes en el momento de la medicin. Una caracterstica importante de la escala
ordinal es el hecho de que, aunque hay orden entre las categoras, la diferencia entre dos
categoras adyacentes no es la misma en toda la extensin de la escala. Algunas escalas consisten
en calificaciones de mltiples factores que se agregan despus para llegar a un ndice general.
Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala de posicin",
donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en las escalas
nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.
ESCALA DE INTERVALO.Refleja distancias equivalentes entre los objetos y en la propia escala. Es decir, el uso de sta
escala permite indicar exactamente la separacin entre 2 puntos, lo cual, de acuerdo al principio de
isomorfismos, se traduce en la certeza de que los objetos as medidos estn igualmente separados
a la distancia o magnitud expresada en la escala.
ESCALA DE RAZN.Constituye el nivel ptimo de medicin, posee un cero verdadero como origen, tambin
denominada escala de proporciones. La existencia de un cero, natural y absoluto, significa la
posibilidad de que el objeto estudiado carezca de propiedad medida, adems de permitir todas las
operaciones aritmticas y el uso de nmeros representada cantidades reales de la propiedad
medida.
Con esto notamos que esta escala no puede ser usada en los fenmenos psicolgicos, pues no se
puede hablar de cero inteligencia o cero aprendizaje, etc.
As de una escala de razn podremos pasar a una escala de intervalo, ordinal o nominal.
Pero nuca en sentido inverso, por ejemplo pasar en una propiedad medida a nivel de escala
nominal a una escala de intervalo (ej: el sexo).
Si estamos con variables, el proceso ser el mismo, es decir se admite la posibilidad de
transformar una variable cuantitativa continua en discreta, ordinal o categrica, pero no en
sentido inverso.
Escala ordinal
Los objetos pueden manifestar determinada caracterstica en mayor grado unos que otros.
Ej. La dureza de los minerales.
Supongamos que se dispone de un conjunto de n objetos (o1, o2, ., on)y cada uno posee una
cierta magnitud de una determinada caracterstica [m(o1), m(o2), ., m(on)].
La escala para asignar nmeros a los objetos [n(o1), n(o2), ., n(on)],de modo que reflejen
esos diferentes grados en que los objetos presenten la caracterstica, ha de cumplir las
siguientes condiciones:
Si n(oi) = n(oj), entonces m(oi) = m(oj)
Si n(oi) > n(oj), entonces m(oi) > m(oj)
Si n(oi) < n(oj), entonces m(oi) < m(oj)
Transformacin admisible: cualquier tranformacin es vlida siempre que preserve el orden
de magnitud, creciente o decreciente, en que los objetos presentan determinada
caracterstica.
Escala de intervalos
Permite establecer la igualdad o desigualdad de las diferencias entre las magnitudes de los
objetos medidos. Ej. Termmetro, calendario.
Supongamos que los valores asignados a los objetos sean una representacin numrica
correcta de sus relaciones empricas.
Para todo cuarteto de objetos genricos, oI, oj, ok, ol, los valores asignados n(oi), n(oj),
n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada caracterstica
m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:
Si n(oi) - n(oj) = n(ok) - n(ol),
entonces m(oi) - m(oj) = m(ok) - m(ol).
Si n(oi) - n(oj) > n(ok) - n(ol),
entonces m(oi) - m(oj) > m(ok) - m(ol).
Si n(oi) - n(oj) < n(ok) - n(ol),
entonces m(oi) - m(oj) < m(ok) - m(ol).
Las escalas de intervalo sirven para medir caractersticas en las que el valor cero no
significa ausencia de dicha caracterstica.
Los valores en una escala de razn tienen un valor absoluto, no arbitrario, o valor cero
absoluto que s significa ausencia de caracterstica.
Para todo cuarteto de objetos genricos, oi, oj, ok, ol, los valores asignados n(oi), n(oj),
n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada caracterstica
m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones:
Si n(oi)/n(oj) = n(ok)/n(ol),
entonces m(oi)/m(oj) = m(ok)/m(ol).
Si n(oi)/n(oj) > n(ok)/n(ol),
entonces m(oi)/m(oj) > m(ok)/m(ol).
Si n(oi)/n(oj) < n(ok)/n(ol),
entonces m(oi)/m(oj) < m(ok)/m(ol).
Al tener un origen de escala absoluto, la nica transformacin admisible para la escala de
razn es del tipo: t[n(oi)] = a . n(oI), siendo a > 0.
Tipo de
escala
Conclusiones acerca
de
Transformacin admisible
Ejemplos
Sexo, raza, estado civil,
igualdad/desigualdad
diagnostico clnico
a + b.x (b>0)
Calendario, temperatura,
inteligencia
b.x (b>0)
RAZON
Igualdad o desigualdad
de razones
Variables.Clasificacin y Notacin
- Variables nominales
- Variables ordinales
- Variables de intervalo
- Variables de razn
Este tipo de clasificacin rara vez se utiliza, en su lugar se distinguen tres grandes tipos de
variables, que engloban las cuatro derivadas del tipo de escala:
Cualitativa
Cuasicuantitativa
- V. independiente
- V. dependiente
- V. contaminante o V. intermedia .
NOTACIN DE VARIABLES
Para simbolizar las variables estadsticas se utilizan letras maysculas del alfabeto latino,
afectadas por un subndice, para diferenciarlas de los valores constantes.
El Smbolo de Sumar o Sumatorio
Sean una serie de n nmeros, simbolizados por X1, X2, ., Xn. la expresin (X1 + X2)
indica la suma del primer nmero de la serie y el segundo.
La expresin (X1 + X2 + . + Xn) indica la suma de los n valores de la serie.
Reglas de sumatorio
ni
pi
Pi
Suramri
24
ca
0,16 16
Nortefric
60
a
0,40 40
Centrofri
12
ca
0,08 8
Esteeuro
pa
18
0,12 12
China
21
0,14 14
Surasia
15
0,10 10
n=15
1,00 100
0
ni
pi
Pi
na pa
Pa
Nula
18 0,15 15 18 0,15 15
Mnima
42 0,35 35 60 0,50 50
Modera
48 0,40 40 108 0,90 90
da
Mxima 12 0,10 10 120 1,00 100
120 1,00 100
El nmero total de observaciones, n, debe ser la suma del nmero de observaciones de cada
clase, ni, y debe coincidir con el valor de la frecuencia absoluta acumulada de la ltima
modalidad de la variable.
Se dan casos en los que la variable se expresa en un amplio nmero de valores, entonces
solo cabe la estrategia de agrupar en intervalos estos valores.
Para calcular el nmero de intervalos aplicaremos (segn Sturges):
N de intervalos = E(1,5 + 3,3 log n)
Donde E representa la parte entera del resultado.
Tambien se puede hallar (segn Kaiser), el nmero de intervalos no debe exceder nunca de
la raiz cuadrada de n
Distribucin de frecuencias de los datos agrupados en intervalos
ni
pI
na pa
63-70 2
0,02 2
0,02
71-78 8
0,08 10 0,10
79-86 8
0,08 18 0,18
26 0,26 63 0,63
103110
17 0,17 80 0,80
111118
0,09 89 0,89
119126
0,07 96 0,96
127134
100 1,00
Intervalo: sinnimo del concepto de modalidad, es cada uno de los grupos de valores que
ocupan una fila en una distribucin de frecuencias.
Lmites aparentes: virtuales o informados, son los valores mayor y menor de cada
intervalo, teniendo en cuenta el nivel de precisin del instrumento de medida.
Lmites reales o exactos: son los valores mximo y mnimo que tendra cada intervalo si el
instrumento de medida tuviera una precisin perfecta.
Punto medio del intervalo: es la semisuma de los lmites exactos o de los lmites
aparentes.
Amplitud del intervalo: es la diferencia entre el lmite exacto superior y el lmite exacto
inferior.