Sunteți pe pagina 1din 44

1.

ASPECTOS GENERALES:
HISTORIA DE LA ESTADISTICA
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y
militares (clculo de recursos y hombres disponibles). La investigacin histrica revela
que se realizaron 69 censos para calcular los impuestos, determinar los derechos de
voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron
emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la
poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda
uno de estos empadronamientos de la poblacin bajo la autoridad del imperio.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante
durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos
de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas
cientficos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la
palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del
gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el
trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor
intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las
ms variadas situaciones.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.

CONCEPTOS DE LA ESTADISTICA

Estadstica: es un campo del conocimiento que permite al investigador


deducir y evaluar conclusiones acerca de una poblacin a partir de informacin
proporcionada por una muestra.
Especficamente, la estadstica trata de teoremas, herramientas, mtodos y
tcnicas que se pueden usar en:
a. Recoleccin, seleccin y clasificacin de datos.
b. Interpretacin y anlisis de datos.
c. Deduccin y evolucin de conclusiones y de su confiabilidad, basada en
datos mustrales.
Los mtodos de la estadstica fueron desarrollados para el anlisis de datos
muestreados, as como para propsitos de inferencia sobre la poblacin de la
que se selecciono la muestra.
La estadstica como ciencia, cubre un extenso campo donde poder aplicarla.
Se agrupa en 2 grandes reas: estadstica descriptiva y estadstica inferencial,
que desempean funciones distintivas, pero complementarias en el anlisis.
Es importante que todo profesional que utilice la estadstica como herramienta
auxiliar de trabajo, posea un mnimo de conocimientos y habilidades prcticas
en aquellas tcnicas que le facilitarn el buen desarrollo de esta actividad.
Estadstica descriptiva.
La estadstica descriptiva comprende las tcnicas que se emplean para resumir
y describir datos numricos.
Son sencillas desde el punto de vista matemtico y su anlisis se limita a los
datos coleccionados sin inferir en un grupo mayor.
El estudio de los datos se realiza con representaciones grficas, tablas,
medidas de posicin y dispersin.
Estadstica inferencial.
El problema crucial de la estadstica inferencial es llegar a proposiciones acerca
de la poblacin a partir de la observacin efectuada en muestras bajo
condiciones de incertidumbre. sta comprende las tcnicas que aplicadas en
una muestra sometida a observacin, permiten la toman de decisiones sobre
una poblacin o proceso estadstico. En otras palabras, es el proceso de hacer
predicciones acerca de un todo basado en la informacin de una muestra.
La inferencia se preocupa de la precisin de los estadgrafos descriptivos ya
que estos se vinculan inductivamente con el valor poblacional.
CONCEPTOS BASICOS
Poblacin
Es el conjunto de todos los elementos que presentan una caracterstica comn
determinada, observable y medible. Por ejemplo, si el elemento es una
persona, se puede estudiar las caractersticas edad, peso, nacionalidad, sexo,
etc.

Los elementos que integran una poblacin pueden corresponder a personas,


objetos o grupos (por ejemplo, familias, fbricas, empresas, etc).
Las caractersticas de la poblacin se resumen en valores llamados
parmetros.
Muestra
Una muestra es un conjunto representativo de la poblacin de referencia, el
nmero de individuos de una muestra es menor que el de la poblacin.
La mayora de los estudios estadsticos, se realizan no sobre la poblacin, sino
sobre un subconjunto o una parte de ella, llamado muestra, partiendo del
supuesto de que este subconjunto presenta el mismo comportamiento y
caractersticas que la poblacin. En general el tamao de la muestra es mucho
menor al tamao de la poblacin.
Los valores o ndices que se concluyen de una muestra se llaman estadgrafos
y estos mediante mtodos inferenciales o probabilsticos, se aproximan a los
parmetros poblacionales.
Variable
Se llama variable a una caracterstica que se observa en una poblacin o
muestra, y a la cual se desea estudiar. La variable puede tomar diferentes
valores dependiendo de cada individuo. Una variable se puede clasificar de la
siguiente manera.
a) Variable cuantitativa: es aquella que toma valores numricos. Dentro de
ella, se subdividen en:
Continua: son valores reales. Pueden tomar cualquier valor dentro de un
intervalo. Ej. Peso, estatura, sueldos.
Discreta: toma valores enteros. Ej. N de hijos de una familia, n de alumnos
de un curso.
b) Variable cualitativa: es aquella que describe cualidades. No son
numricas y se subdividen en:
Nominal: son cualidades sin orden. Ej. Estado civil, preferencia por una marca,
sexo, lugar de residencia.
Ordinal: son cualidades que representan un orden y jerarqua. Ej. Nivel
educacional, das de la semana, calidad de la atencin, nivel socioeconmico.
Individuo
Un individuo o unidad estadstica es cada uno de los elementos que componen
la poblacin.
Muestreo
El muestreo es la reunin de datos que se desea estudiar, obtenidos de una
proporcin reducida y representativa de la poblacin.

Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos
valores: cara y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara,
cara, cruz, cara, cruz.
METODOS ESTADISTICOS
ETAPAS DEL MTODO ESTADSTICO
El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre
mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que acten
libremente, pero se registran las diferentes observaciones y se analizan sus variaciones.
Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:
1. Planteamiento del problema.
2. Fijacin de los objetivos.
3. Formulacin de la hiptesis.
4. Definicin de la unidad de observacin y de la unidad de medida.
5. Determinacin de la poblacin y de la muestra.
6. La recoleccin.
7. Crtica, clasificacin y ordenacin.
8. Tabulacin.
9. Presentacin.
10. Anlisis.
11. Publicacin.
1. PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se
pretende estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible
sobre el o los fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre
otras cosas, la revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados
obtenidos por investigaciones similares, someter nuestras proposiciones bsicas a un anlisis
lgico; es decir, se debe hacer una ubicacin histrica y terica del problema.
2. FIJACIN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.
3. FORMULACIN DE LAS HIPTESIS
Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada.
Una hiptesis estadstica debe ser susceptible de docimar, esto es, debe poderse probar para su
aceptacin o rechazo.
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis
contraria se le llama Hiptesis Alternativa (H1).
4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA

La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la


poblacin estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin
de cuentas, es a ellas a las que se les har la medicin.
La unidad de observacin puede estar constituida por uno o varios individuos u objetos y
denominarse respectivamente simple o compleja.
El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo
qu unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen
una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres
vivientes; una poblacin puede estar constituida por los habitantes de un pas o por los peces de
un estanque, as como por los establecimientos comerciales de un barrio o las unidades de
vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino
infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro
de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito.
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar
las propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado
grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de
los elementos de una muestra con el fin de hacer inferencias respecto al total de la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los
elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente
que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para
asegurar la objetividad de la investigacin.
..
6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual
ha de partir, a menos que se tenga experiencia con muestras anlogo, de una o varias muestras
piloto en las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la
variabilidad de la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a
una estimacin de los parmetros con la precisin establecida.
El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de
las preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar
teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica,
etc.
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes
directos que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento
adecuado.
7. CRITICA, CLASIFICACIN Y ORDENACIN
Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos
recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin
por parte de quien depura para poder detectar falsedades en las respuestas, incomprensin a las
preguntas, respuestas al margen, amn de todas las posibles causas de nulidad de una pregunta o
nulidad de todo un cuestionario.

Separado el material de "desecho" con la informacin depurada se procede a establecer las


clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces
necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin
de las diferentes variables que intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas,
manualmente dispendiosas, puedan ser realizadas en corto tiempo.
8. LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al
lector sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo
menos: Un ttulodddd adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con
los correspondientes subttulos internos y la cuantificacin de los diferentes tems de las variables,
y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u
otorguen los crditos a la fuente de la informacin.
9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se
van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin.
Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe hacerse no
slo en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.
10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los
parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin,
el ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar
las conclusiones definitivas.
11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del
mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista
acerca de l.

FUNCIONES DE LA ESTADISTICA
As pues, la Estadstica puede aportar una primera aproximacin al campo de estudio a partir de
los datos que facilita al investigador, con posterioridad se pueden aplicar los principios derivados de
la Estadstica, entendida como ciencia, para la resolucin de problemas o para la toma de
decisiones. Por ejemplo, puede realizarse una recopilacin de datos sociodemogrficos de una
determinada zona residencial, para prever la construccin de escuelas infantiles a corto plazo. Esta
informacin puede ser til para las autoridades administrativas.
Downie y Heath (1983) sealan que los profesionales de la pedagoga, sociologa, psicologa, en
sus trabajos de estudio e investigacin, suelen disponer de muchos y variados datos que necesitan
ser analizados e interpretados, algo que no sera posible sin un conocimiento de la Estadstica, as
podemos sealar que nos ofrece las siguientes posibilidades:
Permite calcular las medias aritmticas de los grupos, para comparar niveles de dominio de las
variables.

Establece el grado de dispersin o variabilidad de las observaciones y datos.


Representa grficamente, mediante tablas y figuras, los grupos o los sujetos individuales.
Ayuda en la transformacin de datos para compararlos (centiles, puntuaciones tpicas).
Establece relaciones entre variables y calcula el grado de relacin entre las mismas.
Facilita el clculo de la fiabilidad y la validez de los instrumentos de recogida de datos y de medida.
Recurre a diversas mediciones o combinacin de variables para predecir el comportamiento
futuro.
Permite extrapolar los resultados de muestras representativas a grupos ms amplios
(poblaciones).
Compara las actuaciones de dos o ms grupos y establece la existencia o no de diferencias
significativas, lo que permite comprobar qu procedimiento de trabajo ofrece mejores resultados.
De forma sinttica, las principales funciones de la Estadstica se pueden agrupar en torno a tres
grandes apartados:
a) Facilitar el manejo de datos amplios y dispersos: se trata de una funcin eminentemente
simplificadora y descriptiva, pues se pretenden reducir a ndices o estadsticos (media, mediana,
desviacin tpica, correlacin) las caractersticas que identifican a un conjunto de datos. As se
procede a la ordenacin, la categorizacin, posicin, variabilidad, simetra y asimetra,
representaciones grficas y estudios de relaciones entre variables.
b) Inferir desde la muestra a la poblacin: este proceso consiste en el anlisis que sigue el
investigador para extrapolar los resultados obtenidos en las muestras a las poblaciones de las que
se extrajeron. Estamos hablando de la generalizacin de los resultados de muestras, cuando stas
cumplen los requisitos de suficiencia y representatividad.
Es decir, desde los estadsticos (proceden de muestras) se pueden estimar los parmetros
(medidas de poblacin).
c) Ayudar en la toma de decisiones: tanto desde los meros anlisis descriptivos de grupos como el
anlisis de los valores crticos que ponen de relieve la existencia de diferencias significativas entre
los grupos de tratamiento. En ambos supuestos se trata de incorporar cambios en las actuaciones
educativas que redunden en mejoras de las formas de actuacin en el campo socioeducativo.

ABUSOS DE LA ESTADSTICA
Se puede definir de dos diferentes maneras:

Como coleccin de datos numricos:


Dichos datos numricos son presentados de manera ordenada y sistemtica. Una informacin
numrica puede no constituir una estadstica, para merecer este apelativo los datos se deben de
construir como un conjunto coherente establecido de forma sistemtica y siguiendo un criterio de
ordenacin.

Como ciencia:
Estudia el comportamiento de masas buscando las caractersticas generales de un colectivo y
preside de las particulares de cada elemento. Por ejemplo: al investigar el sexo de los nacimientos
despus obtener la proporcin del sexo masculino o del sexo femenino.
1. USOS Y ABUSOS
Uso:
Conocer el porcentaje de la poblacin que necesita agua.
Conocer el porcentaje de poblacin que tiene diabetes.

Conocer el porcentaje de personas que utilizan tomate para preparar sus comidas
Conocer el porcentaje de personas guatemaltecas que consumen tortilla.
Abuso:
Aprovechar dicho resultado para el aumento de precio.
Aprovechar el resultado para el aumento del precio de las medicinas.
Conocer el resultado de dicho estudio y aumentarles el precio.
Conocer el resultado de dicho y aumentar el precio.

2. ASPECTOS FUNDAMENTALES:
TECNICAS DE MUESTREO

Como se ha puesto de manifiesto, gran parte del trabajo de un estadstico profesional se hace con
muestras. Estas son necesarias porque las poblaciones son casi siempre demasiado grandes para
estudiarlas en su totalidad. Exigira demasiado tiempo y dinero estudiar la poblacin entera, y
tenemos que seleccionar una muestra de la misma, calcular el estadstico de esa muestra y
utilizarlo para estimar el parmetro correspondiente de la poblacin.
La obtencin de la informacin se puede realizar por diversos medios.
Una forma es a travs de una encuesta a un grupo de individuos, donde a cada uno se le hacen las
mismas preguntas.
Otra forma es a travs de experimentos donde la respuesta a la variable es el resultado del
experimento. Puede tambin recolectarse los datos en forma directa, es decir, la informacin se
extrae de alguna base de datos seleccionando una muestra de ellos.
En cualquiera de estos casos contamos con una seleccin de informacin llamada muestra y que
se procede a analizar.
Existen diferentes tcnicas para realizar el muestreo y que depender cada caso, cual usar.
Algunas de ellas son:
1. Muestreo aleatorio simple: todos los elementos de la poblacin tiene igual posibilidad de ser
escogido y se eligen al azar.
2.

Muestreo sistemtico: los elementos se seleccionan a un intervalo uniforme en una lista


ordenada. Una preocupacin del muestreo sistemtico es la existencia de factores cclicos en el
listado que pudieran dar lugar a un error.

3. Muestreo estratificado: los elementos de la poblacin son primeramente clasificados en grupos o


estratos segn una caracterstica importante. Luego, de cada estrato se extrae una muestra
aleatoria simple.
4. Muestreo por conglomerado: los elementos de la poblacin estn subdivididos en grupos y se
extraen aleatoriamente algunos de estos grupos completos

ESCALAS DE MEDICION, VARIABLE, TIPOS Y VALORES

Si hubiese una escala para medir la amistad, nos daramos cuenta que amigos hay
muy pocos Le Thierre
Como sabemos las caractersticas personales como estatura , edad, gnero,
habilidades, tamaos de un determinado grupo se los conoce como variables,
sabemos que existe una gama muy diferenciada de variables de las cuales se pude
extrapolar diferentes escalas para ser medibles, la aplicacin de la bioestadstica para
medir caracterstica y valores tanto cualitativos como cuantitativos a travs de la
utilizacin de escalas que permitan medir de mejor manera un resultado obtenido.
MEDICION DE VARIABLES
Antes que una variable sea tratada estadsticamente debe ser observada/medida
para un conjunto de unidades observacionales, las unidades observacionales
son aquellos entidades que se observan, cuando las observaciones se
cuantifican (es decir se expresan numricamente) se dice que los nmeros son
medibles, una medicin es una observacin que se expresa fsicamente en
forma numrica, es decir cuando se le otorga un valor determinado segn su
magnitud.
De lo anteriormente mencionado podemos deducir que existen diferentes formas de
medir variables, algunas se las puede medir directamente por ejemplo la temperatura,
la tensin arterial, la inteligencia, y otros en forma indirecta, como el grado de
aprovechamiento de una determinada asignatura, la eficiencia, eficacia, el amor , ser
romntico, ser buen mal estudiante, etc.
Algunos de esos mtodos de evaluacin de medicin de variables (escalas) podran
arrojar datos numricos u otros podran ser expresados en palabras, de esto depende
la credibilidad de la investigacin basada en la exactitud, conveniencia, y significado
de las mediciones que podran ser el origen de las conclusiones, recomendaciones y
acciones, fruto de la resolucin del fenmeno problema. Una vez que agrupamos
estas caractersticas de los individuos de los elementos observados ( variables) en
categoras en grupos clases, esta agrupacin de caracterstica comunes
similares nos permite clasificarlas en :
CLASIFICACION DE LAS ESCALAS
Las Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al
mismo tiempo se sub dividen en:

Cualitativas :

Escala nominal clasificatoria

Escala ordinal
Cuantitativas:

Escala discreta discontinua

Escala concreta continua


Otras escalas:

Escala cronolgica

Escala intervalar

Escala de razn
ESCALA NOMINAL CLASIFICATORIA
Este tipo de variables no presentan un ordenamiento previo, ms al contrario es
arbitraria, de ah que se haya ideado tres parmetros para entender mejor este tipo de
escala; variable, escala y diferencia, por ejemplo

Variable : PROFESION

Escala : INGENIERO
MEDICO
ABOGADO
ENFERMERO
ODONTOLOGO

Diferencia : No existe diferencia entre los profesionales,

Otros ejemplos:
Variable: DEPARTAMENTOS DE BOLIVIA
Escala: La paz
Cochabamba
Oruro
Potos
Tarija
Beni
Diferencia: Ninguna .
Variable: Sexo
Escala: Masculino
Femenino
Diferencia: Ninguna
Variable: Estado civil
Escala: Soltero
Casado
Divorciado
Viudo
Unin estable
Diferencia: Ninguna.
ESCALA ORDINAL

Las variables susceptibles de ser medidas siguiendo un ordenamiento (orden),


formada por una clase mutuamente excluyentes, que se agrupan de acuerdo a un
orden pre asignado. Por ejemplo

Variable : GRADO DE INSTRUCCION

Escala : PRIMARIAS
SECUNDARIA
SUPERIOR
POST SUPERIOR

Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes de
grado primario con los de nivel superior existe no solo aos de experiencia, sino
conocimiento. ,
Otros ejemplos:
1. Variable: GRADO DE MILITAR y/o POLICIAL
Escala: SOLDADO
SARGENTO
SUBOFICIAL
OFICIAL
GENERAL
Diferencia: Existe diferencia entre los grados jerrquicos no solo en aos de
experiencia sino en aos de estudio.
Variable: JERARQUIA FAMILIAR
Escala: HIJO MENOR
HIJO MEDIO

HIJO MAYOR
MADRE PADRE
PADRE MADRE
Diferencia: Existe diferencia entre los grados jerrquicos de la familia no solo en aos
de experiencia sino en edad.
ESCALA DISCRETA DISCONTINUA
Se dice que si la variable medida es susceptible a ser contada, se puede construir una
escala discreta, formada por nmeros ENTEROS con incrementos fijos, donde las
fracciones no son consideradas, para esto, se debe considerar la magnitud de los
nmeros expuestos. Por ejemplo:

Variable : NUMERO DE HIJOS


Escala: 1 HIJO
2 HIJOS
3 HIJOS
4 HIJOS

Amplitud: Entre 4 y 1 hijos , existe una amplitud de 3 hijos


Otros ejemplos:
Variable: NUMERO DE VISITAS
Escala: De 1 a 3 visitas
De 4 a 6 visitas
De 7 a 9 visitas
De 10 a 12 visitas
Amplitud: Entre 1 y 3, existe una amplitud de 2

Variable: NUMERO DE CARIES DENTAL


Escala: De 1 a 3 caries
De 4 a 6 caries
De 7 a 9 caries
Amplitud: Entre 1 y 3 caries, existe una amplitud de 2 caries
ESCALA CONCRETA CONTINUA
Cuando uno cuenta con variables de tipo cuantitativo continuo o concreto se pude
utilizar este tipo de escala, cuyo requisito es l de poder presentar nmeros relativos
racionales (fraccionados, porcentuales y/o decimales) siendo esta medicin
aproximada. Por ejemplo:
Variable: ESTATURA
Escala: 1,65 m.
1,66 m.
1,67 m.
1,68 m.
1,69 m.
Amplitud: Entre 1,65 y 1,69 m., existe una amplitud de 0,5m
Otros ejemplos:
Variable: PESO EN GRAMOS
Escala: 6,5 Kg
7,5 Kg
8,5 Kg

9,5 Kg
Amplitud: Entre 6,5 y 9,5 kg, existe una amplitud de 4,0 kg.
Variable: TIEMPO EN HORAS
Escala: 1,10 hrs.
2,10 hrs.
3,10 hrs.
4,10 hrs.
Amplitud: Entre 1,10 y 4,10 horas, existe una amplitud de 4 horas.
ESCALA DICOTOMICA
Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo
esta variable de tipo cualitativo cuantitativo dependiendo de la informacin
resultado que se busque, por ejemplo:

Variable preferencia por un equipo de Futbol (football)

Escala de medicin: Bolvar y Wilsterman

Respuesta : Bolvar Wilsterman


Otro ejemplo:

Variable. sexo de un estudiante de UDABOL

Escala de medicin: Masculino femenino

Respuesta: Masculino femenino

ESCALA CRONOLGICA

Es un tipo de escala cuantitativa continua, se la utiliza para estudiar algunos


fenmenos en funcin al tiempo, algunos autores la tratan como si fuera una escala de
variable independiente, permite conocer un determinado fenmeno a travs del tiempo
, es decir permite un seguimiento temporalizado (en el pasado, en el presente en el
futuro).

Variable. Cambios fsico de Mara Gordales

Escala de medicin : al 1 ao
5 aos
25 aos
50 aos
75 aos
100 aos

Respuesta: descripcin de las alteraciones fsicas durante su vida


Otro ejemplo:
El seguimiento de un determinada enfermedad por ejemplo el SIDA EL SIDNA,
donde se podra realizar un seguimiento por memorizado de las patologas que se
producen a raz de este fenmeno.
ESCALA INTERVALAR
Las categoras se ordenan en unidades igualmente espaciadas, siendo posible medir
las diferencias relativas en cada punto de la escala, no EXISTE EL CERO
ABSOLUTO, tenemos como ejemplo:

Variable : Medicin de la temperatura corporal,

Escala : Grados centgrado Celsius (37)

Diferencia : La hace los nmero mayores menores de 37

ESCALA DE RAZN
En esta escala SI EXISTE EL CERO ABSOLUTO y la magnitud de diferencia entre los
valores numricos entre s por ejemplo :
Variable: RELACIN ENTRE LAS EDADES
Escala: Juan recin nacido (0 aos)
Jos 9 aos ( 9aos ms )
Joaqun 18 aos (9 aos que Jos y 18 aos ms que Juan)

3. ORGANIZACIN DE DATOS:
RECOPILACION DE DATOS
En un estudio estadstico los mtodos que se aplican son:
A) Recopilacin: De acuerdo con la localizacin de la informacin los datos
estadsticos pueden ser internos y externos.
Los internos son los registros obtenidos dentro de la organizacin que hace un estudio
estadstico,
Los externos se obtienen de datos publicados y encuestas.
B) Organizacin: En la organizacin de los datos recopilados, el primer paso es
corregir cada uno de los elementos recopilados.
C) Representacin: Hay 3 maneras de presentar un conjunto de datos mediante
enunciados, tablas estadsticas y grficas estadsticas.
D) Anlisis: Despus de los datos anteriores los datos estadsticos estn listos para
hacer analizados, para lo cual frecuentemente se emplean operaciones matemticas
durante el proceso de anlisis.
METODO PARA LA RECOLECCION DE DATOS

En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que
se desea investigar. Discutiremos aqu los mtodos ms importantes, incluyendo las ventajas y
limitaciones de estos.
La entrevista personal: los datos estadsticos necesarios para una investigacin, se renen
frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente,
directamente a la persona investigada. El investigador efectuar a esta persona una serie de
preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas
correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite
obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a
que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier
duda que se presente sobre el cuestionario o investigacin.
Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las
preguntas al nivel intelectual de las personas entrevistadas.
Una de las desventajas de este mtodo se debe a que si el entrevistador no obra de buena f o no
tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.
Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes
o entrenadores y los supervisores de estos, sobre todo si se trata de una investigacin extensa.
Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el
instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las
preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar
interpretaciones errneas.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no
hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal.
Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante
bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido
recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como
consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el
investigador.
Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la
persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y
econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las
preguntas es siempre fcil.
Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que
pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este
mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente
podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser
entrevistados.

INSTRUMENTOS PARA LA RECOLECCION DE DATOS


Cuestionarios:
Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es
necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:

a.

La identificacin del cuestionario: nombre del patrocinante de la encuesta, (oficial o


privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha
de la entrevista.

b.

Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula


de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin,
ocupacin actual, ingresos, etc.

c.

Datos propios de la investigacin, son los datos que interesa conocer para construir el
propsito de la investigacin.
Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la
encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada
por no tener ningn tipo de inters para el estudio.
Consideraciones que debemos tomar en cuenta:

El cuestionario debe ser conciso; tratar en los posible de que con el menor nmero de
preguntas, se obtenga la mejor informacin.

Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas


incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla.

Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o


curiosas, sobre datos personales que puedan ofender al entrevistado.

Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres


o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del
entrevistado.

Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas
procurando que se relacionen unas con otras.
Series o distribuciones estadsticas:
Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado,
sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se
obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o
secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos
obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se
denominan "series estadsticas", tambin conocidas como "distribucin estadstica".
Clasificacin de las series estadsticas:

1.

Ejemplo:
Produccin nacional de madera en Rola en m
Rollizos (periodo 1993 1998)

Fuente: MARN D.G.S Recurso Forestal. 1999


CVG PROFORCA
Es importante resaltar que cuando se trata de series temporales o cronolgicas, se debe
especificar el instante o el periodo de tiempo a los que se refieren los caracteres en estudio.
Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un
momento especfico de tiempo.
Ejemplo:
Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997
2001.
2.

Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos
producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos
instantes o periodos de tiempo.

3.

Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al


mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no
va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de
observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los
componentes del colectivo en estudio.
Ejemplo:
Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin
en septiembre del 2001.
2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que
componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de
veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma
modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de
frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que
cada dato se repite, recibe el nombre de tabulacin.
Ejemplo:
Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en
la urbanizacin Monseor Padilla
5
6

3
4
Tabulando los datos tenemos
Nios distribuidos por edades:

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da
lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a
su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se
refieran a atributos o variables respectivamente.
2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de
atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de
modalidades.
Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un
carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el
atributo, "frecuencia cualitativa".
Ejemplo:
Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I,
respecto a su estado civil.
Estudiantes de la materia Estadsticas I, clasificados por su estado civil.

2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se
repiten (frecuencia) al ser observada una variable.
Ejemplo:

Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad.

2.2) series especiales o geogrficas: es aquella que est formada por los valores que toman una
variable en funcin del espacio geogrfico.

TABULACION DE DATOS
La tabulacin consiste en presentar los datos estadsticos en forma de tablas o cuadros.
Forma de tabular
VARIABLES CUALITATIVAS
Pueden representarse:
_ La frecuencia absoluta (smbolo: f n), que es el n de veces que aparece cada modalidad
(resultado del recuento). La frecuencia total, de todas las modalidades juntas, se representa por N.
_ La frecuencia relativa (fr) o proporcin se obtiene dividiendo la frecuencia de cada modalidad
entre el total de datos. fr = f / N . Los valores posibles oscilan entre 0 y 1.
Suele expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 un nmero muy
cercano al 1, si ha habido redondeos.
_ El porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100 % =
(f*100)/N. Suele expresarse con 3 dgitos. La suma de todos los porcentajes debe dar 100 o un
nmero muy prximo, si ha habido redondeos.

_ Las frecuencia acumuladas (S f Sn) que se obtienen sumando la frecuencia de cada


modalidad a las frecuencias ya acumuladas anteriormente. En la primera modalidad no hay nada
acumulado de antes y por tanto su frecuencia acumulada ser su misma frecuencia.
La ltima modalidad tiene que dar una frecuencia acumulada igual a N.
_ Las frecuencias relativas acumuladas y los porcentajes acumulados se obtienen de forma similar
_ En las variables nominales las modalidades pueden ponerse en el orden que se quiera, pero en
las ordinales hay que respetar el orden lgico.
Ejemplo:
Residencia Sanitaria S. S. de Ciudad Vieja, Guatemala
Ingresos en Pediatra. Marzo 1990
Seccin
Neonatolog

f
25

fr
0.125

%
12.5

f
25

fr
0.125

%
12.5

a
Lactantes
Preescolares
Total

95
80
200

0.475
0.400
1

47.5
40
100

120
200

0.6
1

60
100

En la tabla definitiva no se presentan todos estos parmetros, sino los ms adecuados en cada
caso concreto. Casi siempre f y/o %. Slo el porcentaje, sin que conste N, no es correcto. En este
ejemplo bastara con f y %.
VARIABLES CUANTITATIVAS
Los datos se agrupan segn la frecuencia de los valores. Es lo que se denomina Distribucin de
frecuencias. La forma de tabular depende del n de datos.
----Si son pocos (la mayora de autores pone el tope en 30), se hace una tabla simple de forma
similar a lo visto para las variables CL. Cada dato equivale a una modalidad. Al final nos
quedaremos con la f de cada nmero y si se prefiere tambin con el %. Los nmeros se ordenan
de menor a mayor o de mayor a menor. La tabla puede hacerse en sentido vertical u horizontal.
Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1 , 4)
x
f

1
2

2
4

4
2

7
3

9
2

O bien,
x
1
2
4
7
9
---Si son muchos se agrupan en clases, que son intervalos sucesivos de valores. Los datos se
asignan a la clase que les corresponde y se cuentan los datos de cada clase, que est
representada por el punto medio o centro de clase (pm c).

f
2
4
2
3
2

Esta agrupacin es arbitraria con dos condiciones esenciales: que las clases sean mutuamente
excluyentes y que todos los datos puedan se asignados a una clase. Ahora bien, la experiencia ha
ido introduciendo una serie de normas, que permiten hacer esta agrupacin de la forma ms
racional posible.

Yo recomendara los siguientes pasos:


1) calcular el RECORRIDO (R), (a veces mal llamado Rango)
= (lmite real superior del dato mayor lmite real inferior del dato menor)
O si se prefiere: = (valor tabulado mximo valor tabulado mnimo) + 1
2)

calcular el N DE CLASES (NC).


Es funcin de N (tamao de la muestra) y no hay reglas fijas.
En general: entre 4 y 20.
Ayudas: NC = 1+ 3,32*logN 1+1,44*lnN
O la siguiente tabla:
N
8 16 32 64 128 256 etc.
-----------------------------------------------NC 4 5 6 7 8 9 etc.
De entrada nos quedamos con 2 3 opciones

3) calcular la AMPLITUD de las clases INTERVALO (i) : i = R / NC


Si i no es nmero entero, se redondea al nmero entero superior para que NC*i _ R y as queden
englobados todos los datos
Como probamos con 2 3 opciones, conviene elegir una i que sea impar, pues as el punto medio
de la clase (pm c) tendr una cifra menos.
En principio todas las clases deben tener la misma amplitud.
4)

Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible entre
ambos extremos de la distribucin fijando as los lmites definitivos de la tabla.

5)

Construir el esquema de la tabla, poniendo columnas de:


_ CLASES LMITES TABULADOS
_ LIMITES REALES
_ PUNTO MEDIO (pm c)
_ FRECUENCIA ( f n)
_ FRECUENCIA RELATIVA ( fr)
_ PORCENTAJE (P o %)
_ FRECUENCIAS ACUMULADAS ( _f _n)
_ FRECUENCIAS RELATIVAS ACUMULADAS (_fr)
_ PORCENTAJES ACUMULADOS (_%)

6)

Hacer el RECUENTO de datos y rellenar las casillas correspondientes

7)

Escribir la TABLA DEFINITIVA. Son obligadas las clases y la frecuencia absoluta, pudiendo aadir
otros parmetros, si se considera que mejoran la informacin. Una tabla excesivamente prolija

resulta ms difcil de leer. Por tanto la norma es: poner todo lo necesario, pero no ms de lo
necesario.
Es recomendable probar con al menos 2 tablas y elegir la que quede mejor
EJEMPLO 1:
Tabular los 70 valores siguientes:
DATOS ORIGINALES (N = 70)
40 55 19 51 62 15 20 44 60 60 45 15 21 31 13 44 41 43 51 35 50 33 25 16 61
14 14 59 59 59 20 23 25 29 29 59 58 54 50 49 39 27 37 23 24 58 27 28 57 32
32 34 57 56 35 35 54 36 43 46 52 50 49 42 43 46 40 39 31 48
PASOS DE LA TABULACION
-dato mayor: 62, cuyo LRS es 62,5
-dato menor: 13, cuyo LRI es 12,5
-recorrido (R): 62,5-12,5 = 50 (62-13)+1 = 50
-n de clases (NC): 7 u 8
-amplitud (i):
-si NC = 7 , i = 50/7 = 7,1 8 (par)
-si NC = 8 , i = 50/8 = 6,2 7 (impar)
-nos quedamos pues con NC = 8 de amplitud 7, que es impar
-sobras: (8*7) 50 = 6 , que repartimos as: 3 abajo y 3 arriba
la 1 clase empezar en 10 (13-3)
la ltima terminar con el 65 (62+3)
--ya se puede construir el esquema de la tabla (clases, LR y punto medio) y proceder al recuento
de los datos que corresponden a cada clase, para completar las otras columnas
Clases

Lmites reales

punto medio c

fr

fr

9,5 16,5
16,5 23,5
23,5 30,5
30,5 37,5
37,5 44,5
44,5 51,5
51,5 58,5
58,5 65,5

13
20
27
34
41
48
55
62

6
6
8
11
11
11
9
8
70

0,09
0,09
0,11
0,16
0,16
0,16
0,13
0,11
1,01

8,57
8,57
11,4
15,7
15,7
15,7
12,9
11,4
99,94

6
12
20
31
42
53
62
70

0,09
0,17
0,29
0,44
0,60
0,76
0,89
1,00

8,57
17,1
28,6
44,3
60,0
75,7
88,6
100

(Lmites tabulados)
10 16
17 23
24 30
31 37
38 44
45 51
52 58
59 - 65
Suma

***Esta no es la nica tabla posible, aunque probablemente sea la mejor.


Podramos hacerla con 7 clases de amplitud 8; sobras: 6. Clases: 10 17; 18 25; ...; 58 - 65
O bien 6 clases de amplitud 9. Sobras: 4. Clases: 11- 19; 20 28; ...; 56 - 64
o bien 10 clases de amplitud 5 . Sin sobras. Clases: 13 22; 23 32 ; .... ; 53 - 62
El primer paso de cualquier estudio estadstico es recoger los datos. Normalmente se suele llevar
a cabo a travs de encuestas o entrevistas, segn la poblacin a estudiar, su tamao, el tiempo de
que dispongamos,
Una vez que tenemos los datos recogidos, pasamos a hacer el recuento: contando el nmero de
veces que aparece cada valor de la variable a estudiar.
Ejemplo 2.- Preguntamos a 20 alumnos el nmero de miembros de su familia, y sus
respuestas fueron:
3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7, 5, 6, 5, 4, 4, 7, 4, 5, 3
Miembros por familia

Frecuencia

xi
3
4
5
6
7
8

5
4
6
2
2
1

Los valores de las variables estadsticas continuas se agrupan por intervalos o clases. Adems, si
la variable es discreta y toma muchos valores, tambin se suele agrupar por intervalos o clases.
El valor medio de cada clase o intervalo se llama marca de clase y se calcula como la semisuma
de los extremos del intervalo.
El recorrido de la variable es la diferencia entre el valor ms grande y el ms pequeo. La
amplitud de cada intervalo se calcula dividiendo el recorrido de la variable entre el nmero total de
intervalos.
Ejemplo 3.- A los 100 empleados de una empresa de piezas de precisin, se les ha realizado una
prueba de habilidad manual. En una escala de 0 a 100 se han obtenido las siguientes
puntuaciones:
27, 66, 32, 55, 46, 37, 75, 81, 18, 33, 47, 74, 37, 52, 47, 66, 80, 87, 37, 29,
46, 15, 29, 90, 76, 67, 23, 35, 94, 23, 25, 56, 73, 78, 17, 28, 76, 58, 45, 36,
55, 60, 17, 56, 23, 82, 64, 50, 51, 45, 37, 65, 62, 26, 69, 36, 54, 42, 40, 54,
27, 62, 28, 65, 46, 92, 36, 33, 23, 66, 18, 82, 47, 49, 59, 45, 73, 43, 47, 83,
78, 65, 39, 36, 53, 91, 38, 35, 68, 78, 91, 23, 34, 43, 55, 56, 74, 56, 62, 38.

Observamos que los valores extremos son 15 y 94. La amplitud total entre los datos es de 80
puntos, ya que ambas puntuaciones estn incluidas.
Agruparemos los datos en 8 intervalos de amplitud 10:

14,24 , 24,34 , , 84,94 . Realizando el recuento con atencin, se obtiene la tabla que sigue:
Habilidad manual

Marca de clase

14,24
24,34
34,44
44,54
54,64
64,74
74,84
84,94

Frecuencias

xi

fi

19

10

29

12

39

17

49

18

59

13

69

13

79

11

89

Para construir una tabla estadstica completa tenemos que calcular:

Frecuencia absoluta (
dato

xi

fi

) de cada valor

xi

: es el nmero total de veces que aparece el

.
Frecuencia absoluta acumulada (

Fi

) de cada valor

xi

frecuencias absolutas correspondientes a los valores anteriores a


sentido para variables cualitativas.

Frecuencia relativa (fr) de cada valor

xi

xi

y a la suya propia. No tiene

: se calcula dividiendo la frecuencia absoluta

f
correspondiente i entre el nmero total de datos N.

: es la suma de todas las

fr

fi
N

H i ) de cada valor xi : es la suma de todas las


x
frecuencias relativas correspondientes a los valores anteriores a i y a la suya propia. No tiene
Frecuencia relativa acumulada (

sentido para variables cualitativas.

Ejemplo 4.- Preguntamos a 20 alumnos el nmero de miembros de su familia, y sus


respuestas fueron:
3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7, 5, 6, 5, 4, 4, 7, 4, 5, 3

Miembros por familia

xi

Frecuencia

Frecuencia

Frecuencia

Frecuencia

absoluta

absoluta

relativa

relativa

fi

acumulada

hi

acumulada

Fi
3
4
5
6
7
8

5
4
6
2
2
1

5
9
15
17
19
20

Hi
0,25
0,2
0,3
0,1
0,1
0,05

0,25
0,45
0,75
0,85
0,95
1

4. PRESENTACION DE DATOS ESTADISTICOS:


TRABAJO DE INVESTIGACION

5.

MEDIDAS DE TENDENCIA CENTRAL:


MEDIDAS DESCRIPTIVAS

Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos
resumen la informacin contenida en ella

MEDIDAS POSICION

Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos,
que comprenden el mismo nmero de valores. Los ms usados son los cuartiles, los deciles y los
percentiles.
PERCENTILES:

son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el
85%
CUARTILES:

son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles:

- El primer cuartil Q 1 es el menor valor que es mayor que


una cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor
que es mayor que la mitad de los datos
- El tercer cuartil Q 3 es el menor valor que es mayor que
tres cuartas partes de los datos

DECILES:

son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales,
son tambin un caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.
ni
x

Ni

14

14

10

24

15

39

26

65

20

85

15

100

n=1
00
Solucin:
1. Primer cuartil:

2. Segundo cuartil:

3. Tercer cuartil:

MEDIDAS DE TENDENCIA CENTRAL


Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones
en un conjunto de datos. Por orden de importancia, son:
MEDIA

: (media aritmtica o simplemente media). es el promedio aritmtico de las observaciones,


es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la
variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir c i en vez de xi.
MEDIANA

(Me):es el valor que separa por la mitad las observaciones ordenadas de menor a
mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el
nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la
media aritmtica de los dos valores centrales.

MODA

(M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica.

MEDIDAS DE DISPERSION O ASIMETRIA


Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia
central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirn comparar varias muestras.
MEDIDAS DE DISPERSIN ABSOLUTAS
VARIANZA

( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media


aritmtica del conjunto de observaciones.

Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de X i.

DESVIACIN

TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al
cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que
se define como la raz cuadrada positiva de la varianza

Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la
frmula (cuasi desviacin tpica):

RECORRIDO

O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones


mayor y el menor. Re = xmax - xmin
MEDIDAS DE DISPERSIN RELATIVAS
COEFICIENTE

DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin


de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se
utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y
el valor absoluto de la media aritmtica

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto
cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

MEDIDAS DE FORMA
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras
de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la

distribucin es asimtrica a la izquierda.


Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el
Coeficiente de Asimetra de Pearson:

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y
negativo cuando existe asimetra a la izquierda.

MEDIDA DE APUNTAMIENTO O CURTOSIS


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de
distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores
centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores
centrales de la variable.

EJEMPLO 1

El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de


iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media,
mediana, moda, varianza y desviacin tpica.
SOLUCIN:
La media: suma de todos los valores de una variable dividida entre el nmero total de datos de
los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra
mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos
dos valores nos dar a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmtica de la distribucin.

Sx2=

La desviacin tpica S: es la raz cuadrada de la varianza.

S = 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 das
El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media
aritmtica

CV = 20,67/52,3 = 0,39
COVARIANZA

La covarianza de una variable bidimensional es la media aritmtica de los


productos de las desviaciones de cada una de las variables respecto a sus
medias respectivas.
La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variables


Si xy > 0 la correlacin es directa.
Si xy < 0 la correlacin es inversa.
La covarianza presenta como inconveniente, el hecho de que su valor
depende de la escala elegida para los ejes.
Es decir, la covarianza variar si expresamos la altura en metros o en
centmetros. Tambin variar si el dinero lo expresamos en euros o
en dlares.
Ejemplos
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas
Fsica
Hallar la covarianza de la distribucin.

Despus de tabular los datos hallamos las medias aritmticas:

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:


Y/X
1
2
3
Hallar la covarianza de la distribucin.
En primer lugar convertimos la tabla de doble entrada en tabla simple y
calculamos las medias aritmticas.
xi yi fi
0
0
0
2
16
30

12
16
76

CORRELACION
La correlacin trata de establecer la relacin o dependencia que existe entre
las dos variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las variables estn
correlacionadas o que hay correlacin entre ellas.
Tipos de correlacin
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.

3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos
tiene una forma redondeada.

Grado de correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la
nube de puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula
COEFICIENTE DE CORRELACION LINEAL
El coeficiente de correlacin lineal es el cociente entre la covarianza y el
producto de las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlacin


1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
Es decir, si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la
covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre
1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se
aproxime r a 1.

6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la


correlacin es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
Ejemplos
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas
Fsica
Hallar el coeficiente de correlacin de la distribucin e interpretarlo.

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa.


Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy
fuerte.
Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:
Y/X
1
2
3
Determinar el coeficiente de correlacin.
Convertimos la tabla de doble entrada en tabla simple.
i

Al ser el coeficiente de correlacin negativo, la correlacin es inversa.


Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy
dbil.

coeficiente de Pearson

El ndice numrico ms comn usado para medir una correlacin es el coeficiente


de Pearson. El coeficiente de Pearson (tambin llamado coeficiente de
correlacin del producto-momento), se representa con el smbolo r y proporciona
una medida numrica de la correlacin entre dos variables.
Es til reconocer la frmula usada para calcular el coeficiente de Pearson (es
posible que vea documentos en que se haga referencia a ella). Le entregamos la
frmula en una nota al pie de esta pgina. No deje que la frmula lo intimide. No
necesita comprender la frmula para comprender el concepto de correlacin.
Aunque si hace un esfuerzo va a comprender la frmula en poco tiempo y con
claridad.
Recuerde que al describir la relacin entre dos variables, necesitamos responder
al menos cuatro preguntas:
(1) Estn relacionadas las variables entre s? Si los cambios en el valor de una
de las variables van acompaados de cambios en el valor de la otra, las variables
parecen estar relacionadas.
(2) Si las variables parecen estar relacionadas, qu tan fuerte es la relacin entre
las variables? En otras palabras, estn estrechamente o slo levemente
relacionadas?
(3) La relacin entre las variables es positiva o negativa?
(4) Cul es la relacin causal entre las variables?
El coeficiente de Pearson no entrega respuestas a tres de estas cuatro preguntas:

(1) sobre la pregunta uno, nos indica si dos variables parecen estar
correlacionadas o no; (2) con respecto a la pregunta dos, el coeficiente de
Pearson indica la fuerza de la aparente relacin; y (3) el coeficiente, por ltimo,
nos indica si la aparente relacin es positiva o negativa. Como ya sabemos, el
anlisis de correlacin no puede responder a la ltima pregunta.
El coeficiente de correlacin de Pearson (r) se mide en una escala de 0 a 1, tanto
en direccin positiva como negativa. Un valor de 0 indica que no hay relacin
lineal entre las variables. Un valor de 1 o 1 indica, respectivamente, una
correlacin positiva perfecta o negativa perfecta entre dos variables. Normalmente,
el valor de se ubicar en alguna parte entre 0 y 1 o entre 0 y 1.
En las ciencias sociales en general y en educacin en particular, donde la mayora
de las variables son simultneamente afectadas por una gran multitud factores,
una correlacin positiva de 0,7 o una correlacin negativa de 0,7 se considera
muy fuerte. (Por ltimo, tenga en mente el coeficiente de Pearson mide slo
relaciones lineales entre variables, y no es til para medir relaciones que no son
lineales.)
Cuadro 15. El coeficiente de Pearson de correlacin.
Valor del
Coeficiente de Pearson

Grado de Correlacin
entre las Variables

r=0

Ninguna correlacin

r=1

Correlacin positiva perfecta

0<r<1

Correlacin positiva

r = -1

Correlacin negativa perfecta

-1 < r < 0

Correlacin negativa

Ntese que una correlacin negativa no es menos fuerte que una correlacin
positiva. As, por ejemplo, un de 0,5 es tan grande o fuerte como un de 0,5. Los
signos positivos y negativos slo indican si el valor de una variable aumenta o
disminuye, respectivamente, con el aumento en el valor de la otra variable. Como
usted sabe, cuando los aumentos (disminuciones) de una variable producen
aumentos (disminuciones) en la otra, la relacin es positiva. Es negativa cuando
los aumentos (disminuciones) de una variable producen disminuciones (aumentos)
en la otra.
Segn su opinin, las calificaciones profesionales de los maestros estn
correlacionadas en forma positiva o negativa con el rendimiento de los
estudiantes? Qu sucede con el tamao de la clase? Y el gasto en educacin?

S-ar putea să vă placă și