Sunteți pe pagina 1din 19

Estadística Descriptiva

ESTADÍSTICA DESCRIPTIVA
RECOPILACIÓN DE DATOS

LA ENCUESTA

1. ESTUDIOS DE ENCUESTA. UN ESTUDIO DE TIPO DESCRIPTIVO

Los estudios de encuesta son un tipo de estudio descriptivo y, por lo tanto, su objetivo será el de ayudar a describir
un fenómeno dado. Los estudios de encuesta suelen ser, en muchas ocasiones, un primer contacto con la realidad
que nos interesa conocer y de esto, posteriormente, se extrae un estudio en profundidad sobre el fenómeno educativo
que se haya detectado por el estudio de encuesta. Y es en el posterior estudio en el que se emplearán otras
modalidades de investigación más adecuadas al objetivo que se pretenda en la investigación.

De modo que, los estudios de encuesta son propios de las primeras etapas del desarrollo de una investigación y con
ellos recogemos datos que preparan el camino para nuevas investigaciones.

2. QUÉ ES UN ESTUDIO DE ENCUESTA

Este tipo de investigación descriptiva es muy utilizada en el ámbito educativo quizá por su aparente facilidad en lo
referente a su empleo. Dentro de la investigación por encuesta o estudios de encuesta se incluyen los estudios que
emplean los cuestionarios y los que emplean las entrevistas como herramienta de recogida de datos.

Los estudios de encuesta son útiles para describir y predecir un fenómeno educativo y también son eficientes para
obtener un primer contacto con la realidad a investigar o para estudios exploratorios.

Puesto que existen numerosas definiciones de estudios de encuesta, señalamos los aspectos propios de este tipo de
estudios que nos ayudarán a obtener una definición, independientemente de la herramienta que utilicen para la
recogida de datos.

Los rasgos propios de los estudios de encuesta son los siguientes:

- Permiten recoger información mediante la formulación de preguntas que se realizan a los sujetos en una entrevista
personal, por teléfono o por correo.

- Pretenden hacer estimaciones de las conclusiones a la población de referencia a partir de los resultados obtenidos
de la muestra.

Cuando se ponen en práctica los estudios de encuesta, podemos encontrar que la muestra seleccionada no sea el
elemento clave en la investigación, sino que lo sea la descripción de la totalidad de la población. Y también se puede
encontrar que algunas investigaciones utilicen diversos procedimientos de recogida de información.

3. PROCESO DE INVESTIGACIÓN EN UN ESTUDIO DE ENCUESTA

Para Arnau (1995) el proceso se puede dividir en cuatro fases:

 Planteamiento de objetivos y preparación de instrumento de recogida de información


 Planificación del muestreo
 Recogida de datos
 Análisis e interpretación de los datos

Independientemente de la modalidad, es muy importante que los objetivos estén muy claros ya que deben llevar a
establecer cuál es la información necesaria que se debe recoger en el instrumento con el que se recojan los datos.
Estos deben estar siempre en infinitivo, ser verbos que reflejen resultados y que sirvan para adquirir conocimiento.

En ocasiones en lugar de objetivos lo que se formulan son hipótesis, afirmaciones generalizadas o comprobables que
se formulan como posibles soluciones a un problema planteado.

Tras la formulación de objetivos y/o hipótesis, un aspecto importante es la selección de la muestra con la que vamos
a trabajar. Una muestra es un conjunto de sujetos, objetos, sucesos, eventos, contextos de estudio, etc. extraídos de
una población (conjunto de todos los individuos, objetos, eventos, etc., en los que se desea estudiar un fenómeno

Juan Carlos Flores Cruz


1
Estadística Descriptiva

determinado, a los que se hacen extensivos los resultados de la investigación) y sobre los que se van a recoger los
datos.

A la hora de seleccionar la muestra hay que garantizar dos condiciones:

 Representatividad: la muestra debe tener las mismas características que la población. Se deben seleccionar las
variables que posibiliten una descripción de las características propias de la población y que deben estar
presentes en la muestra. Estas variables se denominan variables marcadas o identificadoras y hacen referencia
factores como sexo, edad, estatus socioeconómico, tipo de escuelas, etc. Si una muestra no es representativa
se dice que está sesgada y anula la generalización de los resultados.
 Tamaño: la muestra debe tener un tamaño suficiente para garantizar la representatividad. El tamaño dependerá
del propósito de la investigación y de la población objeto. El número mínimo dependerá del número de sujetos
que comprende la población, de la heterogeneidad de la variable, del nivel de confianza (probabilidad de que la
estimación de la muestra se ajuste a la realidad) y del error máximo con el que se decida realizar el estudio (error
de muestreo permitido). Para saber de forma sencilla cuál es el tamaño mínimo de una muestra seguiremos a
Cardona (2002: 121) que señal cinco ideas:
 A mayor población, menor porcentaje se necesita
 Para poblaciones pequeñas (N menor de 100) mejor tomar toda la población
 Tamaño de la población en torno a 500, tomar el 50% de la población
 Tamaño de la población es de 1500, tomar el 20%
 Población mayor de 5000 con 400 es suficiente

En ocasiones puede ocurrir que la muestra seleccionada no coincida con la muestra final o productora de datos. Esta
diferencia puede invalidar el proceso de selección de la muestra, por ello hay que tener en cuenta el ciclo del muestreo
donde a la muestra elegida hay que restarle la aceptada y se obtiene la definitiva.

A los procedimientos utilizados para seleccionar la muestra sobre los que se van a recoger los datos se les denomina
técnicas o métodos de muestreo. Los diferentes tipos de muestreo se basan en el principio de la equiprobabilidad que
quiere decir que todos los sujetos de la población tienen las mismas probabilidades de formar parte de la muestra.

Hay dos tipos de muestreos.

PROBABILÍSTICOS: el que se conoce a priori la probabilidad de que cada sujeto caiga en la muestra. Son los que
favorecen el objetivo de la representatividad de la muestra. Dentro de este podemos encontrar:

 Aleatorio simple: sorteo total de la población. Consiste en asignar un número a cada sujeto de la población y
seleccionar la muestra mediante algún sistema mecánico como las tablas de números aleatorios.
 Aleatorio estratificado: selecciona la muestra en relación con estratos o categorías que se presentan en la
población y que son relevantes para los objetivos de la investigación. El proceso es:
- dividir a la población en varios estratos (edad, género,...)
- determinar el tamaño de la muestra
- dentro de cada estrato se lleva a cabo un muestreo simple o sistemático
- el número de individuos por estrato se decide por:
 Afijación simple o constante: la muestra total se divide en partes iguales
 Afijación proporcional: número proporcional al tamaño de la muestra de cada estrato
 Por conglomerados: se usa cuando los individuos de la población constituyen agrupaciones naturales (aulas de
un colegio, los mercados, facultades de una universidad,...). La unidad de muestreo ya no es el individuo sino el
conglomerado. Una vez definidos los conglomerados, éstos se seleccionan por algún método de muestreo donde
el número de sujetos de cada conglomerado configura el tamaño de la muestra.
 Polietápico: es la combinación de diversos métodos secuenciados en etapas.

NO PROBABILISTICOS: Se desconoce la probabilidad, es un procedimiento informal de seleccionar la muestra.


Podemos encontrar:

 Casual: se seleccionan sujetos por tener mayor accesibilidad a ellos.


 Intencional u opinativo: se seleccionan sujetos que son expertos en un tema o relevantes como fuentes de
información. Se seleccionan en función de la intención declarada con antelación.

Juan Carlos Flores Cruz


2
Estadística Descriptiva

 Por cuotas: se utiliza cuando no se dispone de una muestra seleccionada al azar pero se quiere una muestra
representativa de la población, por lo que se fijan unas “cuotas” que consisten en un número de individuos que
reúnen unas determinadas condiciones o variables demográficas de la población (sexo, edad, nivel de estudios,
…).
 Bola de nieve: se localizan a los individuos porque unos conducen a otros hasta conseguir una muestra suficiente
para el estudio que se esté llevando a cabo. Es un método propio de la investigación cualitativa.

4. TÉCNICAS DE RECOGIDA DE INFORMACIÓN

La investigación por encuesta debe traducir las variables sobre las que se desea obtener información en preguntas
concretas. Las técnicas asociadas a este tipo de investigación son el cuestionario y la entrevista.

 Un cuestionario es un instrumento de recopilación de información compuesto de un conjunto limitado de


preguntas mediante el cual el sujeto proporciona información sobre sí mismo y/o sobre el entorno.
 Una entrevista es un procedimiento mediante el cual un entrevistador realiza un conjunto de preguntas a un
sujeto. Puede ser una entrevista estructurada o entrevista semiestructurada.

Las fases de la encuesta son:

1. Definición de los objetivos del cuestionario.

2. Planificación del cuestionario, diferenciando sus apartados.

3. Elaboración y selección de las preguntas.

4. Análisis de las preguntas.

5. Análisis de la fiabilidad y validez del cuestionario.

6. Redacción final de la encuesta.

5. CLASIFICACIÓN DE LOS ESTUDIOS DE ENCUESTA

Existen múltiples modos de clasificar las encuestas: en función de sus características, según el grado de cobertura de
la población, en función de su objetivo, de su diseño, de la técnica de muestreo, etc.

Tipo de encuestas en función de la forma

Se suelen distinguir los tipos de encuestas en función de la forma en la que se administran.

 La entrevista personal es el tipo de encuesta más utilizado. Implica la participación directa del entrevistador que
es quien plantea las cuestiones a los sujetos. El entrevistador deberá ser:
 Persona con cierta formación y experiencia en la realización de entrevistas personales.
 Deberá utilizar un guion de entrevista o cuestionario.
 Deberá formular las preguntas en el mismo orden y con los mismos planteamientos.
 La encuesta telefónica tiene algunos rasgos comunes con las entrevistas personales.
 Las encuestas postales que presentan dos rasgos propios: el instrumento de autocumplimentación y las
preguntas e instrucciones de respuesta deben ser entendibles. Esto conlleva realizar una prueba piloto y validar
el contenido de las cuestiones planteadas mediante el proceso de validación de jueves.
 Prueba Piloto (validación del instrumento): Se suele realizar en encuestas con grandes poblaciones y consiste
en la aplicación previa en menor escala de todos los procedimientos que se utilizarán en la encuesta final. Así se
podrán realizar estudios de fiabilidad y validez del instrumento mediante una serie de pruebas estadísticas.
 Validación de jueves: A un grupo de personas expertas en la materia se les plantea una serie de cuestiones en
cuanto al contenido del cuestionario y a su estructura.
 La entrevista por Internet tiene las mismas características que la encuesta postal, excepto el medio en que se
desarrolla (Internet).

Consideraciones generales sobre la elaboración del instrumento

Juan Carlos Flores Cruz


3
Estadística Descriptiva

Antes de proceder a la confección de las diversas preguntas se utilizan encuestas abiertas o se trabaja a partir de
grupos de discusión. La elaboración de mapas conceptuales previos es también una estrategia utilizada en la fase de
elaboración del instrumento.

En un cuestionario conviene introducir:

 Variables de identificación y clasificación como género, edad, nivel de estudios…


 Preguntas abiertas concisas y de respuesta breve.
 Agrupar las preguntas por temáticas y las más interesantes al principio.
 No debe ser excesivamente largo.
 La redacción de las preguntas debe ser sencilla.
 Introducir una presentación que especifique el objetivo de la investigación.
 Las encuestas de correo deben tener una presentación especial y los criterios son:
 Carta de presentación donde se presente el objetivo de la encuesta y la garantía de confidencialidad.
 El aspecto del cuestionario debe ser fácil y atractivo; tener suficiente espacio para responder.
 La redacción debe ser clara, tanto las preguntas como las instrucciones.
 La distribución de su contenido debe facilitar su cumplimentación.
 El final del cuestionario suele dedicarse para rogar al encuestado que repase las preguntas, solicitar la devolución
y agradecer la participación.

Tipos de encuestas según la finalidad

De la clasificación por objetivo encontramos:

 La encuesta descriptiva se realiza si el objetivo de la investigación es conocer o describir las características de


la población. Se trabaja con muestras representativas con el objetivo de poder realizar inferencias a la población
de origen.
 La encuesta explicativa se realiza si la finalidad de la investigación es establecer relaciones causales y/o
contrastar hipótesis. Normalmente se realiza un estudio exploratorio previo. Utiliza técnicas estadísticas que
permiten confirmar relaciones causales.

Ambas se encuentran habitualmente combinadas en la misma encuesta.

De la clasificación según la dimensión temporal distinguimos:

 Estudios transversales: se caracterizan por recoger información una única vez en un periodo de tiempo delimitado
y de una población definida. Son adecuados para el estudio de variables estables en el tiempo. Son económicos
lo que permite estudiar con más sujetos, producen resultados más rápido y no afecta la mortalidad. Pero es un
método menos eficaz para identificar variaciones individuales y poder establecer relaciones causales y la
selección de sujetos es más complicada ya que están involucrados sujetos de diferentes niveles de edad y
pueden no ser comparables.

 Estudios longitudinales: siguen la evolución de un sujeto o un grupo durante un periodo de tiempo. Con muestras
representativas son útiles para identificar esquemas típicos de desarrollo. Son apropiados cuando se intenta
establecer relaciones causales. Pero requieren mucho tiempo y dinero, son afectados si se produce alguna
mortalidad en la muestra.
Cuando los estudios se dirigen a los mismos sujetos se pueden denominar estudios de seguimiento o de grupo
o de cohortes. Si se estudian diversos factores continuamente en el tiempo se denominan estudio de tendencias.

De la clasificación según el sentido y momento de recogida de información encontramos:

 Estudios retrospectivos: son los estudios de tendencias que avanzan en la recopilación de los datos, a la vez que
se van sucediendo los hechos. Este estudio es más utilizado que el prospectivo pero tiene varios problemas si
se da la pérdida de sujetos y la maduración personal, así como la dificultad de localizar a los sujetos después de
un periodo largo de tiempo.
 Estudios prospectivos: son los estudios que pretenden estudiar la situación actual a partir de sucesos acontecidos
en el pasado.

Juan Carlos Flores Cruz


4
Estadística Descriptiva

En estos estudios existen dos tipos de información: la que se recuerda con exactitud y la que es inexacta, dividida
esta a su vez por la información que el sujeto está dispuesto a facilitar y la que da de forma distorsionada; a esto se
le denomina “efecto de deseabilidad social”. Y si los datos se recogen de fuentes documentales y no de los recuerdos
de los sujetos, la investigación adquiere mayor fortaleza.

Bibliografía y Netgrafía
https://www.uam.es/personal_pdi/stmaria/jmurillo/InvestigacionEE/Presentaciones/Encuesta_doc.pdf

(1995). “Conceptos básicos”. En M. T. ANGUERA, J. ARNAU, M. ATO, R. MARTÍNEZ, J. PASCUAL y G. VALLEJO.


Métodos de investigación en psicología.

(2002). Cristina CARDONA MOLTO. ”Introducción a los Métodos de Investigación en educación”.

Juan Carlos Flores Cruz


5
Estadística Descriptiva

ESTADÍSTICA

BREVE HISTORIA DE LA ESTADÍSTICA

La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados
establecer registros de población, nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer datos
cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se
establecieron sociedades humanas organizadas.

Para conocer los orígenes de la Estadística, revisamos:

Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la
producción agrícola y los géneros vendidos o cambiados mediante trueque. Los egipcios ya analizaban los datos de
la población y la renta del país mucho antes de construir las pirámides, ellos llevaban cuenta de los movimientos
poblacionales y continuamente hacían censos. En la Biblia observamos el censo que realizó Moisés después de la
salida de Egipto. En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.
Posteriormente, hacia el año 500 a.C., se realizaron censos en Roma para conocer la población existente.

En la Edad Media, en el año 762, Carlomagno ordenó la creación de un registro de todas sus propiedades, así como
de los bienes de la iglesia. En Inglaterra en 1.066, el rey Guillermo I, el Conquistador, elaboró un catastro que puede
considerarse el primero de Europa

En 1.662 un mercader de lencería, John Graunt, publicó un tratado con las observaciones políticas y naturales, donde
pone de manifiesto las cifras brutas de nacimientos y defunciones ocurridas en Londres durante el periodo 1.604-
1.661, así como las influencias que ejercían las causas naturales, sociales y políticas de dichos acontecimientos.
Puede considerarse el primer trabajo estadístico sobre la población.

En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la generalización del método para estudiar
fenómenos de las ciencias naturales y sociales. Galton » (1.822-1.911) y Pearson (1.857-1936) se pueden considerar
como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística
inductiva.

A partir de mediados del siglo XX comienza lo que podemos denominar la estadística moderna, uno de los factores
determinantes es la aparición y popularización de los computadores. La metodología estadística se empieza a
desplazar técnicas de computación intensiva aplicadas a grandes masas de datos, y se empieza a considerar el
método estadístico como un proceso iterativo de búsqueda del modelo ideal

CONCLUSIÓN

Se puede afirmar que la Historia de la Estadística comienza con la formación de los Estados, aunque con el tiempo,
ha habido cambios en la interpretación de la palabra "estadística". En un principio, el significado estaba restringido a
la información acerca de los estados. Este fue extendido posteriormente para incluir toda colección de información de
cualquier tipo, y más tarde fue extendido para incluir el análisis e interpretación de los datos. En términos modernos,
"estadística" significa tanto conjuntos de información recopilada, por ejemplo registros de temperatura, contabilidad
nacional, como trabajo analítico que requiera inferencia estadística.

Bibliografía y Netgrafia

http://www.estadisticaparatodos.es/historia/histo_esta.html

https://es.wikipedia.org/wiki/Historia_de_la_estad%C3%ADstica

Juan Carlos Flores Cruz


6
Estadística Descriptiva

CONCEPTOS DE ESTADÍSTICA

Es una ciencia que se encarga de estudiar una determinada población por medio de
la recolección, recopilación e interpretación de datos.

“…La estadística es una rama de las matemáticas y una herramienta que estudia usos y análisis provenientes de una
muestra representativa de datos, que busca explicar las correlaciones y dependencias de un fenómeno
físico o natural, de ocurrencia en forma aleatoria o condicional…”

“…Se designa con el nombre de estadística a aquella ciencia que ostenta en sus bases una fuerte presencia y acción
de las matemáticas y que principalmente se ocupa de la recolección, análisis e interpretación de datos que buscan
explicar las condiciones en aquellos fenómenos de tipo aleatorio…”

Se deduce que Estadística comprende el conjunto de métodos y procedimientos para obtener, describir e interpretar
de los datos los fenómenos que en ellos existen.

UTILIDAD

Es ciencia transversal (se aplica en variedad de disciplinas), desde la física hasta las ciencias sociales, desde
las ciencias de la salud hasta el control de calidad; en los negocios, en instituciones gubernamentales, con el propósito
del estudio cuantitativo de todo fenómenos revisado

OBJETIVOS DE LA ESTADÍSTICA:

 Descubrir y describir un fenómeno por medio de sus datos


 Analizar la información u obtener resultados
 Comparar datos históricos y posibilitar predicciones de futuras

DIVISIÓN - CLASES

La estadística se divide en dos grandes áreas:

Estadística descriptiva: Se dedica a la descripción, visualización y resumen de datos originados a partir de los
fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Su objetivo es organizar y describir
las características sobre un conjunto de datos con el propósito de facilitar su aplicación, generalmente con el apoyo
de gráficas, tablas o medidas numéricas.

“…es la rama de la estadística que recolecta, analiza y caracteriza un conjunto de datos (peso de
la población, beneficios diarios de una empresa, temperatura mensual,…) con el objetivo de describir las
características y comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos…”

Estadística inferencial: Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones.

Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias
pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características
numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión).

“…La inferencia es un campo de la estadística que persigue la obtención de conclusiones de una población
estadística a partir de una muestra de la misma, pretendiendo ir de lo particular a lo general…”
Bibliografía y Netgrafia

https://es.wikipedia.org/wiki/Estad%C3%ADstica

https://www.definicionabc.com/general/estadistica.php

Juan Carlos Flores Cruz


7
Estadística Descriptiva

DATOS ESTADÍSTICOS

DEFINICIÓN

El término dato, con origen en el latín datum, refiere a la información que brinda acceso a un conocimiento preciso y
concreto. Estadístico, por su parte, es aquello vinculado a la estadística: la especialidad de la matemática que apela
a cifras para generar inferencias o para reflejar cuantitativamente un fenómeno.
Los datos estadísticos, en este marco, son los valores que se obtienen al llevar a cabo un estudio de tipo estadístico.
Se trata del producto de la observación de aquel fenómeno que se pretende analizar.
Es importante tener en cuenta que el procesamiento de los datos estadísticos es lo que genera información. El dato
por sí mismo, considerado como algo aislado, carece de interés.
VARIABLES ESTADÍSTICAS

Una variable estadística es una característica que puede fluctuar y cuya variación es susceptible de adoptar diferentes
valores, los cuales pueden medirse u observarse. Las variables adquieren valor cuando se relacionan con otras
variables, es decir, si forman parte de una hipótesis o de una teoría.

Las variables se las puede estudiar según el nivel de medición:

VARIABLES CUALITATIVA

Como su nombre lo indica expresan distintas cualidades, características o modalidad. Cada modalidad que se
presenta se denomina atributo o categoría, y la medición consiste en una clasificación de dichos atributos.

Las variables cualitativas puede ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y
no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores.

Dentro de ellas se pueden distinguir:

 Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea
uniforme, por ejemplo: leve, moderado, fuerte.
 Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden,
como por ejemplo los colores o el lugar de nacimiento.

VARIABLES CUANTITATIVAS

Son las variables que toman como argumento cantidades numéricas, son variables matemáticas. Las variables
cuantitativas además pueden ser:

 Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que
puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
 Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de
valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario.
Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que exista un valor entre
dos variables.

Según la influencia

Según la influencia que le asignemos a unas variables sobre otras, podrán ser:

Variables independientes

Es aquella cuyo valor no depende de otra variable. Es aquella característica o propiedad que se supone es la causa
del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.

Las independientes son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando
intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las

Juan Carlos Flores Cruz


8
Estadística Descriptiva

variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de
un sesgo.

La variable independiente se suele representar en el eje de abscisas.

La variable independiente es la que se le asignan valores arbitrarios

Variables dependiente
Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente
en una función que suele representar por y. La variable dependiente se representa en el eje ordenadas. Son las
variables de respuesta que se observan en el estudio, y que podrían estar influidas por los valores de las variables
independientes.

BIBLIOGRAFÍA

https://definicion.de/datos-estadisticos/

https://es.wikipedia.org/wiki/Variable_estad%C3%ADstica

Juan Carlos Flores Cruz


9
Estadística Descriptiva

ESTUDIO VARIABLES CUANTITATIVAS

ESTADÍSTICA DE VARIABLE DISCRETA

Los datos observados y originales se denominaran con “X” y pueden ser registrados como: X1, X2, X3, X4, X5….Xn;
donde Xi (i= 1, 2, 3, 4, 5,……n) representa la i – ésima observación.

El conjunto de observaciones constituyen muestras, el tamaño de la muestra en este caso es “n”.

TABLA DE FRECUENCIAS Y SUS ELEMENTOS

La tabla de frecuencias es la consolidación de información

Por ejemplo:

Consideremos que se han recolectado datos de 8 familias, referente al número de hijos:

X1 = 1, X2 = 2, X3 = 3, X4 = 3, X5 = 1, X6 = 4; X7 = 2; X8= 0

La recolección de datos puede representarse en una tabla:

Variable Frecuencia Absolutas


0 1
1 2
2 2
3 2
4 1
Total 8

Los valores de la variable pueden ser representados por la letra Y, por lo que existirían 5 variables esto es:

Y1 = 0, Y2 = 1, Y3 = 2, Y4 = 3, Y5 = 4

Cada valor de Y tiene una frecuencia; la frecuencia absoluta, es el número de veces que se repite un determinado
valor de la variable, se la representa con la letra “n”

La frecuencia relativa es la relación que tiene cada frecuencia con el total de las frecuencias se lo obtiene dividiendo
ni = n, se representa con la letra “h”

También tenemos frecuencias relativas acumuladas que se las representa por “N”, y se las obtiene sumando las
frecuencias absolutas,

Adicionalmente tenemos frecuencias relativas acumuladas que se la representa por “H”, se la obtiene sumando las
frecuencias relativas.

Los datos observados son relativamente pocos y puede considerarse que dichos valore definen la clase o grupo
correspondiente, el número de clases está dado por cada “Y”.

Consolidando los datos y agrupándolos obtendremos una tabla de distribución de frecuencias:

Valores de la Tabulación Frecuencias Frecuencias Frecuencias Frecuencias


Variable absolutas relativas Absolutas Relativas
Acumuladas Acumuladas
“Y” “n” “h” “N” “H”
Y1 = 0 + n1 = 1 h1 = 0,125 N1 = 1 H1 = 0,125
Y2 = 1 ++ n2 = 2 h2 = 0.250 N2 = 3 H2 = 0,375
Y3 = 2 ++ n3 = 2 h3 = 0,250 N3 = 5 H3 = 0,625
Y4 = 3 ++ n4 = 2 h4 = 0.250 N4 = 7 H4 = 0,775
Y5 = 4 + n5 = 1 h5 = 0.125 N5 = 8 H5 = 1.000
Total 8 1

Juan Carlos Flores Cruz


10
Estadística Descriptiva

ANÁLISIS DE LA TABLA:

Realizar el análisis correspondiente:

TIPOS DE GRÁFICOS:

Gráficas de frecuencia absolutas

Gráficas de frecuencias relativas

Gráfica de frecuencias absolutas acumuladas

Gráfica de frecuencias relativas acumuladas

Nota: Ejercicio desarrollado en excel.

EJERCICIO 1

Juan Carlos Flores Cruz


11
Estadística Descriptiva

ESTADÍSTICA DE VARIABLE CONTINÚA

Para el caso de variable continua, seguiremos utilizando la simbología que utilizamos para variable discreta; a la que
aumentaremos el conocimiento de: Recorrido e Intervalos de clase.

La variable continúa es utilizada para registrar cantidad de datos estadísticos. Como el número de observaciones es
elevado, la diferencia entre el mayor valor observado con referencia al menor valor de observación es lo que se
denomina distancia o recorrido. Los intervalos de clases quedan determinados por los límites inferior y superior.

Límite superior: Yi+1

Límite inferior: Yi-1

La clase de datos en la que se encontrará observaciones de características similares conviene que sean impares; en
algunos casos que aumente la amplitud del recorrido para que sean más cómodos para trabajar.

Dentro de cada clase que también toma el nombre de intervalo de clase, existe un recorrido o amplitud del intervalo;
el mismo que conviene que sea igual para cada intervalo.

Los intervalos de clases son representados por los valores medios y toman el nombre de marca de clase y se los
representa con el símbolo Yi

Utilicemos un ejemplo para aplicar estos nuevos conceptos; el sueldo semanal de un grupo de obreros es el siguiente:

65 46 60 70 85 84 69 77
47 52 70 70 67 72 80 57
73 67 73 67 47 64 61 57
63 76 70 74 73 83 82 70
68 67 59 94 58 58 67 66

Con la información determinemos el recorrido:


El límite inferior es: 46
El límite superior es: 94
Recorrido es igual: 94 menos 46 igual a 48
Si queremos siete clases; tendríamos 48 dividido para 7 obtendríamos el intervalo de 6,8571428571
Al resultar un intervalo con muchos decimales consideramos que el recorrido puede ser ajustado.
Para ajustar el recorrido podríamos bajar 1 al límite inferior o subir 1 al límite superior, veamos los casos:
Caso 1 94 – 45 = 49 49 dividido 7 = 7 por lo tanto el recorrido ajustado estaría entre 94 y 45 con una amplitud
de siete;
Caso 2 95 – 46 = 49 49 dividido 7 = 7 el recorrido ajustado estaría entre 95 y 46 con una amplitud de 7
Valores Marca Tabulación Frecuencias Frecuencias Frecuencias Frecuencias
de la de absolutas relativas Absolutas Relativas
Variable Clase Acumuladas Acumuladas
Yi-1 Yi+1 Yi “n” “h” “N” “H”
46.1 - 53 49.5 ++++ 4 0,100 4 0,100
53.1 - 60 56.5 +++++ 5 0,125 9 0,225
60.1 – 67 63.5 +++++++++ 9 0,225 18 0,450
67.1 – 74 70.5 +++++++++++++ 13 0,325 31 0,775
74.1 – 81 77.5 +++ 3 0,075 34 0,850
81.1- 88 84.5 +++++ 5 0,125 39 0,975
88.1 – 95 91.5 + 1 0,025 40 1
Total 40 1

EJERCICIOS :

REALIZACIÓN DE EJERCICIOS

Juan Carlos Flores Cruz


12
Estadística Descriptiva

MEDIDAS DE TENDENCIA CENTRAL Y LAS DE DISPERSIÓN

DENOMINACIÓN

Se llama medida de tendencia central al valor que indica el punto de la escala alrededor del cual los datos tienden a
agruparse y que tipifican o representan mejor la distribución de frecuencias.

A las medidas estadísticas se las conoce como estadígrafos.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de
valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de
tendencia central más utilizadas son: media, mediana y moda.

Las medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho en
otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De
esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se
encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.

LA MEDIA ARITMÉTICA

La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa
por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra
es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La
media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así


sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el
promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

DESVIACIONES:

Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:

Juan Carlos Flores Cruz


13
Estadística Descriptiva

Ejemplo de desviaciones:

Una propiedad interesante de la media aritmética es que la suma de las desviaciones es cero.

MEDIANA
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central,
cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o
inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo,
en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

MODA
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la
moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más
de una moda.

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden resumir en un solo valor
la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación,
Varianza, Desviación estándar, Coeficiente de variación.

RANGO DE VARIACIÓN

Se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.

La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la desviación estándar. La
varianza se representa con el símbolo σ² (sigma cuadrado) para el universo o población y con el símbolo s2 (s
cuadrado), cuando se trata de la muestra. La desviación estándar, que es la raíz cuadrada de la varianza, se
representa por σ (sigma) cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra
en muestra dentro de una misma población. La varianza se expresa en unidades de variable al cuadrado y la
desviación estándar simplemente en unidades de variable.

FÓRMULAS
Donde µ es el promedio de la población.

Donde Ȳ es el promedio de la muestra.

Juan Carlos Flores Cruz


14
Estadística Descriptiva

Consideremos a modo de ejemplo una muestra de 4 observaciones

Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de dispersión:

s2 = 34 / 3 = 11,33 Varianza de la muestra

La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4

Interpretación de la varianza (válida también para la desviación estándar): un alto valor de la varianza indica que los
datos están alejados del promedio. Es difícil hacer una interpretación de la varianza teniendo un solo valor de ella. La
situación es más clara si se comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y
varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen mayor dispersión que
los datos de la muestra a. esto significa que en la muestra a los datos están más cerca del promedio y en cambio en
la muestra b los datos están más alejados del promedio.

COEFICIENTE DE VARIACIÓN

Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar de la muestra expresada
como porcentaje de la media muestra.

Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de medida. Esto porque el
coeficiente de variación, a diferencia de la desviación estándar, es independiente de la unidad de medida de la variable
de estudio.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN EN DATOS AGRUPADOS

Se identifica como datos agrupados a los datos dispuestos en una distribución de frecuencia. En tal caso las fórmulas
para el cálculo de promedio, mediana, modo, varianza y desviación estándar deben incluir una leve modificación. A
continuación se entregan los detalles para cada una de las medidas.

PROMEDIO EN DATOS AGRUPADOS

La fórmula es la siguiente:

Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores de Yi.

Juan Carlos Flores Cruz


15
Estadística Descriptiva

Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un programa de lactancia
materna, clasificadas según el número de partos. Por tratarse de una variable en escala discreta, las clases o
categorías asumen sólo ciertos valores: 1, 2, 3, 4, 5.

Entonces las 42 madres han tenido, en promedio, 2,78 partos.

Si la variable de interés es de tipo continuo será necesario determinar, para cada intervalo, un valor medio que lo
represente. Este valor se llama marca de clase (Yc) y se calcula dividiendo por 2 la suma de los límites reales del
intervalo de clase. De ahí en adelante se procede del mismo modo que en el ejercicio anterior, reemplazando, en la
fórmula de promedio, Yi por Yc.

MEDIANA EN DATOS AGRUPADOS

Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la frecuencia acumulada
que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya que 42/2 es igual a 21 y la frecuencia acumulada
que supera inmediatamente a 21 es 33, que corresponde a un valor de variable (Yi) igual a 3.

Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada que supere en forma
inmediata a n/2, y luego aplicar la siguiente fórmula:

Donde:

MODA EN DATOS AGRUPADOS

Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga la mayor frecuencia
absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que este valor de variable corresponde a la mayor
frecuencia absoluta =16.

Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y desviación estándar en datos
agrupados con intervalos.

VARIANZA EN DATOS AGRUPADOS

Para el cálculo de varianza en datos agrupados se utiliza la fórmula

Juan Carlos Flores Cruz


16
Estadística Descriptiva

Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por madre,

Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase (Yc), de tal modo que la
fórmula queda:

Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Yc= (Límite inferior del intervalo + limite superior del intervalo)/2.

PERCENTILES

Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales. De este modo si el percentil
80 (P80) es igual a 35 años de edad, significa que el 80% de los casos tiene edad igual o inferior a 35 años.

Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos.

Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada supera inmediatamente al “j” %
de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea inmediatamente superior a 33,6
((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4. Se dice entonces que el
percentil 80 es 4 partos (P80=4). Este resultado significa que un 80% de las madres estudiadas han tenido 4 partos o
menos.

Juan Carlos Flores Cruz


17
Estadística Descriptiva

Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente más complejo ya que se
hace necesaria la aplicación de una fórmula.

Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente superior al “j” % de los casos
(jxn/100).

En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en miles de pesos. Nótese
que para calcular el centro de clase se usaron los límites reales de cada intervalo.

1. El ingreso mensual promedio será:

2. La mediana será:

Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a $127.270.

3. El percentil 78 será:

Por lo tanto se puede decir que 78% de las familias tienen ingreso igual o inferior a $174.660.

4. Los percentiles 10 y 90 serán:

Juan Carlos Flores Cruz


18
Estadística Descriptiva

A base de los valores de los percentiles 10 y 90 se pueden hacer tres afirmaciones:

El 10% de las familias tiene ingreso igual o inferior a $90.000.


El 90% de las familias tiene ingreso igual o inferior a $210.000.
El 80% central, de las familias, tiene ingreso entre $90.000 y $210.000

5. - La varianza será:

6. La desviación estándar es la raíz cuadrada de esta cifra, es decir: 43,76.

BIBLIOGRAFÍA Y NETGRAFÍA

http://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934?ver=sindiseno

Juan Carlos Flores Cruz


19

S-ar putea să vă placă și