Sunteți pe pagina 1din 13

Fase 2 - Elaborar documento de identificación y análisis de variables estadísticas

Folkenberg Díaz Pérez


C.C: 1.005.321.028

Grupo: 300046_36

Tutor: Héctor Fabio López

Universidad Nacional Abierta y a Distancia (UNAD)


Escuela de Ciencias Agrícolas Pecuarias y del Medio Ambiente
Ingeniería Ambiental
CEAD Bucaramanga
03 – octubre – 2019
INTRODUCCIÓN

Como futuro ingeniero tendré que enfrentarme con problemas a los cuales tengo
que darle solución, es por eso que sé que debo manejar los conceptos que se
utilizan en la estadística descriptiva, a fin de que pueda por medio de esta
herramienta dar solución a las diferentes problemáticas que se presentan en mi
entorno, cuando sea necesario.

A continuación, se presenta las gráficos y definiciones de diferentes términos


estadísticos, teniendo en cuenta el análisis y la identificación de variables, que
permite hacer un buen manejo en las diferentes técnicas de la estadística.

OBJETIVO
 Identificar y analizar las variables de la estadística descriptiva, teniendo en
cuenta su uso en la sistematización, organización y resumen de la información.
Identificación y Análisis de Variables Estadísticas
 Variable cuantitativa continúa.
Esta se da cuando las características que se vayan a estudiar se puedan medir en
una escala numérica, “si los valores que puede asumir la variable cuantitativa
corresponden potencialmente a cualquier número real, por supuesto en el rango
de variación de la misma, la variable se dice continua”. Surgen por procesos de
medición como pueden ser pesadas o determinaciones de longitudes, tiempos,
áreas y volúmenes.
 Variable cuantitativa discreta.
Tiene la capacidad de asumir valores netamente numéricos y esta se da cuando
los valores posibles de una variable cuantitativa son números enteros y provienen
de un proceso de conteo.
 Variable cualitativa nominal.
Es cuando cada clase representada una cualidad que no tiene ningún sentido
ordenar (como mayor o menor) respecto a otra de las clases de la variable. Se
puede decir también que esta variable presenta modalidades no numéricas que no
admiten criterio de orden. Ejemplos: sexo, tiempo de labranza, nacionalidad,
tenencia de la tierra, etc.
 Variable cualitativa categórica.
También se denomina como variable cualitativa o variables de atributos los valores
de una variable categórica son categorías o grupos mutuamente excluyentes. Los
datos categóricos pueden tener o no tener un orden lógico.
 Media poblacional.
Primero hay que tener en cuenta que población es un conjunto de medidas,
individuos u objetos que se comparten una característica en común. Por tanto, al
media poblacional no es una media, sino un parámetro fijo conocido como valor
esperado.
Es la suma de todos los valores de la población divididos entre el número total de
valores de la población: Donde 𝜇 es la media poblacional, X es la sumatoria de los
valores en la población y N es el tamaño de la población.
∑𝑋
𝜇=
𝑁
 Media muestral. Mostrar la fórmula de cálculo.
Hay que tener en cuenta que la muestra es un conjunto elementos extraídos de la
población. Por lo tanto, la media muestral es una variable aleatoria, ya que
depende de la muestra. Si la muestra es grande y está bien escogida, puede
tratarse la media muestral como un valor numérico que aproxima con precisión la
media poblacional, que caracteriza una propiedad objetiva de la población. Donde
𝑋̅ es la media muestral, 𝑋𝑖 es la sumatoria de los valores en la muestra y n es el
tamaño de la muestra.
∑𝑋𝑖
𝑋̅ =
𝑛
 Varianza poblacional.
Cuando se tiene la totalidad de los datos de la población, el promedio de las
desviaciones elevadas al cuadrado se denomina varianza poblacional y se
representa con la letra del alfabeto griego sigma (𝜎 2 ). Para una población con
total de datos N y promedio μ, el parámetro para la varianza se calcula mediante la
siguiente ecuación:
∑(𝑥𝑖 − 𝜇)2
𝜎2 =
𝑁
 Varianza muestral. Registrar fórmulas de cálculo.
La varianza de la muestra (s2) tiene como objetivo convertirse en un estimador de
la variación para la población; por tal razón, se define como la suma de las
desviaciones elevadas al cuadrado, distribuidas entre el tamaño de la muestra,
menos uno. El estimador para la varianza muestral se calcula mediante la
siguiente ecuación:

La varianza indica la desviación de los datos respecto a la media. Para comparar


dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus
varianzas de manera que el resultado indique cuál de ellas es más homogénea o
cuál es más heterogénea.
 Desviación estándar.
La desviación estándar es considerada la medida de dispersión con mayor
representatividad para un conjunto de datos. Matemáticamente se calcula como la
raíz cuadrada positiva de la varianza, y se denota por (s) cuando se estima para la
muestra y por (𝜎) si se calcula para la población:
2
𝑆 = √𝑆 2
2
𝜎 2 = √𝜎 2

 Mediana.
Se define como el valor que divide una distribución de datos ordenados en dos
mitades, es decir, se encuentra en el centro de la distribución.
La mediana se simboliza como Me. Es menos usada que la media aritmética. Para
su cálculo es necesario que los datos estén ordenados. Cuando la cantidad de
datos es impar, fácilmente se identifica la mediana; pero cuando el número de
datos es par, la mediana se calcula hallando el valor medio entre los dos valores
centrales y no coincidirá con ninguno de los valores del conjunto de datos.
En muchas referencias bibliográficas se expone una ecuación para el cálculo de la
mediana cuando los datos se encuentran agrupados.

Dónde:
n es el tamaño de la muestra o la suma de todas las frecuencias.

𝑓𝑘−1 : Es la frecuencia absoluta acumulada de la clase anterior de la clase de la


mediana.

𝑓𝑘 : Es la frecuencia absoluta de la clase de la mediana.

𝐴𝑘 : Es la amplitud de la clase de la mediana.


𝐿𝑘 : Es el límite real inferior de la clase de la mediana.

 Moda.
Se trata del valor más frecuente en un conjunto de datos. Se considera como el
valor más representativo o típico de una serie de valores. Es simbolizada como
Mo. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal.
Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más
alta, todos los valores son modas, por lo que el conjunto de datos recibe el nombre
de multimodal o polimodal.
Cuando los datos se encuentran agrupados la moda es la marca de clase del
intervalo de clase que contiene la mayor frecuencia. Es usual también hacer uso
de la siguiente ecuación para su cálculo:
Donde:
𝑓𝑘−1 : Es la frecuencia absoluta de la clase anterior en donde se encuentra el dato
más frecuente.

𝑓𝑘+1 : Es la frecuencia absoluta de la clase posterior en donde se encuentra el dato


más frecuente.
𝐴𝐾 : Es la amplitud de la clase en donde se encuentra el dato más frecuente.

𝐿𝐾 : Es el límite real inferior de la clase en donde se encuentra el dato más


frecuente.
 Cuartiles.

Los cuartiles (𝑄𝑘 ) son valores que fraccionan la distribución de los datos en cuatro
partes iguales. Existen tres cuartiles y cada una de las partes representa un 25%
de los datos.

El primer cuartil (𝑄1 ) deja por debajo el 25% de la distribución de los datos o el
75% por encima de él. El segundo cuartil (𝑄2 ) acumula el 50% de los datos por
debajo y el otro 50% por encima de él (por tal razón es igual a la mediana); y el
tercer cuartil (𝑄3 ) deja por debajo el 75% de los datos y por encima el 25%

 Percentiles.

Los percentiles (𝑄𝑘 ) son valores que fraccionan la distribución de los datos en cien
partes iguales.
En la distribución se presentan 99 percentiles: el primer percentil P1 acumula el
1% del conjunto de datos, el percentil P2 deja el 2%, y de forma similar los demás
percentiles hasta llegar al percentil P99 que acumula el 99% de los datos.

 Regla de Sturges ¿para qué sirve?


Para hallar el número de intervalos de clase (𝑘). Este número depende de la
cantidad de datos disponibles. Esta regla afirma que el número de intervalos de
clase (𝑘) viene dado por:
𝒌 = 𝟏 + 𝟑. 𝟑𝟐𝟐 𝐥𝐨𝐠(𝑵)
donde N es el tamaño de la muestra. Si de este cálculo resulta un número
decimal, éste de redondearse al entero superior.
 Frecuencia absoluta.
Es el número de datos que pertenece a cada clase o que caben en cada intervalo
(número de individuos). La frecuencia se simboliza con (𝑛𝑖 ).
 Frecuencia relativa.

Es el cociente entre la frecuencia absoluta (𝑛𝑖 ) y el número total de datos. Se


simboliza (𝑓𝑖 ). La frecuencia relativa representa un porcentaje, que se haya
multiplicando por 100 al cociente indicado de la frecuencia relativa. Se usa la
𝑛𝑖
siguiente educación. 𝑓𝑖 = ∗ 100
𝑁
 Frecuencia absoluta acumulada.

La frecuencia absoluta acumulada (𝑁𝑖 ) es la adición de las frecuencias absolutas


(𝑓𝑖 ) hasta alcanzar la totalidad de los datos. Se calcula mediante la siguiente
𝑖
ecuación: 𝑁𝑖 = ∑𝑘=1 𝑛𝑘

 Frecuencia relativa acumulada.

La frecuencia relativa acumulada (𝐹𝑖 ) es la adición de las frecuencias relativas (𝑓𝑖 )


hasta alcanzar la totalidad de los datos. Se calcula mediante la siguiente ecuación:
𝐹𝑖 = ∑𝑖𝑘=1 𝑓𝑘
 Tabla de frecuencias.
Una distribución o tablas de frecuencias es un resumen de los datos en el cual,
cada opción de respuesta de la variable se relaciona con el número de datos
correspondiente.
 ¿Cómo es la tabla de frecuencias de una variable continua y de una
discreta? ¿cuál tiene intervalos?
Las tablas de frecuencias para una variable cuantitativa discreta no tienen
intervalos de clase, porque son valores exactos, puesto que este tipo de variables
son conteos. En estas tablas se tienen en cuenta la frecuencia absoluta,
frecuencia relativa, frecuencia acumulada, frecuencia absoluta acumulada y la
frecuencia relativa acumulada.

En cuanto a las tablas de frecuencia de una variable continua si tienen intervalos


de clase que son rangos, estos se pueden hallar utilizando la regla de Sturges.
Esto debido a que estas variables utilizan números decimales. También se tienen
en cuenta la frecuencia absoluta, frecuencia relativa, frecuencia acumulada,
frecuencia absoluta acumulada y la frecuencia relativa acumulada.
 Boxplot o diagrama de cajas.
Representa la distribución de una variable cuantitativa continua como son; la
mediana, percentiles, valores extremos y de dispersión. También compara
gráficamente el comportamiento de una variable en distintos grupos.

 Histograma y en qué tipo de variables se usa.


El histograma de frecuencias está conformado por un conjunto de rectángulos
distribuidos en un plano cartesiano. Los histogramas representan variables
cuantitativas continuas.
En el plano cartesiano, sobre el eje horizontal se distribuyen los intervalos de la
variable y sobre el eje vertical se ubican las frecuencias. La base de los
rectángulos está determinada por la amplitud del intervalo, y la altura de cada
rectángulo corresponde a la frecuencia que presenta cada intervalo.
Gráfica Histograma de frecuencias absolutas para el ejemplo del tiempo requerido
por un grupo de personas para realizar una actividad.

 Gráfico de barras y en qué tipo de variables se usa.


El diagrama de barras es de las gráficas más utilizadas en los diferentes tipos de
informes debido a que dan a conocer de forma fácil y sencilla las características
de un grupo de elementos de una muestra o una población, especialmente cuando
están asociadas a variables cualitativas o cuantitativas discretas.
El diagrama de barras consiste en líneas gruesas que constituyen rectángulos de
anchura variable que representan los valores que toma la variable, y de longitud
definida por las frecuencias absolutas o relativas. Las barras se construyen de
forma horizontal o vertical y cada una puede ser representada con frecuencias
absolutas o relativas.
Gráfica de barras de frecuencias absolutas para el ejemplo de número de alumnos
que conocen un lugar turístico.
Participación webconferencia lunes 16 de septiembre:
ZCO_CEAD_Bucaramnaga_Folkenberg Díaz
CONCLUSIONES
Por medio de la identificación de las variables estadísticas, pude darme cuenta
que estas permiten optimizar los procesos en cuanto a la sistematización,
organización y resumen de la información para posterior analizar los datos, así
como obtener conclusiones válidas para tomar decisiones que sean razonables.
Por medio de este compilado conceptual, pude ampliar de forma teórica, lo que
esta relacionado de forma general con la estadística descriptiva, ya que como
futuro ingeniero ambiental debo tener muy en cuenta estos conceptos.
BIBLIOGRAFÍAS Y WEBGRAFÍA

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en


problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=32
21775&query=bioestadistica

 Murria R. Spiegel, Larry J. Stephens, (2009). Estadística. Mexico:


Interamericana Editores.

 Posada, G. J. (2016). Elementos básicos de estadística descriptiva para el


análisis de datos. Medellín: Fondo Editorial Luis Amigó.

 https://edumatematicas.files.wordpress.com/2012/05/modulo-estadistica-
descriptiva.pdf

S-ar putea să vă placă și