Sunteți pe pagina 1din 18

CARATULAAA

ESTADISTICA.
La estadística podría definirse como la ciencia que se encarga de recopilar, organizar, procesar,
analizar e interpretar datos con el fin de deducir las características de una población objetivo.1
(S/A, 2009)

Existen distintos tipos de estadística:

 DESCRIPTIVA O DEDUCTIVA: esta clase de estadística se utiliza con el propósito de


recolectar, describir y resumir un conjunto de datos obtenidos.
 INFERENCIAL O INDUCTIVA: Esta clase de estadística tiene la particularidad de que a
partir de los datos muéstrales que maneja, es posible realizar conclusiones y predicciones
que incluyan a toda la población.
 APLICADA: Está conformada por las dos clases de estadísticas anteriores. Su objetivo
consiste en deducir resultados sobre un universo, a partir de una muestra determinada.
 ESTADÍSTICA MATEMÁTICA: Se refiere al empleo de la estadística, pero desde un
punto de vista formal, a través del uso de distintas ramas propias de la matemática y de la
teoría de la probabilidad.2 (S/A, TIPOS DE, s.f.)

5.1 ORGANIZACIÓN DE DATOS


Cuando se han recopilado datos de alguna variable a estudiar, es necesario organizarlos. Por lo
general estos se organizan de manera ascendente, para su mejor interpretación.
Por ejemplo: Al recopilar los datos sobre la edad de 8 personas , se obtuvieron los siguientes
registros (1,5,12,7,9,8,7,4).

 En este ejemplo la unidad experimental son personas, la variable de estudio es la edad


(variable cuntitativa discreta) y el número de datos es 8.
 Al organizar los datos de manera ascendente, estos se presentan así:

1,4,5,7,7,8,9,12
Podemos observar que hay un valor máximo y un mínimo, a la diferencia entre estos valores se
le llama Rango u oscilación. 3R= 12-1 = 11 (Mendizabal, 2017)

1
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/

2
https://www.tiposde.org/ciencias-exactas/209-tipos-de-estadisticas/

3
https://marcelomendizabal.wordpress.com/2017/02/06/como-se-organizan-los-datos-estadisticos/
Datos

Dato: El dato es una Representación simbólica (Numérica, alfabética, algorítmica, etc.), un


atributo o una característica de una entidad conocida como unidad de información. El dato no
tiene valor (sentido) en si mismo, pero si recibe un tratamiento (procesamiento) adecuado, se
puede utilizar en la realización de cálculos o toma de decisiones.

Variables:

Lo que se estudia en cada unidad de información individuo de la muestra son las variables (edad,
sexo, peso, talla, tensión arterial sistólica, etcétera). Los datos son los valores que toma la
variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables
incluidas en el estudio. Deberemos además concretar la escala de medida que aplicaremos a cada
variable.

La naturaleza de las observaciones será de gran importancia a la hora de elegir el método


estadístico más apropiado para abordar su análisis. Con este fin, clasificaremos las variables, a
grandes rasgos, en dos tipos: variables cuantitativas o variables cualitativas.

1. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente. Las variables cuantitativas pueden ser de dos tipos:
 Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango
numérico determinado (edad, peso, talla).
 Variables cuantitativas discretas, si no admiten todos los valores intermedios en un
rango. Suelen tomar solamente valores enteros (número de hijos, número de partos,
número de hermanos, etc).
2. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que
clasifica a cada caso en una de varias categorías. La situación más sencilla es aquella en la
que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no
fumador). Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este
tipo de clasificación no es suficiente y se requiere de un mayor número de categorías (color
de los ojos, grupo sanguíneo, profesión, etcétera).

En el proceso de medición de estas variables, se pueden utilizar dos escalas:

 Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan
por categorías que no mantienen una relación de orden entre sí (color de los ojos, sexo,
profesión, presencia o ausencia de un factor de riesgo o enfermedad, etcétera).

 Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías.4 (Juarez, 2016)

5.1.1 TABLAS DE FRECUENCIA.

Las Tablas de frecuencias son herramientas de Estadística donde se colocan los datos en columnas
representando los distintos valores recogidos en la muestra y las frecuencias (las veces) en que ocurren.

ELEMENTOS DE LA TABLA DE FRECUENCIA:

Tablas de frecuencias

4
https://sites.google.com/site/estadisticadm/b-organizacion-y-presentacon-de-datos
Datos

Los datos son los valores de la muestra recogida en el estudio estadístico.

Frecuencia absoluta

La frecuencia absoluta (ni) es el número de veces que aparece un determinado valor en un estudio
estadístico. Número de veces que se repite el í-esimo valor de la variable. La suma de las
frecuencias absolutas es igual al número total de datos, que se representa por n

Frecuencia absoluta acumulada

La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.

N1 = n1

N2 = n1 + n2 = N1 + n2

N3 = n1 + n2 + n3 = N2 + n3

Nk = n.

Se interpreta como el número de observaciones menores o iguales al í-esimo valor de la variable.


Frecuencia relativa

La frecuencia relativa (fi) es la proporción de veces que se repite un determinado dato.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el


número total de datos.

fi = ni/n

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada

La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al í-esimo


valor de la variable pero en forma relativa.

F1 = fl

F2 = f1+ f2 = F1 + f2

F3 = f1+ f2 + f3 = F2 + f3

Fk = 1

5.1.2 TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS.

TABLA DE FRECUENCIAS DE DATOS NO AGRUPADOS

Los datos no agrupados son las de observaciones realizadas en un estudio estadistico que se
presentan en su forma original tal y como fueron recolectados, para obtener información
directamente de ellos.

La Tabla de frecuencia de datos no agrupados indica las frecuencias con que aparecen los datos
estadísticos sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En
estas distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.
La tabla de frecuencias de datos no agrupados se emplea si las variables toman un número
pequeños de valores o la variable es discreta.

TABLA DE FRECUENCIA DE DATOS AGRUPADOS.

La Tabla de frecuencia de datos agrupados aquella distribución en la que los datos estadísticos se
encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de
varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

"Ejemplo de Tabla de Frecuencia de datos agrupados"

La tabla de frecuencias agrupadas se emplea generalmente si las variables toman un número


grande de valores o la variable es continua.

En este caso se agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente.

Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento de la muestra debe
pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase.

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Los intervalos se forman teniendo presente que el límite inferior de una clase pertenece al intervalo,
pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo. No existe una
regla fija de cuantos son los intervalos que se deben hacer; hay diferentes criterios, la literatura
especializada recomienda considerar entre 5 y 20 intervalos. El número de intervalos se representa
por la letra "K".

El Recorrido es el límite dentro del cual están comprendidos todos los valores de la serie de datos,.
Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una
investigación cualquiera.

R = Xmax. - Xmin.

La Amplitud de la clase es la diferencia entre el límite superior e inferior de la clase y se


representarán por "Ci"

Ci = R/K

Se considerará la misma amplitud para todos los intervalos.

La Marcas de clases (Xi) representa a la variable a través de un valor. Se calcula como el punto
medio de cada clase, o bien la semi suma de la clase

La tabla de frecuencias puede representarse gráficamente en un histograma. Normalmente en el


eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.5 (Anónimo, 2014)

5.1.3 MODELOS DE TABLAS ESTADÍSTICAS.

Tabla bidimensional simple:

Está formada por tres filas o columnas en las que se representan ordenadamente los valores de las
variables y sus frecuencias. Está indicada para casos con pocos datos y pocos valores o ninguno
repetidos. Es la tabla correspondiente al ejemplo de la página anterior.

xi x1 x2 ... xi ... xm

yj y1 y2 ... yj ... yn

5
https://www.ecured.cu/Tablas_de_frecuencias
fij f11 f22 ... fij ... fmn N

En caso de que las frecuencias sean iguales a uno, se puede omitir la fila o columna correspondiente
a las mismas escogiendo la fila o columna de cada una de las variables junto con la de las
frecuencias, tenemos la tabla correspondiente a cada una de las variables unidimensionales, que
podremos utilizar para calcular la media y la desviación típica de las mismas.

Tabla de doble entrada. Está formada por tantas filas y columnas como valores tengamos de cada
una de las variables, más una fila y una columna más para indicar los totales. Está indicada para
casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la
otra.

Frecuencia
absoluta
x1 x2 ... xi ... xm
de la
variable Y

y1 f11 f21 ... fi1 ... fm1 Σfi1

y2 f12 f22 ... fi2 ... fm2 Σfi2

... ... ... ... ... ... ... ...

yj f1j f2j ... fij ... fmj Σfij

... ... ... ... ... ... ... ...


yn f1n f2n ... fin ... fmn Σfin

Frecuencia
absoluta
Σf1j Σf2j ... Σfij ... Σf1n N
de la
variable X

Escogiendo la primera y la última fila, tenemos la tabla estadística correspondiente a la primera variable
unidimensional. Con la primera y última columnas construimos la tabla correspondiente a la segunda variable
unidimensional. Estas dos distribuciones reciben el nombre de distribuciones marginales. En la última celda
aparecerá el total de la última fila y de la última columna, es decir, el número total de elementos estudiados
(N).

Además, en esta tabla puede resultar de interés estudiar distribuciones unidimensionales correspondientes a
un valor determinado de alguna de las variables, llamadas distribuciones condicionada6 (Calmaestra, 2005)

5.2 GRÁFICOS DE REPRESENTACIÓN.

Una gráfica o representación gráfica es un tipo de representación de datos, generalmente numéricos,


mediante recursos visuales (líneas, vectores, superficies o símbolos), para que se manifieste visualmente
la relación matemática o correlación estadística que guardan entre sí. También es el nombre de un conjunto

6
http://recursostic.educacion.es/descartes/web/materiales_didacticos/bidimensional_lbarrios/tablas_est.ht
m
de puntos que se plasman en coordenadas cartesianas y sirven para analizar el comportamiento de un proceso
o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. La representación gráfica
permite establecer valores que no se han obtenido experimentalmente sino mediante la interpolación (lectura
entre puntos) y la extrapolación (valores fuera del intervalo (Anónimo, wikipedia, 2017)7

5.2.1 HISTOGRAMA.

Es una representación gráfica que maneja distintas estadísticas. Su utilidad se basa en ver o mostrar la
posibilidad de establecer de manera visual, ordenada y fácil los datos numéricos y estadísticos que pueden
tornarse complicados de entender. Existen varios tipos de histogramas que ejecutan de manera variada
muchos tipos de información.

Normalmente son utilizados en la estadística, con la intención de exponer gráficamente número, variables y
cifras con el fin de que los resultados sean visualmente claros y ordenados. Casi siempre se presenta en barras,
ya que es mucho más fácil entenderlos de esta manera, dependiendo de cómo se utilicen, las ramas en las que
más facilita los datos son las ciencias sociales, de hecho pueden compararse datos sociales como resultados
de censo, nivel de analfabetismo o mortalidad infantil.

Los puntos focales de un histograma, son los siguientes:

 Realizar un análisis de distribución de datos.


 Comprobar el grado de cumplimiento de las especificaciones.
 Evaluar la eficacia de las soluciones.

Existen además, dos tipos de informaciones básicas para la elaboración de los histogramas, las cuales son la
complejidad, el diseño, la frecuencia de los valores y los valores en sí. Normalmente, las frecuencias son
representadas en el eje vertical mientras que en el horizontal se representan los valores de cada una de las
variables.

Tipos de histogramas:

 De barras simples: son las más utilizados.

7
https://es.wikipedia.org/wiki/Gr%C3%A1fica
 De barras compuestas: permiten introducir información sobre dos variables.
 De barras agrupadas: se rigen bajo una8 información específica.
 Polígono de frecuencia y ojiva porcentual: ambos son utilizados normalmente por expertos.

A pesar de la complejidad con la que esta definición se trata, existe material suficiente respecto a la creación
de estos gráficos estadísticos. Las frecuencias acumuladas según expertos son más fácil de representar en los
(Anónimo, definición.de , 2017).

5.2.2 POLIGONAL DE FRECUENCIAS.

El polígono de frecuencias es un gráfico que permite la rápida visualización de las frecuencias de cada una
de las categorías del estudio.
Normalmente se utiliza con frecuencias absolutas, pero también se utiliza con frecuencias relativas (Universo
formulas, 2016)9

5.2.3 DIAGRAMA DE TALLO Y HOJAS.

El diagrama de tallos y hojas es un formato para presentar datos cuantitativos en un formato gráfico, similar
a un histograma.

8
https://conceptodefinicion.de/histograma/

9
https://www.universoformulas.com/estadistica/descriptiva/poligono-frecuencias/
Permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último dígito de la derecha (que constituye la hoja) del bloque
de cifras restantes (que formará el tallo)10.(anónimo, 2018).

5.3 MEDIDAS DE TENDENCIA CENTRAL.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable. Dicho en otros términos las medidas de
dispersión pretenden evaluar en qué medida los datos difieren entre sí.(anónimo, MedWave, 2014)11

5.3.1 LA MEDIA ARITMÉTICA.


La media aritmética es el promedio o medición de tendencia central de uso más común. Se calcula sumando
todas las observaciones de una serie de datos y luego dividiendo el total entre el número de elementos
involucrados.
5.3.2 LA MEDIANA
La mediana es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por ninguna
observación extrema de una serie de datos. Por tanto, siempre que esté presente una observación extrema es
apropiado usar la mediana en vez de la media para describir una serie de datos.

Para calcular la mediana de una serie de datos recolectados en su forma sin procesar, primero debemos
poner los datos en una clasificación ordenada. Después usamos la fórmula de punto de posicionamiento:

10
https://es.wikipedia.org/wiki/Diagrama_de_tallos_y_hojas
11
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
Para encontrar el lugar de la clasificación ordenada que corresponde al valor de la mediana, se sigue una de
las dos reglas:

Si eSi tamaño de la muestra es un número impar, la mediana se representa mediante el valor numérico
correspondiente al punto de posicionamiento, la observación ordenada es (n+1)/2.
 Si el tamaño de la muestra es un número par entonces el punto de posicionamiento cae entre las dos
observaciones medias de la clasificación ordenada. La mediana es el promedio de los valores numéricos
correspondientes a estas dos observaciones medias.
5.3.3 LA MODA

Es el valor de una serie de datos que aparece con más frecuencia. Se obtiene fácilmente de una clasificación
ordenada. A diferencia de la media aritmética, la moda no se ve afectada por la ocurrencia de los valores
extremos.
Ejemplo: Los valores siguientes son las calificaciones de un alumno durante todo el año

7; 8; 9; 7; 9; 8; 8; 8; 7; 8
Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece con más
frecuencia.(Jauregui, 2016)12

5.3.4 MEDIDAS DE TENDENCIAS NO CENTRALES.

Estas medidas descriptivas permiten ubicar la posición que ocupa un valor dentro de un conjunto de datos, se
calcula para variables de tipo cualitativo ordinal y de tipo cuantitativo (discreta y continua), cabe agregar que
los resultados se expresan en las mismas unidades de los datos en estudio.

12
https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-mediana-moda-rango-y-eje-
medio/
Percentiles: son aquellos valores que dividen los datos ordenados en cien partes iguales. Existen noventa y
nueve percentiles, dicha medida hace referencia a un porcentaje de casos por debajo del percentil y otros
porcentaje por encima. Entre dos percentiles consecutivos cualesquiera se encuentra un 1% o 1/100 partes de
los datos.
Deciles: son valores que dividen los datos ordenados en diez partes iguales. Existen nueve deciles, dicha
medida deja un porcentaje de datos por debajo del decil y otro porcentaje por encima. Entre dos deciles
consecutivos cualesquiera se encuentra un 10% o 1/10 partes de los elementos.
Cuartiles: son valores que dividen los datos ordenados en cuatro partes iguales. Existen tres cuartiles, por lo
tanto dicha medida hace referencia a un porcentaje de casos por debajo del cuartil y otro porcentaje por
encima. Entre dos perccentiles consecutivos cualesquiera se encuentra un 25% o 1/4 partes de los datos.13
(Chipia, Bioestadística, 2012)

5.4 MEDIDAS DE DISPERSIÓN

Parámetros estadísticos que indican como se alejan los datos respecto de la media aritmética. Sirven como
indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango, la
desviación estándar y la varianza.tar]

5.4.1 RANGO.

Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia entre el mayor
y el menor valor de la variable. Se denota como R.

Para datos ordenados se calcula como:

R = x(n) - x(1)

Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.

5.4.2 VARIANZA

13
http://bioestadisticaula.blogspot.com/2012/08/medidas-de-tendencia-no-central.html
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media.
Corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media. Su expresión
matemática es:

donde Xi es el dato i-ésimo y es la media de los N datos.

COEFICIENTE DE VARIACIÓN.

Permite determinar la razón existente entre la desviación estándar (s) y la media. Se denota como CV. El
coeficiente de variación permite decidir con mayor claridad sobre la dispersión de los datos.

También puede ser expresado en por ciento.


5.4.3 DESVIACIOÓN TÍPICA O MEDIA

Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la media.

Donde:

xi :valores de la variable.

n: número total de datos

Donde:

xi: valores de la variable.

n: número total de datos

DESVIACIÓN ESTANDAR.
La desviación estándar mide el grado de dispersión de los datos con respecto a la media, se denota
como s para una muestra o como σ para la población. Se define como la raiz cuadrada de la varian14za
(Herrera, 2017)

14
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n

S-ar putea să vă placă și