Sunteți pe pagina 1din 41

Estadstica

Para que nos sirve?


La

estadstica se utiliza como tecnologa al servicio


de las ciencias donde la variabilidad y la
incertidumbre forman parte de su naturaleza.

La

ciencia por lo general se ocupa de fenmenos


observables.

La

ciencia se desarrolla observando hechos,


formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes.

Definicin:
Es la rama de la matemtica que comprende mtodos
y tcnicas que se emplean en la recoleccin,
ordenamiento, resumen, anlisis, interpretacin y
comunicacin de conjuntos de datos.
Descriptiva: Sistematizacin, recogida, ordenacin
y presentacin de los datos referentes a un
fenmeno que presenta variabilidad o incertidumbre
para su estudio metdico.
Probabilidad: con objeto de deducir las leyes que rigen
esos fenmenos.
Inferencia: poder de esa forma hacer previsiones sobre
los mismos, tomar decisiones u obtener
conclusiones.

Pasos de un estudio estadstico


Plantear
hiptesis

Disear
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

Plantear hiptesis sobre una poblacin


Los fumadores tienen ms bajas laborales que los no fumadores
En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)

Qu individuos pertenecern al estudio (muestras)


Fumadores y no fumadores en edad laboral.
Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades
crnicas?

Qu datos recoger de los mismos (variables)


Nmero de bajas
Tiempo de duracin de cada baja
Sexo? Sector laboral? Otros factores?

Recoger los datos (muestreo)

Estratificado? Sistemticamente?

Describir (resumir) los datos obtenidos


tiempo medio de baja en fumadores y no (estadsticos)
% de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin


Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95%

Significacin del contraste: p=2%

Poblacin y Muestra:
Poblacin: Es un conjunto cuyos

elementos poseen alguna


caracterstica comn que se
quiere estudiar, ya sea de
individuos, de animales, de
objetos, de medidas, de
producciones, de acontecimientos
o de sucesos. La poblacin puede
ser finita o infinita.

Muestra: subconjunto de la

poblacin al que tenemos acceso


y sobre el que realmente asemos
las observaciones ( mediciones).
Debera ser representativo
Esta formado por miembros
seleccionados de la poblacin
(individuos, unidades
experimentales).

Muestreo
En estadstica un muestreo es la

tcnica para la seleccin de una


muestra a partir de una poblacin.
Al elegir una muestra, se espera
que sus propiedades sean
extrapoladles a la poblacin. Este
proceso permite ahorrar recursos,
obteniendo resultados parecidos
que si se realizase un estudio de
toda la poblacin.

Tcnicas de muestreo
Muestreo probabilstico: son todos aquellos mtodos para los que puede calcularse la
probabilidad de extraccin de cualquiera de las muestras posibles.
-Sin reposicin de los elementos.
-Con reposicin de los elementos.
*Sistemtico: Se utiliza cuando el universo es de gran tamao o ha de extenderse en el
tiempo.
*Estratificado: Consiste en la divisin previa de la poblacin de estudio en grupos o
clases que se suponen homogneos respecto a caracterstica a estudiar. A cada uno
de estos estratos se le asignara una cuota que determinara el nmero de miembros
del mismo que compondrn la muestra. (agrupados en estratos)
Muestreo por conglomerados: Cuando la poblacin se encuentra dividida, de manera
natural, en grupos que se suponen que contienen toda la variabilidad de la
poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir,
pueden seleccionarse slo algunos de estos grupos o conglomerados para la
realizacin del estudio.

Variables

Una variable es una caracterstica observable que vara entre


los diferentes individuos de una poblacin. La informacin que
disponemos de cada individuo es resumida en variables.

En los individuos de la poblacin humana, de uno a otro es


variable:
El grupo sanguneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad declarado
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
El nmero de hijos
{0,1,2,3,...} Var. Numrica discreta
La altura
{162 ; 174; ...} Var. Numrica continua

Tipos de variables

Cualitativas: son aquellas cuando las observaciones realizadas se


refieren a un atributo (no son numricas), por ej: sexo,
nacionalidad, profesin. Si sus valores (modalidades) no se
pueden asociar naturalmente a un nmero (no se pueden hacer
operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar
(S/No)
Ordinales: Si sus valores se pueden ordenar
Mejora a un tratamiento, Grado de satisfaccin, Intensidad
del dolor

Cuantitativas: son aquellas en que cada observacin tiene un


valor expresado por un numero real, por ej: peso, temperatura,
salario. (tiene sentido hacer operaciones algebraicas con ellos)
Discretas: Si toma valores enteros
Nmero de hijos, Nmero de cigarrillos, Num. de
cumpleaos.
Continuas: Si entre dos valores, son posibles infinitos valores
intermedios.
Altura, Presin intraocular, Dosis de medicamento
administrado, edad, peso, estatura.

Los posibles valores de una variable suelen denominarse


modalidades.

Las modalidades pueden agruparse en clases (intervalos)


Edades:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos

Hijos:

Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la
variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores


simultneos de la variable

Estudio sobre el ocio


Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

Presentacin de datos
Gnero

Frec
.

Hombre

Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras


equivalentes de presentar la informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.

Clasificacin de las variables (tipos de escala)

Escala nominal: etiquetas simples, solo permite identificar el objeto en


estudio. Ej: cdigo de barras, Rut, patente.
Escala ordinal: mediciones en que que existe un orden implcito, admite
grados de calidad.
Escala intervalar: considera no solo la informacin, permite el orden,
permite tambin cuantificar las diferencias entre los individuos que
pertenecen a clases o categoras distintas. (En esta escala no existe el
cero absoluto)
Escala de razn: considera todas las cualidades de la escala anterior,
pero si existe el cero absoluto. Ej : escalas de medicin KM

Tabulacin de datos

Frecuencia [f]: numero de veces que se repite un dato (tambin se le


denomina frecuencia absoluta)
Frecuencia acumulada [Fac]: es la que se obtiene sumando ordenadamente
las frecuencias absolutas hasta la que ocupa la ultima posicin
Frecuencia relativa [Fr]: es el cuociente entre la frecuencia absoluta de uno
de los valores de la variable y el total de datos, expresado en tanto
porciento
Frecuencia relativa acumulada [Frac] es la que se obtiene sumando
ordenadamente la frecuencia relativa hasta la que ocupa la ultima posicin.
Marca de clase: se define como el promedio de lados extremo de un
intervalo.
Datos a Granel: datos dispersos, datos sueltos

Tablas de frecuencia
Sexo del encuestado

Vlidos

Hombre
Mujer
Total

Frecuencia Porcentaje
636
41,9
881
58,1
1517
100,0

Porcentaje
vlido
41,9
58,1
100,0

Nmero de hijos

Vlidos

Nivel de felicidad

Vlidos

Perdidos
Total

Muy feliz
Bastante feliz
No demasiado feliz
Total
No contesta

Frecuencia
467
872
165
1504
13
1517

Porcentaje
30,8
57,5
10,9
99,1
,9
100,0

Porcentaje
vlido
31,1
58,0
11,0
100,0

Porcentaje
acumulado
31,1
89,0
100,0

Perdidos
Total

0
1
2
3
4
5
6
7
Ocho o ms
Total
No contesta

Frecuencia Porcentaje
419
27,6
255
16,8
375
24,7
215
14,2
127
8,4
54
3,6
24
1,6
23
1,5
17
1,1
1509
99,5
8
,5
1517
100,0

Porcentaje
vlido
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcentaje
acumulado
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

Medidas de tendencia central

TRES MEDIDAS SE USAN PARA DESCRIBIR EL CENTRO O


LOCALIZACION DE UN CONJUNTO DE DATOS.

LA MODA

LA MEDIANA

LA MEDIA (PROMEDIO)
-LA MEDIA GEOMETRICA
-LA MEDIA ARMONICA

La Moda

Interpreta el significado de centro como el valor que ocurre con mayor frecuencia.
(el que mas se repite)

Se define o
calcula:

La moda puede no ser nica

La Mediana

La mediana identifica el valor central de los valores provenientes de una


muestra. La mediana es entonces una medida de centralidad. La mitad de
los valores de la muestra sern mas grandes que la mediana y la otra
mitad sern mas pequeos.

Se calcula:
-Si N es
impar:
(Donde Me sera la
mediana)

-Si N
es par:

La Media

Media aritmtica: es el valor obtenido sumando las observaciones


y dividiendo esta suma por el nmero de observaciones que hay en el
grupo. La media resume en un valor las caractersticas de una variable
teniendo en cuenta a todos los casos. Solamente puede utilizarse con
variables cuantitativas

Se calcula:

-Donde xi es la marca de
clase

Media geomtrica: La media geomtrica de N observaciones es la


raz de ndice N del producto de todas las observaciones. La
representaremos por G.

-Se calcula:

(No interfieren valores o medidas negativas)

La media geomtrica de un conjunto de observaciones es la raz n sima de su producto. El clculo


de la media geomtrica exige que todas las observaciones sean positivas.

Media armnica: La media armnica de N observaciones es la inversa


de la media de las inversas de las observaciones y la denotaremos por H.

-Se calcula:

Desviaciones
Desviacin media: Si calculamos la suma de los errores absolutos y la
dividimos por el tamao de la muestra, es decir, calculamos el promedio
de los errores absolutos, obtenemos una medida de dispersin conocida
con el nombre de DESVIACION MEDIA (D.M)

Errores absolutos: ignora el


signo de cada desvo (+/-).
En general si disponemos del conjunto de valores x1 ,x 2.x
n , la desviacin
media para estos valores se define por:

Desviacin estndar: La desviacin estndar resulta ser la


distancia que se obtiene entre un dato observado o medido y la
media de los mismos.

Es decir:

Grficos estadsticos

Los grficos son medios


popularizados y a menudo los
ms convenientes para
presentar datos, se emplean
para tener una representacin
visual de la totalidad de la
informacin. Los grficos
estadsticos presentan los
datos en forma de dibujo de tal
modo que se pueda percibir
fcilmente los hechos
esenciales y compararlos con
otros.

Tipos de grficos estadsticos

Barra
Lnea
Circulares
reas
Cartogramas
Mixtos
Histogramas
Dispersogramas
Pictogramas

Grficos de barras verticales

Representan valores usando trazos verticales, aislados


o no unos de otros, segn la variable a graficar sea
discreta o continua. Pueden usarse para representar:

O una serie
O dos o mas
series(tambin
llamado de barras
comparativas)

Grficos de barras horizontales

Representan valores discretos a base de trazos


horizontales, aislados unos de otros. Se utilizan cuando
los textos correspondientes a cada categora son muy
extensos.

O para una serie


O para mas o dos
series

Grficos de barras
proporcionales
Se usan cuando lo que se busca es resaltar la
representacin de los porcentajes de los datos que
componen un total.
Las barras pueden ser:

Verticales
Horizontales

Grficos de barras comparativas

Se utilizan para comparar dos o ms series, para


comparar valores entre categoras.
Las barras pueden ser:

Verticales
horizontales

Grficos de barras apiladas

Se usan para mostrar las relaciones entre dos o mas


series con el total.
Las barras pueden ser:

verticales
horizontales

Grficos de lneas

En este tipo de grfico se representan los valores de los


datos en dos ejes cartesianos ortogonales entre s.
Se pueden usar para representar:
una serie
dos o ms series

Estos grficos se utilizan para representar valores con


grandes incrementos entre s.

Grficos circulares

Estos grficos nos permiten ver la distribucin interna de


los datos que representan un hecho, en forma de
porcentajes sobre un total. Se suele separar el sector
correspondiente al mayor o menor valor, segn lo que se
desee destacar.
Se pueden ser:
En dos dimensiones
En tres dimensiones

Grficos de reas

En estos tipos de grficos se busca mostrar la tendencia


de la informacin generalmente en un perodo de
tiempo.
Pueden ser:

Para representar una serie


Para representar dos o ms series
En dos dimensiones
En tres dimensiones.

Cartogramas

Estos tipos de grficos se utilizan para mostrar datos


sobre una base geogrfica. La densidad de datos se
puede marcar por crculos, sombreado, rayado o color.

Grficos Mixtos

En estos tipos de grficos se representan dos o ms


series de datos, cada una con un tipo diferente de
grfico. Son grficos ms vistosos y se usan para
resaltar las diferencias entre las series.
Pueden ser:

en dos dimensiones
en tres dimensiones.

(polgono de
frecuencia)

Histogramas

Estos tipos de grficos se utilizan para representa


distribuciones de frecuencias. Algn software especfico
para estadstica grafican la curva de gauss superpuesta
con el histograma.

Los dispersogramas

Son grficos que se construyen sobre dos ejes


ortogonales de coordenadas, llamados cartesianos,
cada punto corresponde a un par de valores de datos x
e y de un mismo elemento suceso.

Pictogramas

Los pictogramas son grficos similares a los grficos de barras,


pero empleando un dibujo en una determinada escala para
expresar la unidad de medida de los datos. Generalmente este
dibujo debe cortarse para representar los datos.

Es comn ver grficos de barras donde las barras se reemplazan


por dibujos a diferentes escalas con el nico fin de hacer ms
vistoso el grfico, estos tipos de grficos no constituyen un
pictograma.
Pueden ser:
En dos dimensiones
En tres dimensiones.

Las ojivas en estadstica

La ojiva es una grficas asociada a la distribucin de frecuencias, es decir


que en ella se permite ver cuntas observaciones se encuentran por encima
o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados
a cada intervalo.
La ojiva apropiada para informacin que presente frecuencias mayores que
el dato que se est comparando tendr una pendiente negativa ( hacia abajo
y a la derecha) y en cambio la que se asigna a valores menores, tendr una
pendiente positiva.

Diagramas Integrales

Se realizan a partir de las frecuencias acumuladas. Indican, para cada


valor de la variable, la cantidad (frecuencia) de individuos que
poseen un valor inferior o igual al mismo. Se pasan de los
diferenciales a los integrales por integracin y a la inversa por
derivacin.

S-ar putea să vă placă și