Sunteți pe pagina 1din 32

1

Estadstica
Lic. Olga S. Filippini
2
Metodologa de la Investigacin
La investigacin es un proceso
sistemtico,
organizado y
objetivo
destinado a responder a una pregunta

La respuesta lo que pretende es aclarar la
incertidumbre de nuestro conocimiento.

3
Qu investigar? Definicin del problema
Para qu? Definicin del propsito
Qu estudiar
concretamente?
Definicin de los objetivos
Cmo?
Definicin del tipo de
diseo
Preguntas a responder?
4
Esquema general del planteamiento de un
estudio
Hiptesis de trabajo
Objetivos
Diseo de estudio
Seleccin de variables
Definicin de variables
Escala de medida
Protocolo de recogida
de datos
Construccin de bases
de datos
Depuracin de los
datos
Anlisis
Resultados
Conclusiones
Estadstica: Herramienta indispensable
5
Esquema del proceso de obtener
conclusiones a partir de los datos
OBJETIVO
Materia Prima
DATOS
Procesamiento
ORGANIZACION Y
ANALISIS
Producto
CONCLUSIONES
6
El caso de anlisis
Una empresa dedicada al alquiler de campos y
produccin de girasol recibe el ofrecimiento de 4 lotes
para alquiler ubicados en 4 localidades diferentes.
Todos los lotes ofrecidos tienen la misma superficie,
los costos de produccin son idnticos y se precisa
obtener un rendimiento mnimo de 15 quintales/ha para
obtener un resultado econmico positivo. Se dispone
de informacin sobre los rendimiento del girasol en los
ltimos 12 aos de las 4 localidades donde se ubican
los lotes ofrecidos. Usted es el asesor tcnico de la
empresa y se le pide que, a partir de dicha informacin,
recomiende un lote para alquilar.
7
Objetivos del anlisis de los datos
Para producir la recomendacin pedida, deber analizar los
datos de modo de contestar la siguiente pregunta general:
Cmo fueron los rendimientos de girasol de los ltimos
12 aos en cada una de las cuatro localidades?
En relacin con esta pregunta general, interesar establecer
y documentar, mediante grficos y medidas, los siguientes
puntos para cada localidad:
Los rendimientos fueron altos o bajos?
Los rendimientos fueron parejos entre aos?
Los resultados econmicos negativos fueron frecuentes o
raros?
Los resultados econmicos sobresalientes fueron
frecuentes o raros?
8
Datos: rendimientos de girasol
[kg/ha]
Ao Loc. A Loc. B Loc. C Loc. D
1994 1400 1900 2000 920
1995 4000 2600 1690 1600
1996 1150 500 1500 1180
1997 2400 1380 1700 750
1998 2200 960 1580 800
1999 3600 0 2100 900
2000 850 2100 1100 1230
2001 3400 1700 1650 1350
2002 1360 1940 1760 1150
2003 1940 1100 1550 1120
2004 2900 1300 1850 1450
2005 260 2230 1730 1130

9
En la actualidad el conjunto de mtodos que la estadstica brinda para atender
todos los problemas hace que se la divida en 2 grandes campos, Estadstica
Descriptiva e Inferencial.


Clasificacin de la estadstica moderna

Cuadros
representacin de datos Tablas
Grficos
Descriptiva
Promedios
Reduccin de datos
Dispersiones

Predice, infiere
Inferencial Trabajo en base a
muestras

Decide sobre las poblaciones

10
VARIABLE
CUALITATIVAS O CATEGORICAS
aquellas que indican una cualidad o sea una caracterstica
no medible o contable,

a) Ordenables: cuando puede hacer una correspondencia
lgica entre los valores de la variable y los nmeros
naturales.

Ejemplo: x= resistencia a Roya =no resistente, resistente o
muy resistente

b) No ordenables: caso contrario al anterior.
Ejemplo : x= Pelajes = Bayo, Zaino, etc.

11
VARIABLE
CUANTITATIVAS
Las que indican caractersticas medibles o contables,
a) Discretas : aquellas cuyos valores se interrumpen o
separan.
Ejemplo : x= nmero de vacas de una granja en una
determinada regin. Los valores posibles son 0, 1, 2,...
existe un salto o ruptura entre ellos, (por ejemplo entre 15 y
16, la variable x nmero de vacas, no puede tomar un valor
15,2).
b) Continuas: aquellas cuyos valores posibles no tienen
interrupcin.
Ejemplo : x= peso de las vacas de una granja en una
determinada regin. Entre 400 y 500 kg podemos tener
infinitos valores.

12
TAREA ESTADISTICA
1. Recopilacin de datos


2. Presentacin de datos


3. Anlisis de datos


4. Interpretacin de resultados
13
Definiciones bsicas
Poblacin es un conjunto de elementos definidos en el
tiempo y en el espacio, sobre los cuales se realizarn
las observaciones en el caso de una encuesta
exhaustiva o censo, o a los cuales se referirn los
resultados de la investigacin en el caso de un estudio
por muestreo.
Muestra es el subconjunto de unidades seleccionadas
de la poblacin definida. En esta recae la realizacin de
las observaciones.
Valores poblacionales Parmetros
Estimadores Estadsticos
14
Los datos recopilados para cada sujeto , unidad de
observacin, expertimental pueden provenir de
distintos tipos de variables y escalas de medicin:
Anlisis de datos
Nominal
Ordinal
Escala de medicin
Cualitativa o Atributo
Intervalo
Razn
Escala de medicin
Discreta
Continua
Tipo
Cuantitativa o Nmerica
Variables
15
Unidad Estadstica
A cada elemento que integra la poblacin se lo llama
unidad estadstica, unidad elemental o simplemente
elemento.
Para seleccionar una muestra, se toman unidades
estadsticas de la poblacin en estudio.


Unidad de Muestreo
Se designa de esta manera a cada uno de los grupos de
unidades estadsticas, que se determinan con el objetivo
de seleccionar la muestra.
16
Presentaciones visuales, reduccin de
datos
Tablas, Grficos y Distribuciones
Qu representacin mental le sugiere la palabra
estadstica a la mayor parte de la gente ?
Una tabla es una ordenacin de datos en filas y columnas
utilizada para documentar o comunicar informacin.
Desde este punto de vista de su uso, existen dos tipos de
tablas a saber : Tablas generales o de Referencia y Tablas
Especficas o de Resumen
17
Distribucin de una variable
cuantitativa discreta
Veamos con un ejemplo la tabla de distribucin de
frecuencias.
En 13 cajones de huevos se cont la cantidad de
huevos desechables por cajn:
x
i
f
i
F
i

f
r
=
i f
n

fri% Fr=
F
n
Fr %
1 2 2 0,1538 15,38 0,1538 15,38
2 4 6 0,3077 30,77 0,4615 46,15
3 1 7 0,0769 7,69 0,5385 53,85
4 3 10 0,2308 23,08 0,7692 76,92
5 2 12 0,1538 15,38 0,9231 92,30
6 1 13 0,0769 7,69 1,0000 100,00
Totales 13 1,000 100,00

18
Distribucin de una variable
cuantitativa continua
Ahora si lo que nos interesa son los ndices de
Productividad ponderado de 20 establecimientos estamos
frente a una variable cuantitativa continua. En este caso
los valores individuales carecen de inters, por la propia
naturaleza de dicha variable, por lo tanto se los agrupa en
los llamados intervalos de clase. La cantidad de
intervalos necesarios para construir una distribucin de
frecuencias no se puede determinar por alguna regla
precisa, depende de la experiencia y el sentido del
investigador, generalmente se utilizan entre 5 -15.

19
Distribucin de una variable
cuantitativa continua
El lmite inferior del primer intervalo debe ser algo menor
que el valor ms pequeo de la variable, y el lmite superior
del ltimo intervalo algo mayor al dato ms grande.
Definiendo:
x
mx
= valor extremo superior de la variable
x
mn
= valor extremo inferior de la variable
La diferencia entre estos dos valores nos da la amplitud
total
A=x
mx
-x
mn
Si creemos que la cantidad de intervalos conveniente es h
entonces la amplitud de los intervalos ser
aproximadamente a=A/h
20
Distribucin de una variable
cuantitativa continua
Veamos por ejemplo...

X= valor de ndice de Productividad de 20
establecimientos.
45,0 55,0 48,9 40,5 42,8
52,0 49,0 52,5 51,7 50,0
50,0 56,5 57,0 52,0 45,0
49,0 44,3 41,0 59,2 46,3

Vemos cul es el valor extremo inferior
x
mn
=40,5
y el extremo superior,
x
mx
=59,2
21
Distribucin de una variable
cuantitativa continua
Para obtener a= amplitud del intervalo.
4
5
20
5
40 60

a
Los intervalos se construyen de tal forma que
contienen al extremo inferior pero no al superior.
Intervalo de clase f
i
F
i
f
ri
F
ri

40,0 - 44,0 3 3 3/20=0,15 3/20=0,15
44,0 - 48,0 4 7 4/20=0,20 7/20=0,35
48,0 - 52,0 6 13 6/20=0,30 13/20=0,65
52,0 - 56,0 4 17 4/20=0,20 17/20=0,85
56,0 - 60,0 3 20 3/20=0,15 20/20=1,00
20 1,00

22
Distribucin de una variable
cuantitativa continua
La representacin grfica correspondiente a la distribucin
de frecuencias simples o relativas de una variable
cuantitativa continua es el
HISTOGRAMA


HISTOGRAMA
0
1
2
3
4
5
6
7
40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0
X
F
R
E
C
U
E
N
C
I
A
S
23







1)Construya un tabla de frecuencias con 10 clases.
2)Construya un histograma que corresponde a la tabla anterior,
3)Realice un diagrama de tallo y hoja.
4)Construya un diagrama de caja.
5)Utilice la tabla de frecuencias para encontrar la media y el desvo
estndar de los nmeros de tomates que se rechazan.

29 58 80 35 30 23 88 49 35 97
12 73 54 91 45 28 61 61 45 84
83 23 71 63 47 87 36 8 94 26
95 63 86 42 22 44 88 27 20 33
28 91 87 15 67 10 45 67 26 19

Caso estudio
Los siguientes puntajes representan el nmero de tomates
rechazados en un da en un mercado mayorista. Los puntajes
corresponden a 50 das seleccionados aleatoriamente:
24
25
Anlisis de Datos
26
Anlisis de Datos
Histograma
27
Histograma
28
29
Medidas que resumen informacin
Promedios y Dispersin
Mediana
Medidas de tendencia Central Modo Media Aritmtica
Promedios Media Geomtrica
Media Armnica


Rango
Medidas de variabilidad y concentracin Desvo medio-
Varianza
Desvo tpico (estndar)
Rango intercuartilar
Coeficiente de Variacin


30
Valor Extremo
leve
Valores
extremos
leves
Extremo o
Outlier
3 D
1.5
D
D
H
I
N
G
E
H
I
N
G
E
M
E
D
I
A
N
A
Diagrama de Caja
(BoxPlot)
31
Coeficiente de Variacin
x
S
cv se puede expresar como % 100 *
x
S
% cv
Si el CV 5% ----> datos muy homogneos, Media
aritmtica muy representativa

Si el 5% CV 20% ----> datos con
homogeneidad aceptable. La media aritmtica es
representativa

Si el CV 20% ----> datos heterogneos, la media
aritmtica es poco representativa

32

Loc D Loc C Loc B Loc A

4.000
3.000
2.000
1.000
0
7
Comparacin de los rindes segn localidades
Descriptive Statistics
12 3740 260 4000 2121,67 339,319 1175,437 1381652
12 2600 0 2600 1475,83 217,519 753,506 567772,0
12 1000 1100 2100 1684,17 73,520 254,682 64862,879
12 850 750 1600 1131,67 74,619 258,486 66815,152
12
Loc A
Loc B
Loc C
Loc D
Valid N (listw ise)
Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic
N Range Minimum Maximum Mean
Std.
Deviation
Variance

S-ar putea să vă placă și