Sunteți pe pagina 1din 53

ESTADSTICA

Dr. Narciso FERNNDEZ SAUCEDO



Profesor Principal UNE
UNIVERSIDAD NACIONAL DE EDUCACION
Enrique Guzmn y Valle
Alma Mter del Magisterio Nacional
LA INVESTIGACIN CIENTFICA

Qu es la Investigacin Cientfica?

Es la bsqueda sistematizada y rigurosa
de nuevos conocimientos.

El mtodo cientfico, comprende realizar
la investigacin en forma sistematizada y
objetiva, organizada y coherente.

Concepcin: Se elige el tema y problema de
investigacin
Planificacin: Elaboracin del proyecto. Abarca
una descripcin detallada y fundamentada de
cada una de las actividades a desarrollarse en
la investigacin.
Ejecucin: Es la etapa en la cual se lleva a cabo
la investigacin. Recoleccin de datos, anlisis
e interpretacin.
Informe: Escrito donde se presentan los
hallazgos encontrados.
Etapas de la Investigacin Cientfica
LA ESTADSTICA
Es la ciencia que comprende un conjunto
de mtodos y tcnicas que se utilizan
para recolectar, clasificar, analizar e
interpretar el comportamiento de los
datos con el fin de obtener conclusiones
y poder predecir algo respecto a un
determinado hecho o fenmeno en
estudio.
LA ESTADSTICA
DESCRIPTIVA
Describe y analiza,
mediante la recoleccin,
clasificacin y
presentacin de los
datos de una poblacin o
muestra.
inferir o inducir
leyes de
comportamiento
de una poblacin
a partir de una
muestra
INFERENCIAL
Predecir y/o
tomar
decisiones
con respecto
a la fuente de
informacin
Se clasifica en
Es aquella que
propsito
funcin
POBLACIN
Es un conjunto
de individuos,
elementos o unidades
que presentan
caractersticas
comunes
observables
Unidad de anlisis
MUESTRA
Es un
Subconjunto
de la poblacin
Unidad estadstica
Es un camino que conduce
a obtener y estudiar los
datos, realizando las
siguientes tcnicas:
RECOLECTAR
ORGANIZAR
ANALIZAR
INTERPRETAR
DATOS
Qu es el Mtodo
Estadstico ?
A esta secuencia se llama proceso estadstico.
Es el registro de caractersticas
(medicin, observacin, conteo) de
una unidad elemental (o de anlisis).
Qu es la Recoleccin de datos ?
Qu es la Organizacin de datos ?
Es el ordenamiento para una mejor
comprensin y facilitar su anlisis.
(tablas, grficos y figuras)
Los datos sin organizar se llaman datos
brutos, y son de poca utilidad.
Es el clculo de medidas representativas
(o de resumen) tales como promedios,
medidas de variabilidad y medidas de la
forma de la distribucin.
Tambin se analizan datos cuando
se establecen relaciones entre
ellos (regresin y correlacin).
Qu es el Anlisis de datos ?
Qu es la Interpretacin de datos ?
Es darle un sentido prctico o til a
los resultados obtenidos en el
anlisis.
Son los registros de una caracterstica.
Ejemplo :
Si un DATO es til para tomar decisiones se
convierte en INFORMACIN.
Qu son los DATOS ?
Edad del paciente
Peso del recin nacido
Tiempo permanencia
Temperatura corporal
Profesin
27
3,750
5
37,5
Enfermera
aos
Kg.
das
C
---
Caractersticas
Datos
Unidad de
medida

Proporcionan la evidencia imprescindible en
un estudio de investigacin.
Permiten medir el desempeo en el proceso
de produccin de un bien o servicio.
Ayudan a la formulacin de cursos
alternativos de accin en un proceso de
toma de decisiones.
Satisfacen nuestra curiosidad innata.
Por qu necesitamos recolectar datos?
DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
UNIDAD DE ANALISIS.- Llamada tambin elemento de la
poblacin: es la unidad de la cual se obtiene el dato estadstico;
tambin se le denomina como la unidad indivisible y es el objeto
de estudio. Ejemplo: Puede ser una persona, vivienda, animal,
etc.

POBLACION.- Es el conjunto de personas u objetos con una
caracterstica o atributo especial cuantificable, en un periodo y
en un lugar determinado.


DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
MUESTRA.- Es un Subconjunto de la poblacin
que se obtiene con la finalidad de estudiar las
caractersticas comunes de la poblacin y debe
ser representativa con un tamao apropiado.
DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
VARIABLE
Es toda caracterstica que se desea evaluar de
las unidades de anlisis. Se representa por
letras mayscula del alfabeto.

Ejemplo:
X: Nmero de hijos de una familia del distrito de
Bellavista.

Y: Sexo de un grupo de alumnos del C.E 1197.
DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
TIPO DE VARIABLE

1. VARIABLE CUANTITATIVA: Se expresan en forma
numrica, pueden ser:

Variable Cuantitativa Discreta (VCD): Toman valores
enteros positivos en sus observaciones. Se registran por
conteo.

Ejemplo:
X: nmero de hijos de una familia del distrito de
Bellavista.

DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
Variable Cuantitativa Continua (V.C.C): Asume
cualquier valor numrico en un intervalo continuo. Se
obtienen con el uso de instrumentos de medicin:
Balanzas, termmetros, etc.
Ejemplo:
Z: peso (en gr) de los conejos de un criadero de la
Molina.

2. VARIABLE CUALITATIVA: Los resultados no pueden
ser expresados en forma numrica. A las
observaciones cualitativas se le llama atributos.
Se subdividen en :

DEFINICIN DE ALGUNOS
TRMINOS ESTADSTICOS
Variable Cualitativa Nominal (V.C.N): En esta variable
no se pueden establecer un orden entre las posibles
observaciones.
Ejemplo:
X: razas de los conejos del criadero de la UNA.

Variable Cualitativa Jerrquica (V.C.J): En sta se
pueden establecer un orden entre sus atributos.
Ejemplo:
X: Grado de instruccin de un ciudadano del distrito de
Bellavista.
DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
Observacin:
Es el dato o registro realizado, producto de la apreciacin
de una caracterstica de un individuo o unidad
experimental. Se representa con letras minsculas con sus
respectivos subndices.

Ejemplo:
X
1
: 18 hijos W
1
: La Molina
Y
2
: 20 manzanas. T
2
: Inferior.

DEFINICIN DE ALGUNOS
TRMINOS ESTADSTICOS
PARAMETRO: Es una medida descriptiva que resume
una caracterstica de la poblacin, es decir es una
funcin de todas las observaciones de una poblacin.

Un parmetro es un valor nico, se le llama incgnita (lo
que el investigador desea conocer). Se denota por letras
griegas.
Ejemplos:
Media poblacional :
Varianza poblacional : 2
Mediana poblacional : Me
Moda poblacional : Mo

DEFINICIN DE ALGUNOS
TERMINOS ESTADSTICOS
VALOR ESTADISTICO O ESTADIGRAFO: Es una
medida descriptiva que resume una caracterstica de la
muestra y no depende de parmetro alguno.
Se caracteriza porque puede tomar valores diferentes de
muestra a muestra, debido a que las observaciones
captadas en muestras diferentes no son necesariamente
iguales.
Ejemplo:
Media muestral : X
Varianza muestral : S
2

Mediana muestral : Me
Moda muestral : Mo
ETAPAS DE UN TRABAJO ESTADSTICO
Definicin del problema y objetivos de la
investigacin.

Formulacin del plan de recopilacin de datos

Recopilacin de datos. Datos de calidad.
Clasificacin, anlisis e interpretacin. Clasificar la
informacin segn sus caractersticas.
Generalizacin e inferencia aplicando mtodos de
inferencia estadstica, las conclusiones son
generalizadas a la poblacin.

SUMATORIAS
Definicin.- Representacin algebraica simplificada
de la suma ordenada de un conjunto de elementos.
Ejemplo:
Variable: Nmero de hijos de una familia del distrito
de Bellavista, los resultados de familias elegidas al
azar son:
Nmero de hijos: 3, 1, 4, 0
La suma de los valores de las 4 observaciones se
puede expresar as:
S= x
1
+x
2
+x
3
+x
4

=
=
4
1 i
i
x
S
EJERCICIOS DE APLICACION
El Departamento de Matemtica de la UNA registra el nmero
de alumnos matriculados en 5 grupos de Estadstica General de
diversas facultades.

Facultades(i)
Grupo (j)
Total
A B C D E
Agronoma X
11
=5 X
12
=9 X
13
=3 X
14
=6 X
15
=9 X
1
=32
Economa X
21
=8 X
22
=7 X
23
=5 X
24
=6 X
25
=9 X
2
=35
Zootecnia X
31
=6 X
32
=6 X
33
=9 X
34
=5 X
35
=7 X
3
=33
Total X
1
=19 X
2
=22 X
3
=17 X
4
=17 X
5
=25 X
..
=100
Sea Xij el nmero de alumnos de la facultad (i) matriculado
en el grupo de Estadstica General (j).

A) Halle la suma (valor numrico) y la expresin ms
sinttica de:
El nmero de alumnos de Economa matriculados en
Estadstica General.
El nmero total de alumnos matriculados en los grupos B y D
de Estadstica General.
El nmero total de alumnos matriculados en los 5 grupos de
las facultades de Agronoma, Economa y Zootecnia.

B) Halle el valor numrico de: i representa a las facultades
) 1 (
2
1
2
+

= i
i
x
ORGANIZACIN DE DATOS
Cuando se dispone de informacin captada mediante una
muestra o un censo, la primera inquietud es como resumir los
datos para hacer un anlisis descriptivo ms sencillo. Este
resumen de informacin puede ser realizado mediante la
elaboracin de una tabla de frecuencia o un grfico; es necesario
determinar previamente con que tipo(s) de variable(s) se esta
trabajando.

TABLA DE FRECUENCIA:
Cuadro de doble entrada donde se registran el nmero de veces
que se repite la caracterstica de una unidad de anlisis.
Representacin Tabular
La estructura general que tendr una tabla de frecuencia para los
datos de tipo cualitativo ser la siguiente:

N DE
CLASE
CATEGORA
DE X
FRECUENCIA
ABSOLUTA (f
i
)
FRECUENCIA
RELATIVA (fr
i
)
FRECUENCIA
PORCENTUAL (Pi)%
1 Atributo 1 f
1
fr
1
= f
1
/n P
1
% = 100 (fr
1
)
2 Atributo 2 f
2
fr
2
= f
2
/n P
2
% = 100 (fr
2
)
.
.
.
.
.
.
.
.
.
.
K Atributo K f
k
fr
k
= f
k
/n P
k
% = 100 (fr
k )

TOTAL n 1 100%
Organizacin de los datos cuantitativos
Existen variables cuantitativas discretas.
(Representacin)
N de
clase
Valor de Xi Frecuencia
absoluta
Frecuencia
relativa(fri)
Frecuencia
Porcentual (Pi)%
1 X
1
f
1
f
r1
p1%=100 f
r1
2 X
2
f
2
f
r2
P2%=100 f
r2
: : : : :
k X
k
f
k
f
rk
= f
k/n
pk%=100 f
rk

Total n 1 100%
Datos Cuantitativos Continuos

Las observaciones son diferentes entre si
Se clasifican de acuerdo a ciertos rangos o intervalos
son mutuamente excluyentes llamados intervalos de
clase
Procedimiento para clasificar un conjunto de datos de
tipo cuantitativo continuo es:

a) Se Calcula el rango o amplitud (r)
r = Xmax Xmin
Donde: Xmax es la obsr. Mayor o valor mximo
Xmin es la obsr. Menor o valor mnimo



b) Determinar el nmero de intervalos de clase k
Existen diferentes formas de calcular los Intervalos de
Clase

Regla de Sturges: k= 1 + 3.3 log (n)

Donde: n es el tamao de la muestra
k debe ser entero (caso contrario se
aplica redondeo simple)
c) Determinacin del tamao de los
intervalos de clase (T.I.C)
T.I.C = r / k , si no es entero se usa el redondeo por
exceso.

d) Clculo de los lmites de intervalos de clase
LI LS
LI1= Xmin LS1 = LI1+TIC
LI2= LS1 LS2 = LI2+TIC
: :
Lik= LS(k-1) LSk = Lik+TIC
e) Marcas de Clase
X1=(LI1+LS1)/2
X2=(LI2+LS2)/2
:
Lk=(Lik+Lsk)/2

TABLA DE FRECUENCIA: datos cualitativo
continuo (ver Escritos de Estadstica)

Representacin grfica
Histograma de frecuencias
Polgono de frecuencia
Diagrama de Tallos y Hojas
MEDIDAS DE POSICIN O
MEDIDAS DE TENDENCIA CENTRAL
Dado un conjunto de datos, el inters es como resumir
la informacin en ciertos indicadores representativos.
Mediana o promedio ponderado, la mediana y la moda

LA MEDIA O PROMEDIO
Media aritmtica simple (se toma en cuenta la
poblacin o muestra)

Media poblacional :

Media muestral:
N
x
n
i
i
=
=
1

n
x
n
i
i
X

=
=
1
_
Desventaja la Media Aritmtica

Se encuentra afectada por valores extremos
(existencia de valores pequeos o muy grandes , la
media queda influenciada por dichos valores. As ya
no es un valor representativo de T. C de las observ.

Ejm. Se tiene notas de Estadstica de 5 alumnos
tomadas al azar de los grupos A y B ; hallar las
medias de los grupos A y B

Grupo Notas de la primera prctica Promedio
A 12 12 13 15 15 13,4
B 02 11 13 14 14 10,8
Propiedades de la Media Aritmtica Simple

Es el centro de gravedad o punto de equilibrio de un conjunto de
datos u observaciones.
La media es nica.
Al modificar un valor, la media cambia su valor.
La suma de las desviaciones de las observaciones con respecto al
promedio aritmtico es igual a cero.


Ejem. Los datos corresponden a los salarios mensuales (en
nuevos soles) del mes de agosto del 2007 de 5 personas: 520,
535, 536, 543, y 540. A partir del siguiente mes estas personas
recibirn un aumento del 15% pero se les descontar, aporte
sindical s/.5 soles al mes. Halle el salario promedio de estas 5
personas .




8 , 534 . /
5
2674
5
540 543 536 535 520
s X = =
+ + + +
=
0 ) (
_
1
=

=
x
n
i
i
x
Promedio Ponderado

Al asociar a las observaciones pesos o factores
(w1, w2,...wn)



Ejem. Se desea obtener el promedio final del curso de
Estadstica para Investigacin Cientfica.

Las notas finales fueron: examen parcial 13, examen
final 11, nota de prcticas 14 y trabajos calificados 15.

Los pesos respectivos son: 25%, 25%, 35%, y 15%.
Halle el promedio final del curso.



)) ...
2 1
/( ) ...
2 2
1
1 1
((
1
/
1
n
w w w
n
x
n
w x w
n
i
x w
n
i
i
w
n
i
i
x
i
w X + + + + + +

=
=

=
=
Mediana
Si se tiene n observaciones ordenadas en su
magnitud (o v.n), la mediana es el valor que
ocupa la posicin central de todas las
observaciones.
Mediana Poblacional: Me
Mediana Muestral: me

Caractersticas
a) Divide al conjunto de valores en dos
partes iguales
b) Es influenciada por valores extremos.
Ejemplo:

En el siguiente cuadro se muestran las notas del
curso de Estadstica y Probabilidades de 5
alumnos de los grupos A y B





Grupo Notas del curso Mediana
A 12 12 13 15 15 13
B 02 11 13 14 14 13
Clculo de la Mediana
Si n es impar

Si n es par


La mediana es una estadstica de orden, es decir es la
ubicacin que ocupa la observacin previa ordenacin.

Ejemplo :
Se tiene el rendimiento de maz (en Tn/parcela) de 7
parcelas de terreno: 1,56; 1,45; 1,82; 1,76; 1,62; 1,86; 1,64.
Halle e interprete el valor del rendimiento de maz mediano;
ordenando la informacin.


2 / ) (
1 ) 2 / ( 2 / +
+ =
n n
X X me
2 / ) 1 ( +
=
n
X me
86 , 1 ;.......; 45 , 1
7 1
= = X X
MODA
La moda de n observaciones es el valor que ocurren con
mayor frecuencia.
Moda poblacional: Mo
Moda muestral : mo

Caractersticas
a) En un conjunto de observaciones puede o no existir modas.
b) Ejm. Notas de alumno: 12, 14, 14, 09, 16, 11.
c) No es afectada por valores extremos.
d) Se aplica a informacin cualitativa como a cuanitativa.

e) Ejm. Sea X2: Raza de vacas.
Holstein, Holstein, Cebu, Brows Swiss.
USO DE LA MEDIA, MEDIANA Y MODA
1. La media se utiliza:
Cuando no existen valores extremos
Cuando se tenga que calcular otros valores
extremos; como la varianza.
2. La mediana se usa:
Cuando se desea conocer el valor de posicin
central.
Cuando se tiene valores extremos que afecten a la
mediana
3. La moda se usa:
Cuando se desea conocer el valor de la observacin
ms frecuente.
Cuando se analiza variables cualitativas.
MEDIDAS DE DISPERSIN O
VARIABILIDAD
Nos muestran si los datos obtenidos de una
variable se encuentra muy dispersos o no,
respecto a la media aritmtica.

Son Indicadores que se utilizan para analizar el
grado de heterogeneidad o variabilidad de un
conjunto de observaciones.

Estas son: el rango, la varianza, la desviacin
estndar y el coeficiente de variabilidad.
EL RANGO O AMPLITUD
R= Xmax Xmin; (valor mximo, valor mnimo)

Ventajas del rango:
Esta afectado por valores extremos
No mide la variabilidad de los intermedios

Ejemplo:
Los tiempos (en minutos) de atencin en ventanilla
de la tesorera de la UNE de 5 clientes elegidos al
azar fueron: 8,5,7,3 y 6. Calcular el Rango?

LA VARIANZA
La Varianza de un conjunto de observaciones esta definida
por:

Varianza Poblacional;
Varianza Muestral

La Varianza es un valor numrico positivo

Ejemplo.
Los pesos (en gr.) de 8 conservas de frutas elegidas al azar
de un gran lote son:
253,3; 249,2; 250,1; 253,4; 251,7; 250,6; 252,3; 252,4. Hallar
la variancia si

N u)
n
i
i
(x /
1
2
2

=
=
o
) 1 /(
1
2 2

=
= n x)
n
i
i
(x S
252
_
= x
......
2
= S
DESVIACIN ESTNDAR

Desviacin Estndar Poblacional :

Desviacin Estndar Muestral :


La desviacin estndar a diferencia de la varianza si se encuentra
en las mismas unidades de las observaciones.

Ejemplo: La desviacin estndar de los pesos de las conservas
de frutas es:


o
o
2
=
S
S
2
=
gr S 21 , 2
886 , 4
= =
COEFICIENTE DE VARIABILIDAD
Es una medida de dispersin relativa, es decir no
tiene unidades y est expresado en porcentajes.

Coeficiente de variabilidad poblacional.

Coeficiente de variabilidad muestral.

Si el promedio es igual a cero, entonces no se puede
definir el Coeficiente de Variabilidad.
Si el promedio es negativo se debe considerar su
valor absoluto para evaluar el Coeficiente de
Variabilidad.




( ) % 100 . / o = CV
% 100 /
|
.
|

\
|
=

X S CV
Ejemplo:
Se realiza un experimento en el que se evala dos tipos de
fertilizantes, obtenindose los resultados en el rendimiento de yuca
en Tn/parcela.








Con qu tipo de fertilizante se obtienen resultados ms
homogneos?

CV(a) =(1,87/8,1) 100% = 23,1% ; CV(b) =( 2,10/12,3) 100%= 17,1%

Se observa que con el fertilizante b se obtienen resultados ms
homogneos
Resultados Fertilizante a Fertilizante b
n 1,8 1,5
8,1 12,3
S 1,87 2.10
_
X
Ejercicios
1. Organice una tabla de distribucin
de frecuencias
EJERCICIOS
1. Comparar la poblacin de Amrica Latina
por pas, hacer un ranking
2. Hacer un estudio comparativo de la
proporcin de analfabetos que hay en
Amrica Latina, disear una tabla de
distribucin de frecuencias y hacer un
Ranking.
3. Organice una tabla de frecuencias de 14
salones de 30 alumnos cada uno, sabiendo
que en cada saln hay x-1 alumnas.

S-ar putea să vă placă și