Sunteți pe pagina 1din 39

UNIVERSIDAD NACIONAL JORGE

BASADRE GROHMANN
FACULTAD DE CIENCIAS

ESTADISTICA Y PROBABILIDAD
TEMA: VARIABLES ,GRAFICOS Y MEDIDAS
ESTADISTICAS

Dr. PELAYO DELGADO TELLO

DEFINICION DE ESTADISTICA
Es la ciencia aplicada que nos proporciona un conjunto de
mtodos , tcnicas o procedimientos para:

- recopilar
-organizar ( clasificar o agrupar)
-presentar y
- analizar
Datos con el fin de describirlos o de realizar
generalizaciones validas que permita la toma de decisiones.
DDGGDDDDDDDDDDDIVISSSSSJJJDDDDDDJDDDDDDDION
SS
DIVISION:
ESTADISTICA DESCRIPTIVA.- Es el conjunto de mtodos
estadsticos que se encarga de la recoleccin, clasificacin
y la descripcin de datos , para su interpretacin anlisis y
toma de decisiones.

INFERENCIA ESTADISTICA .- Es el conjunto de mtodos y tcnicas que


permiten inducir, a partir de la informacin emprica proporcionada por
una muestra, el comportamiento de una poblacin con un riesgo de error
medible en trminos de probabilidad.

I.1.- DATO
I.- INFORMACION ESTADISTICA
Es toda informacin cualitativa o cuantitativa acerca de una
caracterstica de un conjunto de entes materiales o
inmateriales.
La fuente de obtencin de datos:
Las Estadsticas Vitales de los Pases (Registro Civil).
Boletines de los distintos Ministerios de los Pases.
Institutos Nacionales de Estadsticas.
Encuestas - Entrevistas.
Registro de importacin y exportacin de productos alimenticios
Reservas nacionales , balanza de pagos
Investigaciones diseadas con un propsito especfico.
Todas las posibilidades de bsqueda ofrecida hoy por
internet, etc.

FORMAS DE OBTENER INFORMACION:


a) mediante una urna
b) mediante una tmbola
c) mediante nmeros aleatorios

1.2.- POBLACIN
Conjunto de datos, observaciones o medidas
en un determinado universo del cual se desea
estudiar una caracterstica en particular y se
denota por N . El nmero de elementos de
la poblacin.
Ejem.
El rendimiento acadmico de los estudiantes de la UCV
La estatura de los trabajadores de la Zona de
Educacin
El nmero de votantes a favor de un candidato.
etc.

1.3.- MUESTRA
Cualquier subconjunto representativo
de la poblacin, requiere que las
unidades o elementos sean
seleccionados al azar.
se denotar por n el nmero de
elementos de la muestra

1.4.- ESTIMADOR
Es una estadstica que se obtiene a
partir de los datos muestrales
,describe alguna caracterstica de la
muestra, constituye una estimacin
de un parmetro, y se representa por
letras minsculas.

1.5.- PARMETRO

Es un nmero que describe alguna


caracterstica de toda la poblacin y para
determinar su valor es necesario utilizar la
informacin poblacional completa se
representa por letras griegas o letras
maysculas del idioma espaol. , P, ,
2 , S, S2 etc.

Poblacin
, , 2
inferencia
Muestra
x-,med,mod

Anlisis
Relacional

ESTRUCTURA Y TIPOS DE DATOS ESTADISTICOS


DATOS CUALITATIVOS O ATRIBUTOS

Son aquellos susceptibles de ser


expresados por una cualidad o atributo.
Ejemplos:
El lugar de procedencia de un
estudiante
El estado civil de una persona
Alumnos aprobados y no aprobados

DATOS CUANTITATIVO
Son aquellos susceptibles de ser expresados por
una
cantidad (variables), los cuales a su vez pueden
ser
DISCRETOS Y CONTINUOS.

Ejemplos:
El puntaje obtenido en un examen ( )
Nmero de aulas de un colegio ( )
Cantidad de alumnos aprobados en un examen ( )
Cantidad de libros defectuosos en una biblioteca.(
)
El tiempo que dura una prueba de examen ( )
Peso o estatura de un estudiante ( )
Temperatura ambiental promedio etc. ( )

Sin embargo existen variables que el valor


observado expresa un cierto orden o
jerarqua. Se le denomina Variable
Ordinal. Tiene la caracterstica de que el
valor obtenido indica un orden o jerarqua,
permitiendo indicar una posicin relativa de
los distintos elementos clasificados.

Rendimiento acadmico de un estudiante :


Bueno, Regular, Malo.
Grado de dificultad de una examen: fcil o
difcil .
Orden de meritos de un docente en la
Universidad
Grado de desarrollo de un Centro
Educativo
Etc.

PRACTICA CALIFICADA
NOMBRES Y APELLIDOS
1.- Clasifique las variables que aparecen a continuacin identifique el tipo que

segn la forma de expresar sus valores y la escala en que originalmente clasifi


unidades de observacin.
1. Numero de Hijos
2. Gestin Publica
3. Nivel de ingresos
4. Concentracin de un contaminante
5. Gnero
6. Estatura del recin nacido
7. Porcentaje de das trabajados
8. Ciclos de la maestra
9. Velocidad de un vehculo
10. Dificultad de un examen
11. Peso del oxigeno
12. Gravedad de un accidente
13. Clasificacin de las Regiones
14. Temperatura ambiental
15. Niveles de ansiedad
16. Edad en su ltimo cumpleaos
17. Profesin de una persona

18. Temperaturas registradas en un observatorio cada hora


19. Cotizacin de las acciones de FedEx
20. Tiempo de descarga de un archivo.

DESARROLLO

MATRIZ DE LOS DATOS

Cuando se realiza un estudio sobre un


conjunto finito n sujetos, objetos, cosas,
individuos, entidades etc., normalmente existe
una variada gama de caractersticas y que se
expresan en los trminos vistos anteriores,
digamos entonces de manera genrica, que
determinan p variables.
Lo anterior permite construir lo que se llama
Base de Datos, que de manera muy general
podemos decir que es un arreglo tipo matricial
que tiene n filas y p columnas.

Individuos Var.X1

1
2
3
4
.
.
.
.
n

Var.X2 Var.X3

Var.X4

.
.

Var.xp

El propsito de la matriz de datos es


presentar los datos de la manera ms
depurada posible para proceder al
procesamiento de los datos y obtener
informacin.
La primera preocupacin es entonces
aprender a estructurar una base de datos,
utilizando un software para su posterior
procesamiento.
Utilizaremos un software estadstico llamado
SPSS. Es una versin para ambiente
Windows 98 2000 y XP. SIM
Los datos se ingresan en una planilla, muy
similar a la denominada planilla EXCEL.
Construiremos una pequea base de datos,
con antecedentes de persona.

CONSTRUCCION DE UNA BASE


DEDATOS
Considere una planilla de sueldos de
una institucin publica :
Cdigo
Nombres y apellidos
Remuneracin
Edad
Mes
SEXO

GRAFICO : NUBE DE PUNTOS


TEMPERATURA SEMANAL

20

TEMPERATURA

15
10
5
0
1

4
DIAS

GRAFICO: LINEAL
TEMPERATURA SEMANAL
16
TEMPERATURA

14
12
10
8
6
4
0

DIAS

GRAFICO DE BARRAS
VERTICALES
TEMPERATURA SEMANAL

TEMPERATURA

16
12
8
4
0
1

DIAS

GRAFICO DE BARRAS
HORIZONTALES
TEMPERATURA SEMANAL

1
2
DIAS

3
4
5
6
7
0

8
TEMPERATURA

12

16

GRAFICO DE PARTES COMPONENTES

GRAFICO CIRCULAR

RENDIMIENTO ACADEMICO

17.18%

71.78% APRO
11.04% RET
17.18% DESAP

11.04%

71.78%

CAUSAS DEL BAJO RENDIMEINTO


ACADEMICO
CAUSAS
Econmicas
Bibliografa
Conocimiento
Docente
Sicolgicas
Drogas
Otros
TOTAL

CANTIDAD
180
40
50
30
12
6
2
32 0

GRAFICO DE PARETO
RENDIMIENTO ACDEMICO

400

frequency

300
200
100
0
eco doc bibl conc Other

GRAFICO DE PARETO

RENDIMIENTO ACADEMICO 2002

400

CANTIDAD

300

84.38

99.38 100.00
93.75 97.50

71.88

200

56.25

100
0
eco

doc

bibl

conc

sic

dro

otros

II. PROCESAMIENTO ESTADISTICO DE DATOS

2.1.1 MEDIDAS DE TENDENCIACENTRAL


Son aquellos estimadores cuyos valores tienden a ubicarse
en la PARTE
CENTRAL del recorrido o rango de una variable,
es decir ms o menos la mitad
del intervalo definido entre el valor mnimo y el valor mximo .
n1

n2

n3

nk

2.1.2. MEDIA O PROMEDIO ARITMTICO

Es una estadstica que localiza el centro de la distribucin en base a su


centro de gravedad y se obtiene a partir de la siguientes frmulas :
PARA DATOS ORIGINALES.- Sean x1 , x 2 , x 3 Xn las variables
matemticas que representen los datos muestrales
n
xi

x
i 1

PROPIEDADAES:
1.

(X
I 1

2. Si yi

x) 0

a b xi

= a b X

2.1.3. MEDIA PONDERADA : sean

p1 , P2 , P 2 ......P k

Los pesos asociados a las variables


k

x
i 1
k

p
i 1

pi
i

x1 , x 2 , ......., xk , respectivamente. Entonces:

Ejemplo 2 :
Se desea determinar el promedio ponderado de los estudiantes del primer ciclo de la
Escuela de Ing. Civil teniendo en cuenta los cursos y crditos
TEORIA

PRACTICA

CREDITOS

NOTA

Matemticas

14

Fsica

16

Estadstica

18

Dibujo Tcnico

12

ASIGNATURA

SOLUCION
Xi = Nota
pi = Creditos
k

x
i 1
k

pi

p
i 1

= 228/15
i

15.2

2.1.4 MEDIA GEOMTRICA .- Esta media corresponde al valor que tomara la


variable si se calculase la media aritmtica de los logaritmos de los datos
en lugar de los valores directos .

g Inv
Log

LogX

i 1

g=

x1 x 2 ........x n

Este estadgrafo se utiliza


principalmente en estudios
tales como distribucin de ingresos, clculo de ndice de p
de inters ,en estudios de crecimiento de poblacin . En
generales donde los valores de las variables representan
porcentajes de variacin relativos al comportamiento de
exponencial.

Ejemplo
Las tasas de inters de tres bonos son 5%, 7% y 4%.
La media geomtrica es
= 5.192.
Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55,22, 34
(seis valores) es

MEDIA O PROMEDIO ARMONICO


Ma

n
n 1
( )
i 1 xi

EJEMPLO Calcular la media armnica de la tasa de inters de 3 bonos del


ejemplo anterior :
Ma

3
5.06
1/ 5 1/ 7 1/ 4

2.1.6 MEDIA GLOBAL : S una muestra de tamao n se particiona


en k submuestras y x
x
x
2

, ..

son las medias de las k submuestras de tamaos n1 , n2 ..n


respectivamente Entonces:
k

ni xi
i 1

Se denomina media global de la muestra particionada.


Ejemplo1.
Si a una seccin de estudiantes se divide en tres grupos de practica A,B,C de 10,16,14
estudiantes, si su rendimiento acadmico de cada grupo es 15,14 y 12 respectivamente .
Cul ser el rendimiento global de toda la seccin.
SOLUCION

ni xi
i 1

15 10 14 16 12 14 542

13,55
40
40

1.1.7 MEDIANA: Es una medida de tendencia central que divide a la informacin en dos partes
iguales 50% a cada lado. Sean x1 , x 2 , x 3 Xn una muestra en orden creciente o
decreciente de magnitud. Entonces la mediana se define de la siguiente manera:

x n 1 /2
med =

x n

2 1

x n
2

impar
par

En el caso que la cantidad de datos sea un nmero impar , la mediana se obtiene ubicando
el valor que esta en el centro.
En el caso de que la cantidad de datos sea un nmero par, la mediana se obtiene como el
promedio de los dos valores centrales.
Ejemplo 3:
Las notas de 5 maestrantes fueron 11, 15, 17, 14, 13. Encontrar la la mediana de dichas
notas:
SOLUCIN
Como la cantidad de datos es impar entonces la mediana ser el valor central una vez
ordenado los datos: 11, 13, 14, 15,17 luego la med=14

1.1..8 MODA : Esta medida se conoce


tambin con el nombre de Promedio
Industrial. Est
representado por el valor o cantidad
que ms se repite o tiene una mayor
frecuencia
La distribucin de datos puede ser
modal
bimodal o multimodal

1.2 MEDIDAS DE VARIABILIDAD :


Estas medidas estn orientadas a cuantificar el grado o magnitud de cmo los datos se
dispersan entorno a una medida de tendencia central . Generalmente en torno a la media
aritmtica . Mucha dispersin es seal de poca uniformidad u homogeneidad en los datos.
Por el contrario poca dispersin , es seal de homogeneidad en los datos.
1.2.1 RANGO: Es una mediada de variabilidad que se obtiene de la diferencia entre el mayor
valor de la variable y el menor valor.
R = X mximo - X mnimo

1.2.3 VARIANZA: Es el promedio aritmtico de los desvos cuadrticos de los valores de la


variable
respecto del promedio aritmtico
n

s=
2

( xi

i 1

x )2

n 1

; =
2

( xi

x)2

i 1

1.2.3 DESVIACION ESTANDAR: Es la raz cuadrada de la varianza


tiene una gran importancia pues es la cuantificacin de la precisin de la
de la medicin de la variable.

Se utiliza, entre otras aplicaciones para construir intervalos de confiabilidad


en torno a los cuales ocilar un parmentro de una poblacin en estudio Si
la forma de la curva es una campana entonces el 68,27% de las veces la
medicin estar en el intervalo es decir :

y con las caracterstica de la curva tipo campana, el intervalo

Contendr el 95% de los valores de la variable

1.2.4 ERROR ESTANDAR . Es la desviacin estndar dividida por la


raz cuadrada del nmero de datos.
e.e

1.2.5.DESVIACION MEDIA . Es una mediad de variabilidad que no est


incorporado en las rutinas de clculo de Statgraphics. Su algoritmo de
calculo es :
n

DM =

xi x
i 1

Podemos definirla como el promedio aritmtico de los valores absolutos


de las desviaciones de los valores de la variable respecto del promedio
aritmtico .

2.1.7 COEFICIENTE DE VARIACIN .-

Es la dispersin relativa de una variable, en relacin con su promedio


aritmtico. Tiene la propiedad de ser adimensional. Por lo tanto sirve para
comparar el menor o mayor grado de homogeneidad de una variable
respecto a otra.
CV =

100
X

VARIANZA GLOBAL:

Si una muestra de tamao n se particiona en K submuestras de


tamao s n , n , n.nk tales que
k

ni

i 1

x1 , x 2 , x3 ,........x k
s12 , s 2 2 ,..............s 2
k

son las varianzas de las k submuestras respectivamente. entonces :

ni (S i 2 X 2 i )

S x 2 i 1

son las medias ,

ni X 1
i

CAPITULO II

S-ar putea să vă placă și