Documente Academic
Documente Profesional
Documente Cultură
Poblacin
Poblacin Finita
Una poblacin si es infinita no se puede estudiar en forma completa; an si es finita es muy engorroso
estudiarla en forma completa por que involucra prdida de tiempo, dinero, etc., por esta razn nos basamos
en una muestra aleatoria.
MUESTRA
Es un subconjunto de la poblacin y para que la muestra sea representativa debe ser aleatoria o no
sesgada.
Una muestra es aleatoria cuando cada elemento de la poblacin tiene la misma posibilidad de ser
seleccionado en la muestra.
La demostraremos por: n= tamao de la muestra nmero total de observaciones en la muestra.
Ejemplos:
1.
2.
SESION # 2
CAPITULO II ESTADISTICA DESCRIPTIVA
La Estadstica Descriptiva, se encarga de recopilar la informacin de una muestra aleatoria, esta
informacin tiene que ser ordenada para una buena presentacin; Esta ordenacin se basa en las llamadas
Tablas de Frecuencias y tambin en los Grficos Estadsticos.
RECOPILACION DE DATOS
Es el momento en el cual el investigador se pone en contacto con los objetos o elementos sometidos a
estudio, con el propsito de obtener datos o respuestas de las variables consideradas; a partir de estos datos
o respuestas se calculan los Estadgrafos o indicadores estadsticos.
FUENTES DE DATOS
La fuente de datos, es el lugar, la institucin, las personas o elementos donde estn o que poseen los datos
que se necesitan para cada uno de las variables o aspectos de la investigacin o estudio.
En general, se puede disponer de cinco tipos de fuentes de datos:
1. Las Oficinas de Estadstica.- Como instituciones responsables de recopilar, procesar y publicar las
estadsticas sociales o nacionales.
2. Archivos o Registros Administrativos.- Como el Registro Civil, Electoral, Escalafn o Personal, Padrn de
Contribuyentes, etc.. Estos registros no tienen fines Estadsticos, su funcin es de tipo legal y
administrativo, sin embargo pueden utilizarse como fuentes de datos estadsticos.
3. Documentos.- Boletines, e informes estadsticos que son las publicaciones o estudios que preparan los
organismos especializados.
4. Encuestas y Censos.- Son fuentes directas y especiales, que se construyen en un momento
determinado, recopilando datos de una parte o de la totalidad de una poblacin.
5. Los Elementos o Sujetos.- Son aquellos que estn sometidos a un estudio, pueden ser personas,
instituciones, animales u objetos.
TECNICAS DE RECOPILACION O RECOLECCION DE DATOS
Es el conjunto de mtodos y procedimientos que se llevan a cabo para recolectar los datos.
Las ms frecuentes tcnicas utilizadas son:
1. La Observacin.- Es la accin de mirar de mirar en forma sistemtica y profunda, con el inters de
descubrir la importancia de aquello que se observa.
2. La Tcnica Documental.- Es aquella que busca datos a travs de documentos, fuentes escritas o grficas
de todo tipo. Ejm.: Libros, Informes, Autobiografas, fotografas, planos, videos, etc.
3. La Entrevista.- Es la interrelacin o dilogo entre personas, donde una de ellas se llama Entrevistador o
Encuestador quien solicita a otra persona llamada Entrevistado o Encuestado le proporcione algunos
datos o informacin.
4. El Cuestionario.- Es un instrumento constituido por un conjunto de preguntas sistemticamente
elaboradas, que se formulan al Entrevistado o Encuestado, con el propsito de obtener los datos de las
variables consideradas en el estudio. El Cuestionario se desarrolla en el Formulario o Cdula, en donde
las preguntas estn debidamente organizadas.
5. La Encuesta.- Es la tcnica por la cual se obtiene la informacin tal como se necesita, preparada
exprofesamente y con objetivo estadstico. Permite observar y registrar caractersticas en las unidades de
anlisis de una determinada poblacin o muestra, delimitada en el tiempo y en el espacio. El Entrevistado
da respuesta a las preguntas en el formulario o Cdula..
SESION # 3
CAPITULO III LAS VARIABLES ESTADISTICAS
LA VARIABLE:
Es la representacin simblica de los datos.
Ejemplo:
Sea X: altura de 5 alumnos de MARIA AUXILIADORA Donde:
X1= 1.65 mts., X4 = 1.63 mts.
Xi, i= 1 a 5
Variable Cualitativa: Es aquella variable que representa a datos que indican cualidades,
caractersticas, propiedades, etc., no son numricas (no medibles).
Ejemplos:
X=
Control de calidad de productos de una industria. Bueno, Malo, Regular, Muy Bueno.
Y=
Estado Civil de una muestra de 200 personas. Soltero, Casado, Viudo, Divorciado.
II.
Variable Cuantitativa: Es aquella variable que representa a datos que indican valores numricos
(son medibles), y se clasifican en:
Variable Discreta: Es aquella que representa a datos numricos que no se pueden fraccionar, sirven
para contar o enumerar (pertenecen a los reales).
Variable Continua: Es aquella variable que representa a datos que pueden ser fraccionados
(pertenecen a los reales).
Ejemplo:
El Peso (Kg.) de 6 personas.
65, 56, 59, 70, 63.
La variable continua es la que ms utilizamos, especialmente para los estudios
Ingeniera (Volumen, Temperatura, Pesos, Mediciones, etc.).
correspondientes en
SESION # 4
CAPITULO IV LA ORGANIZACIN DE LOS DATOS
Distribucin o Tablas de Frecuencias: Es la condensacin, simplificacin, ordenacin, del conjunto de
observaciones que forman la muestra; la caracterstica principal es no perder ningn dato de la muestra.
Tambin se puede decir que la Distribucin de Frecuencia es la representacin estructurada, en forma de
tabla, de toda la informacin que se ha recogido sobre la variable que se estudia.
Categoras o Clases.- Son los datos que estn agrupados por sus caractersticas comunes.
Frecuencia de Clases.- Es el nmero o cantidad de datos que componen una Categora o Clase. Las
Frecuencias se clasifican en :
1. Frecuencia Absoluta (Simple).- Representa a la cantidad de datos de cada Clase.
2. Frecuencia Absoluta Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus
respectivas Frecuencias Absolutas.
3. Frecuencia Relativa (Simple) .- Es el % que representa a la cantidad de datos de una Clase con respecto
al total de datos.
4. Frecuencia Relativa Acumulada.- Representa a la suma en forma acumulativa de Clase en Clase de sus
respectivas Frecuencias Relativas.
Veamos un ejemplo (4.1) :
Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm):
Alumno
x
Alumno 1
Alumno 2
Alumno 3
Alumno 4
Alumno 5
Alumno 6
Alumno 7
Alumno 8
Alumno 9
Alumno 10
Estatura
x
1,25
1,28
1,27
1,21
1,22
1,29
1,30
1,24
1,27
1,29
Alumno
X
Alumno 11
Alumno 12
Alumno 13
Alumno 14
Alumno 15
Alumno 16
Alumno 17
Alumno 18
Alumno 19
Alumno 20
Estatura
X
1,23
1,26
1,30
1,21
1,28
1,30
1,22
1,25
1,20
1,28
Alumno
x
Alumno 21
Alumno 22
Alumno 23
Alumno 24
Alumno 25
Alumno 26
Alumno 27
Alumno 28
Alumno 29
Alumno 30
Estatura
x
1,21
1,29
1,26
1,22
1,28
1,27
1,26
1,23
1,22
1,21
Frecuencias Absolutas
Simple
Acumulada
X
Frecuencias Relativas
Simple
Acumulada
x
1,20
3,3%
3,3%
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
4
4
2
1
2
3
3
4
3
3
5
9
11
12
14
17
20
24
27
30
13,3%
13,3%
6,6%
3,3%
6,6%
10,0%
10,0%
13,3%
10,0%
10,0%
16,6%
30,0%
36,6%
40,0%
46,6%
56,6%
66,6%
80,0%
90,0%
100,0%
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces,
entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia
muy extensa que aportara muy poco valor a efectos de sntesis.
Segn los tipos de variables y formas de la tabla de frecuencias, tendremos las siguientes Tablas de
frecuencias
1ER. CASO: Tablas de Frecuencias para la variable Cualitativa:
En este caso como la variable cualitativa indica cualidades, propiedades, etc., y no son medibles; entonces
se agrupa de acuerdo a cada categora que se diferencia en la variable cualitativa. (Sin un orden
establecido).
Ejemplo: (4.2).
Se tiene la siguiente informacin que representa el Estado Civil de 50 personas encuestadas (edad; 20-30
aos).
Estado Civil
Soltero
Casado
Viudo
Divorciado
Conviviente
No. de personas
25
10
1
6
8
%
50%
20%
2%
12%
16%
15
10
5
0
Soltero Casado ViudoDiv orciado
Conv iv iente
ESTADO CIVIL
PORCENTAJES
Soltero
Conv iv iente
Div orciado
Viudo
Casado
Fi
f1
f2
.
.
.
Fm
Fi
F1
F2
.
.
.
Fm=n
hi
h1
h2
.
.
.
hm
Hi
H1
H2
.
.
.
.Hm=1
Donde:
n = numero de clases o intervalos de clase.
fi = frecuencia absoluta: es el nmero de observaciones que hay en cada clase o intervalo de clase. Adems:
fi+f2+f3+. ...+ fm =n
m
fi = n
i=1
Fi = frecuencia absoluta acumulada: es el numero de observaciones acumuladas hasta la clase i, es decir:
F1=f1
F2=f1+f2
.
.
Fm=f1+f2+f3...+fm =
hi = frecuencia relativa: representa la relacin que existe entre la frecuencia absoluta y el nmero total de
observaciones:
hi
fi
n
Hi
Fi
n
Tambin :
No. diskettes
fi
4
5
3
2
1
Fi
hi%
Hi%
4
9
12
14
15
26.7
33.3
20.0
13.3
6.7
23.7
60.0
80.0
93.3
100.0
HISTOGRAMA
6
5
4
3
N DE DISKETTES
2
1
0
3
10
11
DEFECTOS
Xi
Fi
Fi
hi
Hi
X1
X2
.
.
.
.
.
f1
f2
.
.
.
.
.
F1
F2
.
.
.
.
.
h1
h2
.
.
.
.
.
H1
H2
.
.
.
.
.
[Xm-1- Xm]
Xm
Fm
Fm
hm
Hm
Donde:
X i= marca de clase o punto medio de cada intervalo de clase, se obtiene mediante la semisuma de los
limites de cada intervalo.
Xi=
Ls + Li
2
Criterio personal; de acuerdo a la experiencia del investigador se puede asumir un valor de m para un
tamao de muestra determinado.
Mediante la Regla de Sturges:
K =1 +3.3 log. n
2do. Paso:
Calcular la amplitud o tamao del intervalo de clase:(A)
Para calcular la amplitud del intervalo (A) nos basaremos en la siguiente expresin:
A = Rango de la muestra
K
donde: Rango de la muestra = Valor Mayor Valor Menor
Con este procedimiento calculamos una amplitud que ser constante para cada intervalo, y lo mismo ocurrir
entre cada marca de clase.
Los intervalos sern de la forma: [Li Ls], pudiendo ser considerado cerrado en el ltimo intervalo.
La amplitud A es preferible que sea redondeada considerando la misma cantidad de decimales que tengan
los dato de la muestra.
3er. Paso: Tabulaciones
Tabular y presentar los datos agrupados en la tdf.,
Ejemplos: (2.3)
Los siguientes datos representan el peso (gr.) de 35 sobrecitos de unas sustancias: 68, 73, 61, 46, 49, 96, 68,
90, 97, 53, 75, 93, 72, 60, 71, 75, 74, 75, 71, 77, 83, 68, 85, 76, 88, 59, 78, 62, 55, 48, 43, 47, 60, 84, 80 .
Agrupar en tdf.
Solucin:
1)
2)
3)
97 43
9
6
Tabular en tdf:
Peso (grs)
[43 52>
[52 61>
[61 70>
[70 79>
[79 88>
[88 97]
Xi
47.5
56.5
65.5
74.5
83.5
92.5
fi
5
5
5
11
4
5
Fi
5
10
15
26
30
35
hi%
14.3
14.3
14.3
31.4
11.4
14.3
Hi%
14.3
28.6
42.9
74.3
85.7
100.0
Se observa por ejemplo que: 11 sobrecitos tienen un peso comprendido en el intervalo [70-79> grs. y
representan el 31.4% del total.
Tambin vemos que 15 sobrecitos pesan menos de 70 grs. y representan el 42.9% del total.
SESION # 5
PRIMERA PRACTICA CALIFICADA
SESION # 6
PRESENTACION DE DATOS
LOS GRAFICOS
Los grficos son representaciones en forma de figuras geomtricas, de superficie o volumen con el objeto de
ilustrar los cambios o dimensin de una variable, para comparar visualmente dos o ms variables similares o
relacionadas. Para una rpida comprensin de situaciones o variaciones en cantidades, es muy til traducir
los nmeros en grficos o imgenes. Por su naturaleza, un grfico no toma en cuenta los detalles y no tiene
la misma precisin que una tabla estadstica.
Veamos algunos tipos de Grficos :
1.
2.
Polgono de frecuencias: Consiste en unir los puntos medios marcas de clase levantadas hasta cada
frecuencia correspondientes, generalmente para su construccin nos podemos basar del Histograma de
frecuencias.
Propiedad: Area del Histograma = Area del Polgono de frecuencia.
3.
HISTOGRAMA DE FRECUENCIAS
15.00
10.00
fi
5.00
0.00
.47.5
.56.5
.65.5
.74.5
.83.5
.92.5
Xi
SESION # 7
LOS ESTADIGRAFOS DE TENDENCIA CENTRAL
Se llaman as, porque tienden a ubicar el centro de las observaciones; Estos estadgrafos de posicin son:
media, mediana, moda, media geomtrica, media armnica, etc. Estudiaremos los ms importantes:
X
1. La Media Aritmtica
Llamada tambin promedio, es el estadigrafo de posicin ms simple y fcil de calcular, por eso es el
ms comn.
Se calcula teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencias:
Xi
i 1 n
Sean X1, X2............, Xn variables que representan los n datos de una muestra, la media
aritmtica se calcula:
2do. Caso: Datos Agrupados en tabla de frecuencias:
En este caso se calcula mediante la siguiente frmula:
Xi * fi
n
fi = frec. Absoluta
hi = frec. Relativa
.
O tambin:
X Xi * hi
hi = frec. Relativa
X X (K ) K
Sea K = cte.
y cada Xi = k -----------------
2. Si a cada dato e le suma o resta una constante k, la media queda sumada o restada por dicha constante:
Si Xi = Xi + K
3. Si a cada dato se le multiplica o divide por una constante k, la media queda multiplicada o dividida por
dicha constante.
4. S Yi = Xi* k ------------------------- X(Y) = X(X* k) = X (X) * k
NOTA. Todas las propiedades cumplen para datos agrupados y no agrupados
Datos no agrupados
( Xi X ) 0
( Xi X ) * fi 0
Datos agrupados
5. La suma de las desviaciones
respecto a la media
SESION # 8
es igual a cero.
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde
el valor de cada ao tiene un efecto multiplicador sobre el de los aos anteriores. En todo caso, la media
aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se
pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica)
se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores
anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad.
3. La Mediana (Me) :
Es aquel estadgrafo de posicin que divide en dos partes iguales al conjunto de observaciones; es
decir la mediana representa el valor central de una distribucin de datos ordenados en forma
creciente o decreciente.
1er. Caso: Datos No agrupados en TDF:
Primero se ordena los datos en forma creciente o decreciente y luego se tiene en cuenta s:
a) n es impar.
La mediana es el valor central.
n=9
Ordenando: 31, 32, 32, 34, 34, 36, 37, 41, 42, 45.
Observamos el valor central:
Me=36 (representa el 5to. dato)
b) n es par.La mediana es igual al promedio o la semisuma de los valores centrales.
Ejemplo: la Me de 12,21,16,18,20,19,16,15,16,17.
Ordenando:
Me
12,15,16,16,16,17,18,19,20,21,
16 17
16.5
2
Ame * n Fme1
2
Me Li
f me
Donde:
Li
Ame
Fme-1
fme
=
:=
=
=
Clase Mediana: Es aquel intervalo que contiene el valor que ocupa la posicin media, es decir
contiene a la mediana. Se calcula mediante:
El primer valor Fi mayor o igual que n/2
4. LA MODA (Mo)
Representa al valor que ms se repite en un conjunto de observaciones:
Mo = 5 UNIMODAL
Ej.
Mo = 8 BIMODAL
7,7,6,8,8,6,8,7,7,9,12,11,10,8
D1
D1 D 2
M o Li Amo *
Donde:
Li
Amo
D1
D2
=
limite inferior de la clase modal.
=
Amplitud de la clase modal.
=
Diferencia ente la Frec. Absoluta de la clase
modal menos la frecuencia absoluta anterior.
=
Diferencia ente la Frec. Absoluta de
la clase modal menos la siguiente.
gramos
la Tabla de frecuencias del ejemplo (2.3).
gramos
35 15
72.05
2
11
Me 70 9 *
6
74.15
6
M o 70 9 *
Gramos
D2=11 4 =7