Sunteți pe pagina 1din 65

UNIVERSIDAD NACIONAL DEL CALLAO

Probabilidad y Estadística

Clase 2 : Recolección: y
Organización de datos

gpomachagua@hotmail.com

Material de Clases © G.P.P. 7/10/2019


OBJETIVOS

Al finalizar el tema 2, el participante será capaz de:


1. Distinguir la fuente de datos
2. Recopilar datos.
3. Diferenciar métodos y técnicas de recolección de
datos.
4. Elaborar una encuesta
5. Presentar datos en tablas

Material de Clases © G.P.P. 7/10/2019


RECOLECCION DE DATOS

La recolección de datos es la fase en el cuál el


investigador se pone en contacto con los elementos
sometidos a estudio, con el fin de obtener datos o
respuestas de las variables consideradas y a partir de
aquí se prepara la información estadística.
Antes de recolectar datos es importante determinar el
objetivo de estudio, precisar las variables, las fuentes
de datos, con la finalidad de definir que datos hay que
recolectar

Material de Clases © G.P.P. 7/10/2019


FUENTES DE DATOS

Son aquellos lugares, persona o elementos


de los que se puede obtener datos o
información necesaria para realizare estudio
de investigación

Material de Clases © G.P.P. 7/10/2019


TIPOS DE FUENTES
a) Fuentes Secundarias:
 Datos ya recolectados para cumplir otros objetivos
 Contiene información, sintetizada y organizada
 Es la primera fuente que se debe analizar.
Ejemplo:
Datos publicados (en papel o en forma electrónica) en revistas
especializadas, tesis, censos y en las hojas de registro anteriores
Principales organismos que disponen de publicaciones son:
Instituto Nacional del Estadística e Informática www.inei.gob.pe
Banco Central de Reserva del Perú www.bcrp.gob.pe/
Ministerio de Salud del Perú www.minsa.gob.pe
Organización Mundial de la Salud www.who.int/es/
Ministerio de Educación www.minedu.org.pe
Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe
Ministerio de Energía y Minas www.minem.gob.pe
Instituto Geológico Minero y Metalúrgico www.ingemmet.gob.pe

Material de Clases © G.P.P. 7/10/2019


TIPOS DE FUENTES

FUENTES PRIMARIAS:
Datos que hay que recolectar para el trabajo
Personas que por su conocimiento proporciona
información especifica para el investigador
Las técnica mas empleadas de recolección de datos
son
La observación:
La experimentación
La entrevista.
La encuesta (Cuestionario)

Material de Clases © G.P.P. 7/10/2019


(a) La observación

Es el registro visual de lo Material de Clases © G.P.P.


ocurre, es una situacional real, 7/10/2019
clasificando y consignando los
acontecimientos pertinentes de
acuerdo con algún esquema
previsto y según el problema
que se estudia.
 Cuando se mide el desempeño,
la persona observada no debe
saber que es sujeta de
observación

Material de Clases © G.P.P. 7/10/2019


(b) La experimentación
Se registra un dato bajo condiciones provocadas
simulando el proceso lo más real posible.
Ejemplo:
Un mercado prueba para introducir un tipo jabón
de antiséptico con fragancia .

Material de Clases © G.P.P. 7/10/2019


(c) La entrevista
 Permite recolectar datos
o partir de un dialogo.
 Puede se estructurada o
no estructurada

Ejemplo:
Entrevista al Director de una
Clínica sobre la aplicación
de norma de calidad ISO
9000

Material de Clases © G.P.P. 7/10/2019


(a) La encuesta:
La encuesta es una de las técnicas de recolección mas usadas se fundamente
en un cuestionario que es un conjunto de preguntas

Diseño de cuestionario para la


encuesta
1. Cuestionario de preguntas abiertas o cerradas
2. Al diseñarla se debe:
Decidir forma de aplicarlo: correo, teléfono, personal, web
Plantear preguntas
Realizar una prueba piloto y hacer revisiones finales
Ejemplo:
Encuesta para conocer el grado de satisfacción de los asegurados a una clínica.

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
RECOMENDACIONES EN LA ELABORACIÓN DE CUESTIONARIOS

Es una tarea difícil y que requiere tiempo


Construir el instrumento de modo que refleje calidad
Hacer el cuestionario lo más breve posible, de modo
que se requiera el mínimo de tiempo para llenarlo.
Todos los reactivos (preguntas) deberán estar en
función del problema de investigación.
Debe partirse de las hipótesis y específicamente de
los indicadores que expresan a las variables. Estos
indicadores deben traducirse en las preguntas del
cuestionario.

Material de Clases © G.P.P. 7/10/2019


El lenguaje utilizado en la redacción debe ser
entendible por los encuestados

Debe evitarse la ambigüedad


Ejemplo: En un estudio de sobre tabaquismo
¿Frecuentemente fuma? SI …. NO ……

No formular preguntas dirigidas. Evitar adjetivos


Ejemplo: ¿Cree usted que precio de las
tarifas postales son altas?
SI …….. NO ………

Material de Clases © G.P.P. 7/10/2019


Neutralidad de las preguntas. El investigador
debe intentar adoptar una postura neutral con
respecto al problema objeto de estudio.

Ejemplo 1: “La defensa del país exige


contar con un presupuesto adecuado. ¿Está
usted de acuerdo con que se destinen
fondos del presupuesto nacional a la
actualización del Armamento de las Fuerzas
Armadas?
Forma tendenciosa grotesca

Material de Clases © G.P.P. 7/10/2019


Ejemplo 2: ¿Considera usted que la
empresa X ofrece un buen servicio
postventa?
Si ____
No ____
No sabe/ no contesta_____________

Forma más sutil de sesgar la pregunta

Material de Clases © G.P.P. 7/10/2019


Ejemplo 3:
¿Cómo encuentra usted el servicio post-venta de la empresa X?
Bueno _________
Regular ________
Malo ___________
No sabe/ no contesta __________

• ¿Aprueba o desaprueba la labor que viene desarrollando Ollanta


Humala como Presidente de la República? (%)
Aprueba 1

Desaprueba 2
• ¿Esta a favor o en contra de otorgar indulto a Alberto Fujimori? (%)

A favor 1

En Contra 2

Forma objetiva
Material de Clases © G.P.P. 7/10/2019
Tipos de preguntas
I. Según su formulación en el cuestionario:
1) Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificación y operatividad de los datos.
Ejemplo : ¿Posee Ud. un seguro médico?
Si No
1 2 Cerradas Dicotómicas (Si /No)

Ejemplo: Categoría docente


Principal ( ) 1
Cerradas múltiple
Asociado ( ) 2
Auxiliar ( ) 3
Ejemplo: ¿Cómo se entero de nuestra de nuestra institución?
Internet ( ) 1
Periódico ( ) 2
Cerradas de elección
Radio ( ) 3
multiple
Tv ( ) 4
Amigos ( ) 5
Material de Clases © G.P.P. 7/10/2019
2) Preguntas abiertas

 Los encuestados tienen libertad para emitir su


opinión.
 Se utilizan cuando no se tiene precisión sobre las
posibles respuestas.
 Dificulta la recolección de datos (incomoda al
encuestado).
 Es necesario codificar las respuestas para ser
procesadas
Ejemplo:
¿Qué opinión tiene sobre la política de salud del
actual Gobierno ?
………………………………………………………………………

Material de Clases © G.P.P. 7/10/2019


3) Preguntas Literales

Sonpreguntas
Son preguntas abiertas
abiertas cuyasserespuestas
cuyas respuestas se palabra
expresan con una expresan con
o cantidad
Ejemplo:
una palabra o cantidad
 ¿Cuál es su edad? ……………………………
Ejemplo:
 ¿Cuántos hijos tiene? …………………………..
 ¿Cuál
 ¿Cuáles es su edad?
su ocupación ……………………………
actual? …………………….

 ¿Cuántos hijos tiene? …………………………..


4) Preguntas con respuestas de grados de intensidad
 ¿Cuál es su ocupación actual? …………………….
Sus respuestas indican un grado de intensidad en sus respuestas
Ejemplo : ¿Esta usted de acuerdo con la política económica del actual gobierno?

1. Totalmente en desacuerdo ( )
2. En desacuerdo ( )
3. Ni en acuerdo ni desacuerdo ( ) Escala de Likert
4. De acuerdo ( )
5. Totalmente de acuerdo ( )

Material de Clases © G.P.P. 7/10/2019


SUGERENCIAS PARA LA CODIFICACION
Es buena idea codificar las variables como números para
poder procesarlas con facilidad en un programa
estadístico.
Es conveniente asignar “etiquetas” a los valores de las
variables para recordar qué significan los códigos
numéricos.
Sexo (Cualitativa: Códigos arbitrarios)
1 = Hombre
2 = Mujer
Se pueden asignar códigos a respuestas especiales como
0 = No sabe
99 = No contesta...

Material de Clases © G.P.P. 7/10/2019


El orden de las preguntas
1. Empezar con una presentación
2. Filtros al principio de los bloques
3. Primeras preguntas sencillas
4. Agrupar temas afines
5. Ir de lo general a lo específico y de lo sencillo a lo
complicado
6. Preguntas delicadas en medio
7. Acabar con preguntas “de relax”
8. Preguntas de clasificación al final
9. Dar las gracias al acabar

Material de Clases © G.P.P. 7/10/2019


CUESTIONARIO

http://www.enferpro.com/documentos/validacion_cuestionarios.pdf
Material de Clases © G.P.P. 7/10/2019
Material de Clases © G.P.P. 7/10/2019
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE RECOLECCIÓN DE DATOS

Material de Clases © G.P.P. 7/10/2019


PRESENTACION DE DATOS

Después de la recopilación de los datos es


necesario resumirlos y presentarlos en forma
tal que faciliten su comprensión y su posterior
análisis.
Para ello se presenta en tablas y gráficos.

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
Nota: Manual para la presentación de cuadros estadísticos D.L. 604

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
Material de Clases © G.P.P. 7/10/2019
Material de Clases © G.P.P. 7/10/2019
Material de Clases © G.P.P. 7/10/2019
Tipos de Presentación de datos

1. Tablas de Contingencia:
2. Tabla de Frecuencia.
3. Tallos y hojas
4. Gráficos

Material de Clases © G.P.P. 7/10/2019


Tipos de Presentación de datos

1) Tablas de Contingencia: Es un arreglo


ordenado de filas y columnas de datos
estadísticos
Tabla 01: LIMA: POBLACION DE ALUMNOS QUE FUMA SEGÚN
SEXO, 2014
Ta bla de contingenci a S EXO * FUMAR

Recuento
FUMA R
FUMA NO FUMA Total
SE XO HOMB RE 55 25 80
MUJER 16 4 20
Total 71 29 100

Fuente:
Apoyo 2014

Material de Clases © G.P.P. 7/10/2019


En SPSS ir a Analizar / Estadísticos Descriptivos/ Tablas de Contingencia …

Luego clic en Casillas

Después Continuar / Aceptar

Ta bla de contingencia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100

Material de Clases © G.P.P. 7/10/2019


Tipos de Presentación de datos
2. Tabla de Frecuencia: Es una tabla que divide a un conjunto de datos
en un numero adecuado de intervalos o categorías.
Elementos de una Tabla de Frecuencia:
• Frecuencia Absoluta (fi): Es el número de veces que se repite cada
valor de una variable.
Donde: m = número de intervalos o categorías
n = número total de observaciones
Además m

 fi  n
i 1
y 0  fi  n

• Frecuencia Relativa (hi): Se expresa en términos de porcentajes.


Donde fi
hi 
n m

Además h
i 1
i 1 y 0  h1  1

Material de Clases © G.P.P. 7/10/2019


Frecuencia Absoluta Acumulada (Fi): Es la acumulación
sucesivamente de las frecuencias absolutas, donde:
F1 = f1
F2 = f1 + f2 = F1 + f2
… = …………………………………

Fm = f1 + f2 + ………+ fm = Fm-1 + fm = n

• Frecuencia Relativa Acumulada (Hi): Resulta de sumar


sucesivamente las frecuencias relativas, donde:
H1 = h1
H2 = h1 + h2 = H 1 + h 2
…= ……………………………………………
Hm = h1 + h2 + ………+ hm = Hm-1 + hm = 1

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
Tabla de frecuencia con intervalos: Se sigue el
procedimiento siguiente:
1) Determinar el rango R= Xmax - Xmin
2) Determinar el número m de intervalos. Se
recomienda generalmente entre (5  m  15).
m = 1 + 3.3 x log (n) (Redondear al entero
más cercano).
3) Se determina el tamaño del intervalo de clase.
En lo preferible se debe encontrar un número entero
R
C tal que Cm  R
m
(Redondear por exceso, a la cantidad de
decimales que tienen los datos).
En caso de no cumplir, cambiar m o C

Material de Clases © G.P.P. 7/10/2019


4º) Calcular el rango ampliado R´= Cm
(5º) Hallar la diferencia a= R´- R

(6º) Distribuir la diferencia


 -(Límite inferior del primer intervalo)
 +(Límite superior del último intervalo)

(7º) Construcción de los intervalos [ >, < ]

(8º) Hallar la marca de clase que es el promedio del


intervalo
( Li  Ls )
Mi 
2
(9º) Se elabora la tabla: titulo, cuerpo y fuente

.
Material de Clases © G.P.P. 7/10/2019
Histograma de Frecuencias: Un histograma divide los valores de la muestra
en muchos intervalos y representa la frecuencia de los valores de datos en cada
intervalo con una barra.

Polígono de Frecuencias: Se construye tomando en cuenta la


marca de clase
Material de Clases © G.P.P. 7/10/2019
Ejemplo 1: La siguiente tabla muestra las edades de los
21 trabajadores que laboran en Siderúrgica Aceros
Arequipa:

Construir a partir de estos datos


Una tabla de frecuencia
Un histograma
Un polígono de frecuencia

Material de Clases © G.P.P. 7/10/2019


Solución
1. El rango R =72 – 39 =33
2. Determinar el intervalo
m =1 + 3.3log(21)
m =1 + 3.3x1.322 = 1 + 4.36 = 5.36
m=5
3. Hallar la amplitud
C =R/m=33/5= 6.6 (la cantidad de decimales que tienen
los datos).C=7
4. Luego el rango ampliado R´=C*m= 7x5=35
5. La diferencia a=R´-R =35-33=2
6. Distribuyendo la diferencia

Min Max +a
V. Corregido 39 72+2=7
4
Material de Clases © G.P.P. 7/10/2019
Interpretar

1) f1, F2, h3, H4


2) ¿Calcular el número y porcentaje de trabajadores entre 47 años y 68 años?

3) ¿Calcular el porcentaje de trabajadores que tienen por lo menos 55 años?

Material de Clases © G.P.P. 7/10/2019


Histograma de Frecuencias fi

8 7
7 6
. 6

Frecuencia
5
4 3 3
3 2
2
1
0
[39 - 46] <46 - 53] <53 - 60] <60 - 67] <67 - 74]

Poligono de Frecuencias fi
8
7
6
Frecuencia

5
4
3
2
1
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5

Material de Clases © G.P.P. 7/10/2019


Reporte del SPSS

Material de Clases © G.P.P. 7/10/2019


En SPSS después de poner los datos
Ir a Transformar / Recodificar en distintas variables ..

Luego clic en
Valores antiguos y nuevos

Y así hasta completar


todos los intervalos

Material de Clases © G.P.P. 7/10/2019


Luego clic en
Continuar/ Cambiar Aceptar

Luego hallar la tabla de frecuencia de la


variable EDADRECO

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
En Minitab Polígono de Frecuencia
Polígono de Frecuencia
7
7

6
6

Frecuencia Absoluta fi
5

3 3
3

2
2

0 0
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5
Marca de Clase

Material de Clases © G.P.P. 7/10/2019


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores y
datos continuos (Varios valores se agrupan en una clase)

ELABORACION DE HISTOGRAMAS
EN MINITAB
a) Luego de elegir
Graficas/Histograma
aparece la ventana
Histograma.

a) Elegir Simple y dar


Aceptar; luego ingresar en
la ventana Variables de
grafica el nombre de la
columna (variable) que se
desea analizar. La ventana
resultante es:

7/10/2019 . 50
Material de Clases © G.P.P. 7/10/2019
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

c) Dar click en
Etiquetas) y luego
seleccionar Etiqueta
de datos / Usar
etiquetas de valor y a
fin de que se muestre
la altura de la barra
(frecuencia).
d) Aceptar La grafica
resultante es:

7/10/2019 51
Material de Clases © G.P.P. 7/10/2019
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

e) Este gráfico no es
el que se desea
obtener. Vea que
C=7 y m=5, como lo
habíamos
planteado.
f) Dar click en una
barra cualquiera y
se obtiene la
ventana Edit
Barras:

Material de Clases © G.P.P. 7/10/2019


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

g) A continuación, se elige
la opción
Seccionamiento y se
abre el cuadro de datos
Punto medio y Punto de
corte , tal como se
muestra a continuación:

Material de Clases © G.P.P. 7/10/2019


Variables Cuantitativas (Discretas y Continuas)

h) Nótese que en Tipo


de intervalo, se ha
elegido la opción
Punto de corte. En
Definición de
intervalo se ha
elegido Posiciones
de punto medio de
corte
Xmín:Xmáx/C

i) A continuación se da
click en Aceptar y se
obtiene la ventana
Histograma:

Material de Clases © G.P.P. 7/10/2019


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

j) El grafico obtenido es
denominado: Histograma de
Frecuencias Absolutas.
Note que ahora m=5 y los
valores de los límites superior é
inferior de cada clase, se
muestran en el eje horizontal del
gráfico.

k) Esto nos facilita elaborar la


correspondiente Tabla de
Distribución de Frecuencias

Material de Clases © G.P.P. 7/10/2019


STATA

Clic en Graphics/ Histogram

8
7

6
Frequency

3 3

2
2
0

39 46 53 60 67 74
EDAD1

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
GRAFICO DE TALLOS Y HOJAS

EDAD Stem-and-Leaf Plot


3*10+9 tallo=3, hoja= 9, anchura =10
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Stem width: 10
Each leaf: 1 case(s)

Material de Clases © G.P.P. 7/10/2019


GRAFICO DE CAJAS Y BIGOTES
(BOX PLOT)

25

24 46

23 52

22 41
71
47
62

21 43
93
65
28
94

20

19
EDAD

18

17
N= 80 20

HOMBRE MUJER

SEXO

Material de Clases © G.P.P. 7/10/2019


Grafico de la Pirámide Poblacional Pictogramnas

Material de Clases © G.P.P. 7/10/2019


• Ejemplo 1: Completa la siguiente tabla correspondiente a las edades de
32 estudiantes

Edad fi hi Fi Hi

21 0.5
22 16
23 0.75
24 2
25 4
26
TOTAL
a) Cuantos estudiantes menores de 24 años hay
b) Que porcentaje de jóvenes son mayores de 23 años

Material de Clases © G.P.P. 7/10/2019


Ejemplo 3: La siguiente tabla muestra el
número de horas de tardanza anuales de
de 40 empleados de una empresa textil

Construir a partir de estos datos


a) Una tabla de frecuencia
b) Un histograma
c) Un polígono de frecuencia

Material de Clases © G.P.P. 7/10/2019


Ejemplo2: Las notas de la primera práctica calificada que obtuvieron 120
alumnos que llevan el curso de Análisis Matemático son presentados en la
siguiente tabla:
a) Si se desea analizar el rendimiento que han tenido los alumnos en dicha
práctica, determine:
La población:
La unidad de análisis:
La variable y su tipo:

a) Complete la tabla de distribución de frecuencias

Material de Clases © G.P.P. 7/10/2019


Material de Clases © G.P.P. 7/10/2019
2 3

a) Realizar una tabla de frecuencia


b) Hacer un análisis estadístico

Material de Clases © G.P.P. 7/10/2019

S-ar putea să vă placă și