Sunteți pe pagina 1din 30

FACULTAD DE INGENIERIA

Escuela Académica Profesional de Ingeniería Industrial


Desarrollo del Proyecto de Investigación

SESIÓN 03
Procedimiento Planificado de Recojo de
Datos
Trujillo - 2019 Mg. Segundo Gerardo Ulloa Bocanegra
Tema I. Análisis estadístico
descriptivo
◼ Introducción.
◼ Tipos de datos.
◼ Resumen de la información mediante tablas,
gráficas y el cálculo de estadígrafos.
◼ Correlación. Matriz de correlación.
◼ Uso del software estadístico SPSS.
Interpretación de resultados.
❖ La Estadística se considera actualmente la
«ciencia de los datos».
❖ Se utiliza como herramienta de análisis de
las ciencias no exactas donde la
variabilidad y la incertidumbre forman
parte de su naturaleza.
❖ En dichas ciencias la variabilidad no es la
excepción sino la regla.
Clasificación de las variables
❖Cualitativas
(nominales u ordinales).

❖Cuantitativas o numéricas
(discretas o continuas).
Presentación
ordenada de datos 7

6
Género Frec.
5

Hombre 4 4

2
Mujer 6 1

0
Hombre Mujer

◼ Las tablas y las representaciones gráficas son dos


maneras equivalentes de presentar la información.
Las dos exponen ordenadamente la información
recogida en una muestra.
Tablas de frecuencia
❖ Frecuencias absolutas, relativas y acumuladas.
(Las frecuencias acumuladas sólo tienen sentido para variables
ordinales y numéricas).
Gráficos para variables cualitativas

◼ Diagramas de barras
✓ Alturas proporcionales a las
frecuencias (absolutas o relativas).
✓ Se pueden aplicar también a
variables discretas.

◼ Diagramas de sectores (pastel)


✓ El área de cada sector es
proporcional a su frecuencia
(absoluta o relativa)
Gráficos para variables numéricas
❖ Diagrama de barras (para v. discretas)
❖ Histograma (para v. continuas)
Estadísticos más utilizados
➢ De centralización: Indican valores con respecto
a los que los datos parecen agruparse.
◼ Media, mediana y moda

➢ De dispersión: Indican la mayor o menor


concentración de los datos con respecto a las
medidas de centralización.
◼ Rango, varianza, desviación típica y
coeficiente de variación
Estadísticos de centralización
Media: Es el centro de gravedad de un conjunto de datos.
Conveniente cuando los datos se concentran simétricamente
con respecto a ese valor. Muy sensible a valores extremos.
Mediana: Es el valor central que divide en dos grupos a un
conjunto ordenado de datos. Si el número de datos es par, se elige
la media de los dos datos centrales.
✓ Mediana de 1,2,4,5,6,6,8 es 5
✓ Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimétricos. No es
sensible a valores extremos.
✓ Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!

Moda: Es el valor donde la distribución de frecuencia alcanza


un máximo. Puede haber más de un valor modal.
Altura mediana
Variabilidad o dispersión
Los estudiantes reciben diferentes calificaciones en una
asignatura, ¿cuáles pueden ser las causas?
➢ Diferenciasindividuales en el conocimiento
de la materia.
➢ Diferenciasindividuales en la habilidad para
hacer el examen.
➢ Variabilidad
por error de medida. (El examen
no es una medida exacta del conocimiento).
➢ Variabilidad por azar, aleatoriedad. (En una
pregunta difícil se duda entre varias opciones y al
azar se elige la errónea).
Medidas de dispersión
Miden el grado de dispersión o variabilidad de los
datos, independientemente de su causa.

◼ Amplitud o Rango:
Diferencia entre observaciones extremas.

2,1,4,3,8,4. El rango es 8-1=7

✓Es muy sensible a los valores extremos:


2,1,4,300,8,4. El rango es 300-1=¡299!
◼ Varianza:
Mide el promedio de las desviaciones (al cuadrado)
de las observaciones con respecto a la media.

 (x
1
S 2
= i − x) 2

n i

✓ Es sensible a valores extremos (alejados de la


media).
✓ Sus unidades son el cuadrado de las de la
variable.
CORRELACION DE PEARSON CHI-CUADRADO

S-ar putea să vă placă și