Documente Academic
Documente Profesional
Documente Cultură
2018-II
1-2
Tipos de Datos
Dato
Cualitativo Cuantitativo
(Categórico) (Numérico)
Ejemplos:
◼ Genero Discreto Continuo
◼ Estado civil
◼ Partido político Ejemplos: Ejemplos:
◼ Color de ojos
(Categorías definidas) ◼ Número de hijos ◼ Peso
◼ Defectos por hora ◼ Voltaje
(Valores contados) (Medidas de
carácterísticas)
Población y muestra
❑ Población: Conjunto
bien definido de N-
entes, cuyas
*características nos
proponemos a
Muestra investigar
Población
❑ Muestra:
subconjunto de la
población
La información obtenida
de la muestra nos permite
inferir las propiedades o
características de toda la
Unidad de investigación
Elementos de la población población, con errores
objetivo a los que se les Observación: medibles y acotables
efectúa las medidas bajo Cada un de los
análisis elementos incluidos
en la muestra
Caracterización de muestras
Si representa por X una característica de interés de una población
Objetivo, a una muestra de tamaño n de esta Población, se la
representa por,
𝑥1 , 𝑥2 , … , 𝑥𝑛
Es valido representar esta muestra por un vector X en 𝑅𝑛 de la
siguiente forma:
𝑋 𝑇 = (𝑥1 , 𝑥1 , … 𝑥𝑛 )
Procesamiento
de los datos
Dato Información
Tabulación Conjunto de datos
Mediciones no de datos procesados que
procesadas Gráficos nos permiten tomar
- Numéricas Medidas decisiones
- Categóricas razonables
Obtención de información a partir de
datos de una muestra
Tenemos una muestra de tamaño n
𝑋(𝑛) = 𝑚𝑎𝑥 𝑥1 , 𝑥2 , … , 𝑥𝑛
Eestadístico de orden dos, tres y así pasando por el i-ésimo orden, llegamos
al de orden (n-1) y de orden n, esto significa:
Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número
de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior
más cercano. Esto altera el valor de rango por lo que es necesario
efectuar un ajuste así:
Procesamiento de los datos
b) Tabulación de los datos: Clase y Marca de Clase
1-13
Procesamiento de los datos
b) Tabulación de los datos
Igual longitud
Gráficos
Histograma de Frecuencias
Polígono de Frecuencias
Grafico de la Ojiva
Grafico de los cuartiles a partir de la Ojiva.
Procesamiento de los datos
c) Gráficos
Histogramas
Polígono de frecuencias
Ojiva: Distribución de
frecuencias acumulada
Cuantiles y Medidas de
tendencia central y
dispersión
Medidas de Resumen
x i i =1
= i =1
N 0 wi 1
3-21
Media Ponderada
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Medidas de Posición - Cuantiles
Percentiles
Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:
Deciles
Diagrama de Caja
* *
Valores “Valor más pequeño” “Valor más grande”
Atípicos (Límite Inferior) Q1 Q2 Q3
(Límite Superior)
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
3-28
Variación
Intercuartílico σ2 = i=1
σ = σ2
N
RI = Q(3) − Q(1) Varianza
Muestral Desviación
Estándar
n Muestral
En este capitulo solo que se i
(x − x ) 2
s = s2
indique lo contrario se s2 = i =1
trabajara en base a muestras n -1
Variación
Valor pequeño
Menos variación
Valor grande
Más variación
Mismo centro,
diferente variación
3-30
Medidas de tendencia
central y dispersión para
datos agrupados
Medidas y desviación para datos agrupados
K
Media
Y i fi Varianza de
la muestra
K
i
(Y − y ) 2
fi
y= i =1
s2 = i =1
n n -1
Yi = i-ésima marca de
clase
Covarianza
En probabilidad y estadística, la covarianza es un valor que indica el
grado de variación conjunta de dos variables aleatorias respecto a sus
medias.
Cuando los valores altos de una de las variables suelen
mayoritariamente corresponderse con los valores altos de la otra, y lo
mismo se verifica para los pequeños valores de una con los de la otra, se
corrobora que tienden a mostrar similar comportamiento lo que se
refleja en un valor positivo de la covarianza.
Por el contrario, cuando a los mayores valores de una variable suelen
corresponder en general los menores de la otra, expresando un
comportamiento opuesto, la covarianza es negativa.
El signo de la covarianza, por lo tanto, expresa la tendencia en la
relación lineal entre las variables.
Cálculo de la Covarianza
X= # de Y=# materias
años en la aprobadas
estudiando
su carrera
en la ESPOL
(Hacer un
corte hasta
el semestre
anterior)
Correlación
Covarianza entre X e Y
𝑐𝑜𝑣(𝑥,𝑦) 𝑆𝑥𝑦
C𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑋 𝑦 𝑌 = 𝑟𝑥𝑦 = =
𝑠𝑥 𝑠𝑦 𝑠𝑥 𝑠𝑦
( x − x )( y − y ) Desviación
r= n −1 típica de X
multiplicada
( x − x ) 2
( y − y ) 2
por la
desviación
n −1 n −1 típica de Y
rxy =
( x − x )( y − y ) Indicador de relaciones lineales entre dos
[ ( x − x ) ][ ( y − y )
2 2
] variables X y Y de una misma muestra
Mide la “Fortaleza” de la relación lineal
Características de r
x
x
y
y
x
x
Matrices de datos,
covarianzas
** Revisar el apartado de vectores de medias y Matriz de varianzas y
covarianzas pg 40-43
MATRIZ DE VARIANZAS Y COVARIANZAS
MATRIZ DE CORRELACIÓN
Es una representación ordenada de los coeficientes de correlación de cada
variable con otra variable y consigo misma
𝑟11 = 𝑟22 = 1
Resumen de datos Cualitativos
Distribución de Frecuencias