Documente Academic
Documente Profesional
Documente Cultură
PRESENTADO POR
Grupo:
511004_2
TUTOR:
LICENCIATURA EN MATEMATICAS
2020
INTRODUCCIÓN
En el presente documento se presenta el desarrollo de la fase cuatro de trabajo del curso estadística
descriptiva, en donde se relacionan los conceptos iniciales de la estadística, los cuales son la base
de la construcción teórica que se aproxima en el desarrollo de las fases consecutivas, es importante
mencionar elementos como las distribuciones de datos, que pueden ser abordados e interpretados
mediante la aplicación de varios instrumentos que nos llevan a comprender, sistematizar dichos
conjuntos de datos para la toma de decisiones, por lo cual, la estadística es un interesante campo
del conocimiento en el que nos vemos inmersos.
Las medidas de tendencia central son medidas estadísticas que resumen en un solo valor a un
conjunto de valores; las más utilizadas son: la media, la mediana y la moda. Las medidas de
dispersión por su parte miden el grado de dispersión de los valores de la variable, es decir pretenden
evaluar en qué medida los datos difieren entre sí; entre estas se cuentan el recorrido, la desviación
media, la varianza y la desviación típica. Ambos tipos de medidas usadas en conjunto permiten
describir un conjunto de datos entregando información acerca de su posición y su dispersión.
En este trabajo se profundizan los conceptos de regresión lineal, medidas de dispersión, correlación
lineal y diagramas de caja, además se aplican dichos conceptos en la solución de problemas.
OBJETIVOS
Objetivo General
Objetivo Especifico
Las medidas de dispersión pueden definirse como los valores numéricos cuyo objeto es analizar el
grado de separación de los valores de una serie estadística con respecto a las medidas de tendencia
central consideradas.
La desviación media se define como la media aritmética de los valores absolutos de la desviación
de cada valor de la variable con respecto a la media.
La varianza se define como el cociente entre la suma de los cuadrados de las desviaciones de los
valores de la variable y el número de datos del estudio. Matemáticamente, se expresa como:
La desviación típica, simbolizada por s, se define como la raíz cuadrada de la varianza:
• La regresión lineal es una técnica estadística que permite estudiar la relación entre una
variable dependiente y una o más variables independientes, con el fin de averiguar en que medida
la primera puede estar explicada por la segunda y obtener predicciones en la variable dependiente
a partir de las independientes. El procedimiento implica, básicamente, obtener la ecuación mínimo-
cuadrática que mejor expresa la relación entre las variables y estimar mediante el coeficiente de
determinación la calidad de la ecuación de regresión obtenida.
Las medidas de dispersión son parámetros estadísticos que nos informan sobre
la variabilidad de los datos, es decir, si la distribución de los datos es más o
menos homogénea y por tanto nos dan una medida sobre la representatividad de
los parámetros de centralización (moda, mediana o media) (Creative Commons,
2020).
∑𝑖𝑛=1(𝑥𝑖 − 𝑥)2
𝑠2 =
𝑛−1
- Desviación típica: Encontramos que “…es una medida que ofrece información sobre la
dispersión media de una variable. La desviación típica es siempre mayor o igual que cero”
(López, 2019). Nos damos cuenta que la ecuación para calcular la desviación típica o
estándar es la raíz cuadrada de la varianza:
∑𝑖𝑛=1(𝑥𝑖 − 𝑥)2
𝑠=√
𝑛−1
Es posible identificar que se usa la regresión lineal para identificar líneas de tendencia en
disciplinas como la medicina o la industria, para caracterizar desde el desarrollo de las
´particularidades de una enfermedad dada, o por otra parte, como aplicación para conocer el
rendimiento de un determinado producto, dicho en otras palabras esto sugiere:
Una línea de tendencia representa una tendencia en una serie de datos obtenidos
a través de un largo período. Este tipo de líneas puede decir si un conjunto de
datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor
de las acciones) han aumentado o decrementado en un determinado período.
Las líneas de tendencia son generalmente líneas rectas, aunque algunas
variaciones utilizan polinomios de mayor grado dependiendo de la curvatura
deseada en la línea (Ecured, 2020).
c. CORRELACIÓN LINEAL: Podemos determinar que se trata de un método para conocer la
relación entre dos variables, es decir, “… si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta” (Economipedia, 2020).
𝐶𝑜𝑣𝑥𝑦
𝜌𝑥𝑦 =
𝜎𝑦 𝜎𝑋
Desde otra perspectiva podemos abordar el significado estadístico del concepto de correlación
lineal.
- Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro
de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2)
- Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que
empieza en el tercer cuartil y acaba en el máximo.
- Los datos atípicos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos (Universo formulas,
2020).
Con esto es posible verificar que el diagrama de caja “… es un diagrama que muestra una
representación gráfica de la distribución de datos, señalando donde caen la mayoría de los valores
y los valores que difieren considerablemente de la norma (valores atípicos)” (Arcidiacono, 2019).
ACTIVIDAD GRUPAL
Tarea 1: Los porcentajes de rentabilidad de los fondos de la inversión de diez grandes empresas
fueron:
b) La desviación típica
c) Desviación media.
X ̅
𝑿 ̅
𝑿−𝑿 ̅ )𝟐
(𝑿𝟏 − 𝑿
𝑿𝟏 28,2 7,75 60,06
𝑿𝟏 18,1 -2,35 5,52
𝑿𝟏 34,4 13,95 194,60
𝑿𝟏 28,9 8,45 71,40
𝑿𝟏 26,5 6,05 36,60
𝑿𝟏 26 5,55 30,80
𝑿𝟏 11,5 -8,95 71,40
𝑿𝟏 0 -20,45 418,20
𝑿𝟏 10,9 -9,55 91,20
𝑿𝟏 20,5 0,05 0,25
𝑿𝟏 25,5 5,05 25,50
𝑿𝟏 14,9 -5,55 30,80
∑ 245,4 20,45 93,7 1036,33
∑𝑥
𝑥̅ =
𝑛
245,4
𝑥̅ =
12
𝑥̅ = 20,45
Varianza:
∑(𝑋1 − 𝑋̅)2
S2 =
𝑛−1
1036,33
S2 =
12 − 1
1036,33
S2 =
11
𝐒 𝟐 = 𝟗𝟒, 𝟐𝟏
La desviación típica:
∑(𝑋1 − 𝑋̅)2
𝜎=√
𝑛
1036,33
𝜎=√
12
𝜎 = √86,36
𝝈 = 𝟗, 𝟐𝟗
Desviación media:
∑(𝑋1 − 𝑋̅)
𝐷. 𝑀 =
𝑛
97,7
𝐷. 𝑀 =
12
𝑫. 𝑴 = 𝟕, 𝟖𝟎
Tarea 2:
En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de una gran
empresa antes de su retiro voluntario:
0-1 10
1-2 34
2-3 56
3-4 76
4-5 82
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3
Tabla De Frecuencia
N 12 Clase limite inf limite sup mi ni Ni fi Fi
X min 3 1 3 20 23 6 6 1 1
X max 82 2 20 37 58 3 9 0 1
Rango 79 3 37 55 92 0 9 0 1
K 5 4 55 72 126 1 10 0 1
W 17 5 72 89 161 2 12 0 1
Histograma
Histograma
1
0
0
0
23 58 92 126 161
Media 30
Mediana 22
Moda 8
Varianza
Desviación típica
√(30 − 8)2 + (30 − 34)2 + (30 − 56)2 + (30 − 76)2 + (30 − 82)2 + (30 − 25)2 + (30 − 10)2 + (30 − 27)2 + (30 − 12)2 + (30 − 8)2 + (30 − 19)2 + (30 − 3)2
12
√(22)2 + (−4)2 + (−26)2 + (−46)2 + (−52)2 + (5)2 + (20)2 + (3)2 + (18)2 + (22)2 + (11)2 + (27)2
12
√−2936
12
√−244,6
−𝟒𝟗, 𝟒𝟓𝟕
Qué porcentaje de empleados tiene más de 8 años de experiencia y menos de 6 años de experiencia.
Tarea 3:
La siguiente tabla refiere a los usos más comunes citados en una encuesta realizada a usuarios de
ordenadores de pequeñas y medianas empresas.
Área Respuesta
Contabilidad 26%
Información 4%
Otros 8%
Solución:
a) Hallar la media
b) Hallar la mediana
Organizamos los valores de menor a mayor
4%,8%,10%,13%,15%,24%,26%
Entonces tachamos los extremos de cada lado hasta obtener los dos números del centro para hallar
la mediana
13% es la mediana
c) Hallar la moda
d) Hallar la varianza
Colocamos los valores dados
x
𝒙𝟏 26%
𝒙𝟐 15%
}𝒙𝟑 24%
𝒙𝟒 13%
𝒙𝟓 10%
𝒙𝟔 4%
𝒙𝟕 8%
∑ 100%
x x x- x (𝒙 − 𝒙 𝟐 )
𝒙𝟏 26% 11,72 484
𝒙𝟐 15% 0.72 0.5184
𝒙𝟑 24% 9.72 94.4784
𝒙𝟒 13% -1.28 1.6384
𝒙𝟓 10% -4.28 18.3184
𝒙𝟔 4% -10.28 105.6784
𝒙𝟕 8% -6.28 39.4384
124.0 la varianza
Tarea 4:
Una compañía asigna diferentes precios a un equipo de sonido particular en ocho regiones
diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los precios
correspondientes (en miles de pesos).
Ventas 402 381 350 430 441 380 405 420 421
Precio 45 66 70 90 75 45 65 70 65
a) Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se ajuste.
b) Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.
c) Determinar R y dar una interpretación
Solución
Para encontrar y= mx + b
9(239701)−(591)(3630)
M= 9(40381)−(591)2
M= (2157309) − (2145330)
(363429)-(349281)
M= 11979
14148
M= 0,84669
9 9
B= 403,33 - 55,593
B=347,737
Y= 396,845
Y= 405,311
Y= 407,005
Media de x = 591 / 9
X= 65,666
Media de y = 3630 / 9
y= 403,333
1331
R= 2 2
√1572 √6612
1331
R= (39,648)(81,314)
1331
R= 3224,056
R= 0,412
Tarea 5:
El dato de la siguiente tabla representa las alturas (X) cm. y los pesos (Y) kg. de varios hombres.
a) Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.
b) Determinar el peso si la altura es de 150, 153 y 175 cm.
c) Determinar R y dar una interpretación
Solución
23,44
𝜎𝑥 = √ − (1,70)2 = √2,93 − 2,89 = 0,2
8
27163,25
𝜎𝑦 = √ − (57,19)2 = √3395,41 − 3270,70 = 11,17
8
También fue de gran ayuda cada actividad porque con ellas pudimos aplicar los conocimientos
adquiridos a lo largo de este tiempo académico.
Como grupo nos ayudamos muchísimos, todos aportamos al aprendizaje de nuestros compañeros
Referencias
Romero, E. (2016). Estadística para todos: análisis de datos; estadística descriptiva; teoría de la
probabilidad e inferencia. Editorial Difusora Larousse - Ediciones Pirámide. Disponible en:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11231145&p00
=Estadistica+descriptiva