Documente Academic
Documente Profesional
Documente Cultură
Pasos 3, 4, 5 y 6
Contacto: yagomezmur@unadvirtual.edu.co
intervalos X (h)o(f)
numero de datos
limite inferior (Li) limite superior (Ls) X=(Li + Ls)/2 contenidos en el
intervalo
X Y
153 1553 853 51
1554 2954 2254 82
2955 4355 3655 83
4356 5756 5056 73
5757 7157 6457 59
7158 8558 7858 43
8559 9959 9259 33
9960 11360 10660 22
11361 12761 12061 36
12762 14162 13462 51
90
80
70
frecuencie en el ambiente
60
50
40 Col
30 Col
20
10
0
853 2254 3655 5056 6457 7858 9259 10660 12061 13462
concentracion (µg/m3)
0
853 2254 3655 5056 6457 7858 9259 10660 12061 13462
concentracion (µg/m3)
C…..Encuentre e interprete el
cuartil 3, el decil 6 y el percentil
35.
Amplitud A= 1400
No de datos n= 500
la mitad datos n/2 = 250
tercer cuartil 3n/4 = 375
cuartil n/4 = 125 cuartil2
Mediana Me = 5068 5068
Moda Mo = 9355
cuartil1 Q1 = 2881
cuartil2 Q2 = 5068
cuartil3 Q3 = 8045.5
decil4 D4 = 4030.6 4033.4
decil6 D6 = 5935.4 5933.6
percentil10 P10 = 1548.7 1538.3
percentil35 P35 = 3667.95 1538.3
percentil90 P90 = 11461.8 11484.2
Fuente1: https://www.youtube.com/watch?v=sc9u5NXNJjI
Fuente2: https://www.youtube.com/watch?v=-JENrkfgcYk
Fuente3: https://www.youtube.com/watch?v=xBEziJvMYeI
0.6312038695 verificando
Fuente: https://www.youtube.com/watch?v=Qbwr3-GkTng
RESUMEN ESTADISTICO
Columna1
Fuente: https://www.youtube.com/watch?v=6Ddt7vE08h0
La curtosis se divide entres: los iguales(=) a cero(0) son MESOCURTICA, los mayores(>) a cero(0) son LEPTOCURTICAS y los men
Para nuestro caso su distribucion es platocurtica porque el resultado es menor a cero.
interpretecion curtosis:
**** coeficiente es negativo ( -0,613095613864629)
**** la distribución se llama platocúrtica
**** hay una menor concentración de datos en torno a la media.
**** la grafica sería más achatada
90
80
70
90
80
frecuencie en el ambiente 70
60
50
40
30
20
10
0
853 2254 3655 5056 6457 7858 9259 10660 12061 13462
concentracion (µg/m3)
interpretecion asimetria:
1....Regresión y Correlación. seleccionar dos de las variables cuantitativas de la base de datos, manifestando su elección a trav
como también entre los mismo integrantes del grupo
30
20
60 f(x) = 0.0048655061x
R² = 0.4934955708
50
51
40
coeficiente de correlación -0.7585734 ALTA
coeficiente de determinacion NO2 y = 0,0862x 30
R² = -2,022 20
10
Es negativa, por que dispercion va de arriba hacia abajo y el cooeficiente
es negativo 0
0 2000 4000
Y
NO2
120
100 97
80 80
69
64
60
f(x) = 0.086165922x
48 48
40 R² = 0.355958667
35
27
20 20
12
0
0 100 200 300 400 500 600 700
Column N Linear (Column N) Linear (Column N) Linear (Column N)
fuentes: https://www.youtube.com/watch?v=_g_hIebKlvQ
https://www.youtube.com/watch?v=LI14ftR6EVs
*****¿Cómo es la relación entre las dos variables según los criterios del coeficiente de correlación de Pearson?
La relación entre las dos variables es negativa, por que dispersión va de arriba hacia abajo, como lo muestra las líneas de tende
correlación negativa ALTA notamos que una variable X aumenta y a otra disminuye Según el coeficiente de correlación, el cual
qué grado se relacionan, para este caso, indican una correlación negativa, ya que al crecer una variable la otra decrece
El coeficiente de determinacion nos indica cuanto de la variacion en "y", se debe a la variacion en "x"
para ambas variables notamos que a mayor frecuencia en el ambiente menor es la concentracion, y se dan casos de mayor co
NO2 CO
Frecuencia
Marca de clase Frecuencia Absoluta Marca de clase Absoluta
36 48 853 51
103 69 2254 82
170 80 3655 83
238 97 5056 73
305 64 6457 59
373 48 7858 43
440 35 9259 33
507 27 10660 22
575 20 12061 36
642 12 13462 51
diagrama de disp
120
100
97
82 83
80 80
f(x) = - 0.1020322882x + 84.5787424545
presencia en el ambiente
R² = 0.575732102 73
69 f(x) = - 0.0033006727x + 76.9245647049
R² = 0.4484249218
64
60 59
51
48 48
43
40
35
27
20 20
12
0
0 2000 4000 6000 8000
tabla de prediccion
presencia en el ambiente concentracion
predicion CO NO2
x según nuestra tabla de prediccion:
y = -0,0033x + 76,925 y = -0,102x + 84,579
10 76.892 83.559
13 76.8821 83.253
16 76.8722 82.947
80 76.661 76.419
84 76.6478 76.011
88 76.6346 75.603
nálisis y discusión del problema.
Construya la distribución de frecuencia (usando intervalos) y su gráfico estadístico: histograma y polígono de frecuencia
IA
frecuencia absoluta frecuencia porcentaje
acumulada ralativa
(Hi)o(F) (hi)o(fr) %
se acomula el valor
de las frecuencias fr = f/N *100
absolutas
26 0.50980392 51.0
108 2.11764706 211.8
191 3.74509804 374.5
264 5.17647059 517.6
323 6.33333333 633.3
366 7.17647059 717.6
399 7.82352941 782.4
421 8.25490196 825.5
457 8.96078431 896.1
508 9.96078431 996.1
Column M según la tabla existen tres intervalos, con una frecuencia absoluta de 8
Column M estandares permisible, según los datos suministrados, - Tambien pode
pero no deja de ser un riesgo par la salud.
12061 13462
12061 13462
2, 2, 3, 5, 5, 5, 6, 6, 8, 9
2
2
O central de la muestra 5.1 3
r de mayor frecuencia 5 5
5 5
5
6
6
8
10 9
13
4
7
8
Decil5 11
5068 10 verificando
16
18
12
3
verificando 6
verificando 9
verificando 9
verificando 4
verificando 13
20 7.25
7 13.75
5
10
17
10
16
14
8
18
mier 65
jue 15
vier 80
promedio 50
CO
90
80 83
82
70 73
60 f(x) = 0.0048655061x
R² = 0.4934955708 59
50
51 51
40 43
30 36
33
20
22
60 f(x) = 0.0048655061x
R² = 0.4934955708 59
50
51 51
40 43
30 36
33
20
22
10
0
0 2000 4000 6000 8000 10000 12000 14000 16000
Y Linear (Y) Linear (Y) Linear (Y)
12
00 700
mn N)
elación de Pearson?
omo lo muestra las líneas de tendencias y ambos coeficientes son negativos con una
coeficiente de correlación, el cual nos indica el grado de relación entre las dos variables y en
na variable la otra decrece
racion, y se dan casos de mayor concentracion del contaminante pero su presencia en el ambiente es menor
diagrama de dispersion
NO2
Linear (NO
59 CO
Linear (CO
51 Linear (CO
43
36
33
22
ción de los contaminantes, pero es preocupante por el nivel de concentracion en el ambiente, ahora bien;
alidad del Aire de la Organización Mundial de la Salud (OMS), que recomiendan concentraciones inferiores a
se vea afectada ante exposiciones prolongadas (Organización Mundial de la Salud, 2005), ninguna de las
edio de contaminantes que no resultaran dañinas.
n una frecuencia absoluta de 87, 85 y 80 ; que representan la presencia del contaminante en el aire con unos
uministrados, - Tambien podemos denotar que a mayor concentracion la presencia en el ambiente es menor,
d.
mos en la tabla que cuando el contaminente sobrpasa los nivles permitidos su frecuencia tiende a descender
NO2
Linear (NO2)
CO
Linear (CO)
Linear (CO)
16000
e 76,892 µg/m3 de CO y 83,559 µg/m3 de NO2
e 76,8821 µg/m3 de CO y 83,253 µg/m3 de NO2
e 76,8722 µg/m3 de CO y 82,947 µg/m3 de NO2
e 76,661 µg/m3 de CO y 76,419 µg/m3 de NO2
e 76,6478 µg/m3 de CO y 76,011 µg/m3 de NO2
e 76,6346 µg/m3 de CO y 75,603 µg/m3 de NO2
Explicación del concepto
Cada estudiante elegirá uno de los siguientes conceptos (sin repetir) y publicará en el foro la elección. Después, in
definición y utilidad ayudándose de ejemplos, para publicar los resultados de su indagación en el foro con su resp
apoyo:
Gráficos estadísticos
Existe una gran cantidad de gráficos para la representación de datos estadísticos, entre los principales tenemos:
a) Gráfico de Barras
El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conserv
de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cuantitativas o c
tiempo, cuando el número de ítems es reducido.
- Utilizar un sistema de coordenadas rectangulares y se llevan al eje de las "x" los valores que toma la variable en
"y" se colocan las frecuencias de cada barra.
- Luego se construyen los rectángulos, tomando como base al eje de las abscisas, cuya altura será igual a cada un
frecuencias que presentan las variables en estudio.
- La magnitud con que viene expresada la variable se observa en la longitud de las barras (rectángulos). Es impo
solamente la longitud de las barras y no su anchura es lo que denota la diferencia de magnitud entre los valores
Todas las barras tienen que tener una anchura igual, separadas entre sí, preferiblemente por una longitud igual a
estas o distancias iguales entre barras.
Las barras se pueden graficar tanto verticalmente como horizontalmente. Se pueden elaborar barras compuestas
Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es
resaltar uno de ellos.
Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico
segmentos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo.
Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que
la misma); se utiliza plasmarlos en un solo gráfico, el cual es el resultado de representar varias variables en un m
gráfico se le llama gráfico de líneas compuesto.
Criterios para elaborar un gráfico de líneas:
1- La utilización de la escala que se utilizará en el plano cartesiano puede variar tomando en cuenta el fenómeno
necesario que las abscisas (ejes x) y las ordenadas (eje y) del plano cartesiano lleven la misma escala; sin embarg
de las variables no se diferencian sustancialmente es recomendable utilizar escalas iguales para obtener un gráfi
2- Cuando una de las variables en estudio se inicia con valores muy altos es recomendable no comenzar el eje po
por un valor próximo o por el mismo valor por donde comienza la variable.
3- Es costumbre representar en el eje de las x del plano cartesiano la variable independiente del estudio que se re
variable dependiente.
En aquellos casos que se dificulta distinguir el tipo de variable se recomienda colocar en la ordenada del plano ca
de las variables en estudio y sobre la abscisa la variable cronológica (años, semanas, días, horas, etc.)
d) Histograma de frecuencias:
El histograma es un diagrama en forma de columna, muy parecido a los gráficos de barras. Se define como un co
paralelos, en el que la base representa la clase de la distribución y su altura la magnitud que alcanza la frecuenci
correspondiente. Son barras rectangulares levantadas sobre el eje de las abscisas del plano cartesiano utilizando
los valores que asume la variable en la distribución de frecuencia.
El ancho de la base de los rectángulos es proporcional a cada clase de la distribución, de tal manera que, cuando
clases de igual tamaño, el tamaño de todos los rectángulos tendrá bases iguales.
Los lados del rectángulo se levantan sobre los puntos del eje de las x que corresponden a los límites de cada clase
mismos será igual a la frecuencia que tenga esa clase, los lados por lo tanto corresponden a la frecuencia de cad
de frecuencia.
Cuando se elaboran gráficas estadísticas en el plano cartesiano es recomendable que en el eje de las ordenadas
frecuencias y el eje de abscisas las variables independientes.
e) Polígono de frecuencias:
Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. Para construir el po
toma la marca de clase que coincide con el punto medio de cada rectángulo de un histograma.
2- Se traza sobre el eje de las abscisas, a distancias iguales, los puntos medios de las diferentes clases de la distrib
3- Se levantan perpendiculares por cada una de las marcas de clase, con una longitud igual a la frecuencia de cad
integran la distribución de frecuencia. Al final de cada perpendicular se marca un punto.
4- Los puntos resultantes se unen por medio de una línea recta obteniéndose una línea poligonal.
5- Con la finalidad de cerrar la línea poligonal se agrega una clase imaginaria con frecuencia cero a cada extrem
frecuencia, por tal motivos ambos extremos del polígono se cortan con el eje de las abscisas.
También se puede elaborar un polígono de frecuencia después de haber graficado un histograma; si se determin
rectángulo de un histograma y esos puntos medios se unen por medio de segmentos de recta dan como resultado
frecuencia.
f) Histograma de frecuencias acumuladas:
Se utiliza básicamente para mostrar la distribución de frecuencias acumulada de variables cuantitativas. Es una
los valores de las frecuencias acumuladas (menor que y mayor que) y los límites de las clases de una distribución
de frecuencia acumulada se le conoce comúnmente como ojiva.
La ojiva es una representación gráfica que consiste en una línea, que puede ser ascendente o descendente y se uti
distribuciones de frecuencias acumuladas menor que y mayor que, según los datos utilizados. En los estudios de
ojiva es de gran utilidad porque permite obtener con gran aproximación cierta información requerida, en un mom
En resumen:
Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se e
representación visual de la totalidad de la información. Los gráficos estadísticos presentan los dato
tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.
TIPOS DE GRÁFICOS ESTADÍSTICOS
Muestra los cambios que han sufrido los datos en el transcurso de un período de tiempo determina
comparaciones entre elementos. Las categorías se organizan horizontalmente y los valores vertica
resaltar la variación producida con el transcurso del tiempo.
LÍNEAS
Este tipo de gráfico se utiliza para mostrar tendencias en el tiempo. Se representan los valores en d
CIRCULAR
Un gráfico circular muestra el tamaño proporcional de los elementos que conforman una serie de
suma de los elementos. Siempre mostrará una única serie de datos y es útil cuando se desea destac
significativo.
BARRA
Los gráficos de barras ilustran las comparaciones entre elementos individuales.
Las categorías aparecen organizadas verticalmente y los valores horizontalmente, a fin de concentr
los valores y hacer menos hincapié en el tiempo transcurrido.
DISPERSIÓN(X, Y)
Los gráficos XY (Dispersión) muestran la relación entre los valores numéricos de varias series de da
números como una única serie de coordenadas XY
Este tipo de gráficos muestra los intervalos, o agrupaciones, de datos y suele utilizarse para represe
BURBUJA
Un gráfico de burbujas es un tipo de gráfico XY (Dispersión). El tamaño del marcador de datos indic
variable. Para organizar los datos, sitúe los valores X en una fila o columna y, a continuación, introd
tamaños de burbuja en las filas o columnas adyacentes.
COTIZACIONES
Un gráfico de cotizaciones que mide volúmenes tiene dos ejes de valores: uno correspondiente a la
volumen y el otro para la cotización de los valores. Este tipo de gráficos puede utilizarse para datos
volumen en un gráfico Máximo, mínimo, cierre o en un gráfico Apertura, máximos, mínimos, cierre
RADIAL
El gráfico radial compara los valores agregados de muchas series de datos. En este gráfico, la serie
mayor parte del área (Marca A), representa la marca con mayor contenido de ventas.
ANILLOS
Al igual que un gráfico circular, un gráfico de anillos muestra la relación de las partes con un todo,
más de una única serie de datos. Cada anillo de un gráfico de anillos representa una serie de datos
PÍCTOGRAMA
Un pictograma es un gráfico que utiliza una figura alusiva al tema para representar la frecuencia.
OJIVA
Es un gráfico asociado a la distribución de frecuencias, es decir, que en ella se permite ver cuántas
encuentra por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a
HISTOGRAMA
Es una representación gráfica de una variable en forma de barras, donde la superficie de cada bar
frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obte
general, o panorama, de la distribución de la población, o la muestra, respecto a una característica
de la misma y que es de interés para el observador (como la longitud o la masa).
CARTOGRAMA
Es un mapa o diagrama que muestra datos de cantidad asociados a respectivas áreas, mediante la
tamaños de las unidades de enumeración.
oro la elección. Después, indagará sobre su
ación en el foro con su respectiva referencia de
s
e los principales tenemos:
duales.
talmente, a fin de concentrarse en la comparación de
representar la frecuencia.
lla se permite ver cuántas observaciones se
ir los números asignados a cada intervalo.
Peña, D. (2014). Medidas de centralización y dispersión. En: Fundamentos de Estadística. [Online] Madrid: Alianz
(pp. 59 – 77). Recuperado de http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=110286
Saber Programas. [Saber Programas]. (Fecha de incorporación:19 sept. 2012). Excel - Crear histograma y polígon
en Excel. Tutorial en español HD [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=uZ3Q6N
Matemáticas profe Alex. [Matemáticas profe Alex]. (Fecha de incorporación: 3 may. 2016). Tabla de frecuencias a
intervalos | Ejemplo 2 [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=5XKf9vguOJE
Sebastian, Ruben. [Ruben Sebastian]. (Fecha de incorporación: 28 sept. 2011). Cuartiles y percentiles en el excel [
Recuperado de https://www.youtube.com/watch?v=sc9u5NXNJjI
Cabrera Diaz, Francisco. [Francisco Cabrera Diaz]. (Fecha de incorporación: 2 nov. 2008). Cuartiles, deciles y perce
agrupados en excel [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=-JENrkfgcYk
Velazco, Carlos. [carlos velazco]. (Fecha de incorporación: 27 jul. 2012). Excel deciles para datos no agrupados [A
Recuperado de https://www.youtube.com/watch?v=xBEziJvMYeI
WissenSync. [WissenSync]. (Fecha de incorporación: 9 feb. 2015). Varianza, desviación estándar y coeficiente de v
Excel [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=Qbwr3-GkTng
MateTutor. [MateTutor]. (Fecha de incorporación: 9 may. 2014). Varianza y Desviacion Estandar con Excel [Archiv
Recuperado de https://www.youtube.com/watch?v=6Ddt7vE08h0
Puntos 10,00/10,00
30,00 de
Calificac
30,00
ión
(100%)
Excelente,
ha dado
Coment respuesta
ario - correcta a
todas las
preguntas
Principio del formulario
Pregunta 1
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Una serie familias se han clasificado por la cantidad de hijos, los resultados se muestran a continuación: Nº de hijos 0 1 2
Seleccione una:
a. 6
b. 11
c. 10
d. 8
Pregunta 2
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Si n=50, la cantidad de intervalos en una tabla de frecuencia, aplicando la fórmula de Sturges es:
Seleccione una:
a. 8
b. 7
c. 6
d. 5
Pregunta 3
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
El polígono de frecuencia es un tipo de representación en:
Seleccione una:
a. Gráfico de pictogramas que representa las variables
b. Gráfico de líneas correspondientes a los puntos medios de un histograma
c. Gráfico circular que representa el porcentaje
d. Gráfico de barras en un conjunto compuesto de datos
Pregunta 4
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
La mediana de los datos: 30, 20, 17, 12, 30, 30, 14, 29 es:
Seleccione una:
a. 29
b. 20
c. 24.5
d. 25
Pregunta 5
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Se tiene el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8
Seleccione una:
a. 13 y 18
b. 7 y 14,5
c. 6 y 20,5
d. 6 y 18
Pregunta 6
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
La moda, mediana y media respectivamente de la siguiente información 2, 2, 3, 5, 5, 5, 6, 6, 8, 9 es:
Seleccione una:
a. Moda = 5, Mediana = 4, Media = 6,1
b. Moda = 5, Mediana = 5, Media = 5,1
c. Moda = 5, Mediana= 6, Media= 3,1
d. Moda = 6, Mediana = 4, Media = 7,1
Pregunta 7
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Las características cualitativas son aquellas que:
Seleccione una:
a. Asumen diversas formas de descripción
b. Son aquellas que se pueden medir
c. Se representan mediante números enteros
d. Se cuantifican mediante el conteo
Pregunta 8
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Pedro y Juan viven en un apartamento y comparten el pago de los gastos. En octubre, el consumo de gas natural se factu
Seleccione una:
a. 483
b. 90
c. 393
d. 567
Pregunta 9
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
La siguiente información muestra el número de multas de tránsito que tuvieron que pagar vehículos particulares por infrin
Seleccione una:
a. 25
b. 15
c. 65
d. 50
Pregunta 10
Finalizado
Puntúa 1,00 sobre 1,00
Desmarcar
Enunciado de la pregunta
Un estudio proyecta la cantidad de personas que, para el año 2030, habrán tenido algún tipo de enfermedad antes de los
Seleccione una:
a. 86%
b. 36%
c. 0%
d. 90%
Final del formulario
a continuación: Nº de hijos 0 1 2 3 4 5 6 7 8 Nº de familias 11 13 20 25 14 10 4 2 1 El rango o recorrido del grupo de datos es:
13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18; el valor de los cuartiles 1 y 3 son respectivamente:
consumo de gas natural se facturo por $14.500, incluido el cargo fijo de $2.700 que es el mismo todos los meses. El consumo históri
vehículos particulares por infringir la medida del “pico y placa” en Bogotá, durante una semana del mes de agosto de 2018; el lunes 2
ipo de enfermedad antes de los 70 años de edad. De 50 personas, 7 no presentan enfermedad. De acuerdo con esta información ¿Q
o del grupo de datos es:
s los meses. El consumo histórico en metros cúbicos, de ese servicio es: abril 11, mayo 12, junio 15, julio 11, agosto11, septiembre 1
es de agosto de 2018; el lunes 25, martes 65, miércoles 65, jueves 15 y viernes 80. El promedio de multas que tuvieron que pagar lo
cuerdo con esta información ¿Qué porcentaje de la población habrá tenido alguna enfermedad antes de los 70 años de edad en el 20
julio 11, agosto11, septiembre 12, octubre 13 Para saber cuál es el costo promedio del consumo diario, se resta del cobro total de ese
multas que tuvieron que pagar los vehículos particulares por no cumplir con la medida del “pico y placa” fue de