Sunteți pe pagina 1din 27

Informe Final

ESCUELA DE CIENCIAS DE LA EDUCACIÓN


ESTADISTA DESCRIPTIVA

Presentado a
Tutor:
FRANCISCO CABRERA DÍAZ

Presentado por
Jhon Wilfer VIRGUEZ SIERRA – 1053332035
WIRIS RAFAEL CONTRERAS QUINTERO - 1051816706
JUAN DIEGO BERNAL OROZCO - 1053818828

Grupo No.
100105_112

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
INGENIERÍA DE SISTEMAS
BOGOTÁ D.C.
2016

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
1
Informe Final

Contenido Actividad Individual 1


Introducción. ........................................................................................................................... 3
Justificación. ........................................................................................................................... 4
Objetivos................................................................................................................................. 5
General ................................................................................................................................ 5
Específicos .......................................................................................................................... 5
Conceptos Básicos .................................................................................................................. 6
Medidas de Ubicación o dispersión ........................................................................................ 7
Medidas Univariantes de Tendencia Central ...................................................................... 8
Medidas Estadísticas Bivariantes ......................................................................................... 13
Regresión y Correlación Lineal Múltiple. ........................................................................ 17
Propuesta Individual ............................................................................................................. 21

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
2
Informe Final

Introducción.

El desarrollo de esta actividad se hizo con el fin de aplicar los conceptos estudiados
en el curso Estadística Descriptiva de la Unad, siendo este un conocimiento
indispensable para el continuo aprendizaje en nuestro programa. Así mismo tiene
como fin llevar a la práctica los conceptos y ejercicios trabajando con escenario real.
Adicional a la obtención del reconocimiento de los recursos para realizar una
planeación del desarrollo de las actividades, se llevó a cabo porque hace parte de
nuestra formación académica. Haciendo buen uso de las herramientas y el material
variado y competente para indagar acerca del tema propuesto, hemos desarrollado
la actividad de manera didáctica con el fin de compartir con todos los participantes
y contribuir al aprendizaje colaborativo, generando así unos resultados
satisfactorios y significativos.

Teniendo en cuenta que el interés por aprender es constante, fue de buen agrado y
mayor provecho dedicar tiempo para plasmar las ideas según lo solicitado, y de esta
forma continuar con el proceso de aprendizaje, y demostrar de manera consecuente
el entendimiento y enriquecimiento del saber. Así mismo la intencionalidad de
contribuir a la formación y cumplimiento de acuerdo al desarrollo de las actividades.
.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
3
Informe Final

Justificación.

La estadística proporciona los elementos básicos para fundamentar, en una


investigación:
 Cómo planear la obtención de los datos para que de ellos se puedan
extraer conclusiones confiables
 Cómo analizar estos datos
 Qué tipo de conclusiones pueden obtenerse con los datos disponibles
 Cuál es la confianza que nos merecen los datos.
La estadística, como se puede observar, por medio de sus dos ramas, nos permite
realizar estudios de tipo descriptivo y explicativo prácticamente en todas las áreas
del conocimiento humano.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
4
Informe Final

Objetivos
General

Desarrollar la capacidad de comprensión, análisis y síntesis, mediante la


identificación y aplicación de la estadística descriptiva para solucionar situaciones
del entorno.

Específicos

 Identificar la población, el tamaño de la muestra, la ubicación espacio


temporal del estudio, la unidad estadística y las variables (cualitativas,
cuantitativas: Discretas y continuas) que intervienen en el caso de estudio.
 Organizar la información mediante la implementación de las diferentes
herramientas estadísticas (tablas de frecuencias, diagramas de tallo, etc.)
 Desarrollar en cada uno de los estudiantes la capacidad de análisis e
identificación de problemáticas de la vida cotidiana.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
5
Informe Final

Conceptos Básicos
 La Población, se habla del total de eventos que representan un estudio,
para el caso concreto, la población son los accidentes de tránsito ocurridos
a en el territorio Nacional, durante el 2015
 El tamaño de la muestra, y ubicación espacio temporal de la muestra, es la
definición y delimitación de la proporción que se va a estudiar y la que
permitirá extrapolar los resultados a una conclusión más general, de acuerdo
a la representatividad de los datos, para el caso particular la muestra que se
va a estudiar son los 110 accidentes de tránsitos presentados en la ciudad
de Medellín durante el 2015.
 La unidad estadística, se dice que es la unidad básica de cualquier análisis
estadístico, es la parte indivisible del proceso de análisis y representa cada
una de las observaciones, para el caso de nuestro análisis esta unidad es
Cada uno de los registros de accidente
 Las variables; estas pueden ser de dos tipos, discretas o continuas, siendo
las primeras: variables de tipo cuantitativo que puede tomar un solo valor,
entre cierta cantidad de valores dados dentro del problema de estudio, su
valor siempre será finito y solo acepta valores enteros. Mientras que las
variables continuas son las que pueden tomar cualquier valor que exista entre
dos magnitudes, es decir puede tomar infinitos valores, además estos valores
admiten fracciones y son el resultado de algún método de medición
o Cualitativas; Tipo de Vehículo, Genero, Mes, Día de la semana, Otros
Factores, Tipo de Vía, involucra peatones
o Cuantitativas.
 Las Variables discretas son : número de heridos,
número de muertos
 Variables continuas son: grado de alcohol del
conductor, hora, costo estimado del siniestro, edad,
velocidad velocidad

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
6
Informe Final

Medidas de Ubicación o dispersión

Las medidas invariantes de tendencia central son aquellas medidas ubicadas en


el centro de los datos o de la distribución del mismo, y que simplifica la información
dada. Se debe tener en cuenta, y referenciar la diferencia cuando se habla de
muestras (estadígrafos) o de poblaciones (parámetros). Entre las medidas de
tendencia central más importantes se encuentran; la media aritmética, la media
ponderada, la media geométrica, la media armónica, la mediana y la moda.

Así mismo, para el análisis de una variable o de una distribución unidimensional se


Consideran las siguientes clases de medidas; las Medidas de posición y las Medidas
de dispersión. Dentro de las primeras encontramos Los cuartiles, decirles y
percentiles son medidas que se utilizan para determinar los intervalos dentro de los
cuales quedan proporcionalmente repartidos los términos de la distribución

Las medidas de dispersión hacen referencia al análisis de los datos que se alejan
del centro, y que por tanto no dan información útil en los cálculos de promedio o de
tendencia central, pero que son necesarios para conocer cuál es la realidad de los
datos con los que se pretende analizar una situación dada. Las principales medidas
de dispersión son; el rango o recorrido, la varianza, el coeficiente de variación, el
puntaje típico o estandarizado y las medidas de asimetría o apuntalamiento.

Una vez revisado, a modo general, algunos conceptos sobre las variables y sus
medidas procederemos a hacer el respectivo análisis teniendo en cuenta los datos
aportados por la investigación y orientados a resolver la problemática planteada
“Principales Causas que incrementan e (inciden) en el número de accidentes de
tránsito, ocurridos en el territorio Nacional”

Para el caso de la variable discreta tomare la edad y para el análisis de variable


continua el grado de alcohol del conductor, con lo cual espero poder reconocer más

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
7
Informe Final

adelante alguna relación entre las variables y determinar si existe o no una


correlación o causalidad entre el grado de alcohol y la edad.

Medidas Univariantes de Tendencia Central


Variable Discreta: Edad:
29 48 21 29 22 29 42 18 23 35 32 45 46 19 54 54 24 29 54 52
17 53 46 17 38 38 46 54 45 55 46 31 36 21 60 33 44 17 33 38
22 35 55 22 52 52 36 33 43 22 55 33 35 42 33 52 31 22 52 46
55 46 19 34 46 46 35 52 34 18 19 23 56 46 32 38 50 54 38 29
60 45 21 46 21 21 43 38 38 54 21 56 22 36 46 46 30 17 46 17
33 32 42 55 18 18 32 46 18 33

Tabla de Frecuencia datos no Agrupados


Frecuencia
Frecuencia Frecuencia
Edad Frecuencia Relativa
Acumulada Relativa
Acumulada
17 5 5 4,55% 4,55%
18 5 10 4,55% 9,09%
19 3 13 2,73% 11,82%
21 6 19 5,45% 17,27%
22 6 25 5,45% 22,73%
23 2 27 1,82% 24,55%
24 1 28 0,91% 25,45%
29 5 33 4,55% 30,00%
30 1 34 0,91% 30,91%
31 2 36 1,82% 32,73%
32 4 40 3,64% 36,36%
33 7 47 6,36% 42,73%
34 2 49 1,82% 44,55%
35 4 53 3,64% 48,18%
36 3 56 2,73% 50,91%

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
8
Informe Final

Frecuencia
Frecuencia Frecuencia
Edad Frecuencia Relativa
Acumulada Relativa
Acumulada
38 7 63 6,36% 57,27%
42 3 66 2,73% 60,00%
43 2 68 1,82% 61,82%
44 1 69 0,91% 62,73%
45 3 72 2,73% 65,45%
46 14 86 12,73% 78,18%
48 1 87 0,91% 79,09%
50 1 88 0,91% 80,00%
52 6 94 5,45% 85,45%
53 1 95 0,91% 86,36%
54 6 101 5,45% 91,82%
55 5 106 4,55% 96,36%
56 2 108 1,82% 98,18%
60 2 110 1,82% 100,00%
Total 110 100%
Medidas de Tendencia Central
Moda 46
Mediana 36
Media 36,97

Medidas de Posición
Cuartiles Edad Deciles Edad Percentiles Edad
Q1 25.25 D5 36 P30 29,7
Q2 36 D7 46 P50 36
Q3 46

Como se evidencia las personas de 46 años fueron las que en mayor número se
vieron involucradas en accidentes de tránsito, así mismo, vemos que los datos
tienden a agruparse alrededor de los 36 años; el promedio de edad de las personas
involucradas en accidentes es de los 36, casi 37 años, además el 50% de los

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
9
Informe Final

accidentes fueron ocasionados por personas menores a 36 años. De acuerdo a los


resultado podemos ver que los datos presentan una distribución sesgada hacia la
izquierda, donde 𝑥̅ < 𝑀𝑒 < 𝑀𝑜

Variable Continua: Grados de Alcohol


0,0 0,8 0,7 0,8 1,9 1,8 1,8 2,3 2,3 3,0
0,3 0,6 0,6 0,9 1,8 1,7 2,1 2,2 2,6 3,2
0,0 1,0 0,8 1,2 1,6 1,6 2,2 2,0 3,0 3,2
0,2 0,7 0,9 1,1 1,8 1,4 2,0 2,3 2,8 3,5
0,6 0,4 1,0 1.0 1,5 1,8 2,1 2,4 3,4 3,2
0,4 0,6 0,9 1,2 1,6 1,7 2,3 2,2 3,1 3,0
0,2 0,0 1,2 1,0 2,0 1,4 2,4 2,3 3,3 3,2
0,6 0,2 1,1 1,4 1,8 1,5 2,2 2,4 3,3 3,3
0,7 0,7 0,8 1,6 1,7 1,9 2,4 2,5 2,9 3,4
0,5 0,8 1,2 1,5 1,6 2,0 2,1 2,5 3,0 3,4
1,4 0,9 1,4 1,4 1,2 1,9 1,9 2,4 3,2 3,5
Tabla de Frecuencia datos no Agrupados
Puntos Medios
Frecuencia
Intervalos de Frecuencia Frecuencia Intervalos de
Frecuencia Relativa
clase (Grados de Acumulada Relativa Clase o Marca de
Acumulada
Alcohol) clase
1 (0,00 – 0,438] 9 9 8,18% 8,18% 0.22
2 (0,438 – 0,875] 15 24 13,64% 21,82% 0.66
3 (0,875 – 1,31] 15 39 13,64% 35,45% 1.09
4 (1,31 – 1,75] 17 56 15,45% 50,91% 1.53
5 (1,75 – 2,19] 17 73 15,45% 66,36% 1.97
6 (2,19 – 2,62] 17 90 15,45% 81,82% 2.41
7 (2,62 – 3,06] 6 96 5,45% 87,27% 2.84
8 (3,06 – 3,5] 14 110 12,73% 100,00% 3.28
Total 110 100%
Histograma de Frecuencias

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
10
Informe Final

Histograma de frecuencias absolutas Grados


de Alcohol
20 17 17 17
15 15
Frecuencia (Numero de personas)

14
15
9
10 6
5
0
(0,00 – (0,438 – (0,875 – (1,31 – (1,75 – (2,19 – (2,62 – (3,06 –
0,438] 0,875] 1,31] 1,75] 2,19] 2,62] 3,06] 3,5]
Grados de Alcohol

Polígono de Frecuencias

Poligono de frecuencias absolutas Grados de


Alcohol
20
17 17 17
Frecuencia (Numero de

15 15 14
10 9
6
personas)

0
(0,00 – (0,438 – (0,875 – (1,31 – (1,75 – (2,19 – (2,62 – (3,06 –
0,438] 0,875] 1,31] 1,75] 2,19] 2,62] 3,06] 3,5]
Grados de Alcohol

Medidas de Tendencia Central


Moda 1,4
Mediana 1,7
Media 1,74
Medidas de Posición
Grados de Grados de Grados de
Cuartiles Deciles Percentiles
Alcohol Alcohol Alcohol
Q1 0,925 D5 1,70 P25 0,925
Q2 1,7 D7 2,23 P50 1,7
Q3 2,375

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
11
Informe Final

Como se aprecia en los cálculos anteriores, las personas con 1,4 grados de alcohol
fueron las que mayoritariamente se vieron involucradas en accidentes de tránsito,
así mismo el promedio de 1,74 grados de alcohol en los accidentes ocurridos indican
una concentración de los datos entorno a los valores que se encuentran por encima
de 0,5 y por debajo de los 2,5 grados. De acuerdo a los resultado podemos ver que
los datos presentan una distribución sesgada hacia la derecha, donde 𝑀𝑜 < 𝑀𝑒 <
𝑥̅
2. Medidas Univariantes de Dispersión

Variable Discreta: Edad:


Rango 43
Varianza 158,8447107
Desviación Típica 12,60336109
Coeficiente de
Variación 34%
Como se puede apreciar el rango de edad del estudio presenta un alto nivel de
variación, dado entre otras cosas por las edades posibles, las cuales están entre los
17 y 6º años, dando como resultado 43 años de rango, lo cual se explica por la
misma normatividad que limita la edad de conducción. Este dato por sí solo no nos
da muchas luces sobre las causas de la accidentalidad. Sin embargo, podemos ver
No se ve un patrón claro.

Variable Continua: Grados de Alcohol


Rango 3,5
Varianza 0,8841
Desviación Típica 0,9402659
Coeficiente de
59%
Variación

Como se puede apreciar el rango de medición es bastante limitado, yendo de 0 a


3,5 grados, y encontrándose un patrón importante en el centro de los datos, aunque
el nivel de variación de los datos es alto, se puede apreciar, por medio del
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
12
Informe Final

histograma, una fuerte concentración entre los grados0,5 y 2,5; esto se explicaría
por la levedad de embriaguez que le da al conductor una mayor confianza a usar el
carro, que además se podría aventurar a decir, que al ser somero el nivel de trago
ingerido por el conductor, no hay presión social por no usar el carro, es decir si no
es evidente el estado de embriaguez raramente existirá presión de amigos o
familiares por dejar de conducir, cosa contraria a cuando esta es evidente. Esto
supone que es más peligrosa una persona con niveles medios de alcohol que una
totalmente ebria, dado que si lo está el grupo presionara por hacerlo desistir de
manejar y eso explica porque en niveles más altos no se encuentran involucrados.

Medidas Estadísticas Bivariantes

Regresión y Correlación lineal Simple.


La regresión hace alusión al cálculo del comportamiento de dos variables, cuando
se puede entender que existe un comportamiento dependiente o de relación entre
ellas, y se desea conocer cuál es el valor, peso o determinación de afectación de
una variable frente a otra. Esto se puede determinar también para más de una
variable, lo que se conoce como análisis de regresión múltiple. Para el caso de
regresión simple se busca determinar la relación entre solo dos variables, una (y)
independiente y una dependiente(x), lo cual da una solución lineal; que no implica
determinación per se, ya que en la realidad una variable no determina directamente
otra, por lo que se trata de un fenómeno probabilístico.
Uno de los métodos para realizar esta estimación es empleando el método de los
mínimos cuadrados, el cual permite encontrar la relación, o mejor línea que
simplifica el grupo de datos. Así mismo, es necesario el cálculo del grado de
correlación entre las variables, el cual se calcula con coeficiente de correlación
rectilíneo, r siendo este un valor entre -1 y 1. Este análisis se hace a partir de la
construcción del diagrama de dispersión, que representa la ubicación del par de datos,
x para los valores independientes y, y para los dependientes, conformando una nube
de puntos
 Identificar dos variables cuantitativas del problema que puedan estar
relacionadas.
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
13
Informe Final

Para el desarrollo del presente laboratorio las variables cuantitativas que se


analizaran son Grados de Alcohol del Conductor, como variable independiente
(x), y Número de muertos, como variable dependiente (y). Esto con el fin de revisar
lo que intuitivamente se sospecha, que si entre más borracho (mas alto el nivel o
grado de alcohol del conductor), se es más propenso a verse involucrado en un
accidente de tránsito con víctimas fatales, y determinar de esta manera como es la
relación.
 Realizar el diagrama de dispersión de dichas variables, determinar el
tipo de asociación.

Diagrama de dispersión de Grados de Alcohol de


Conductores y Numero de Muertos
14

12

10
Numero de Mertos

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Grados de Alcohol del Conductor

 Calcular la recta de regresión o encuentre el modelo matemático que


permite predecir el efecto de una variable sobre la otra, ¿es
confiable?

𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2

Total
190,3 531,0 1213,8 426,5 3601,0

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
14
Informe Final

𝑌̂ = 𝑎 + 𝑏𝑋
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 110 ∗ 1213,8 − (190,3 ∗ 531) 32468,70
𝑏= = = = 3,0351
𝑛 ∑ 𝑥 2 − (∑ 𝑋)2 (110 ∗ 426,47) − (190,3)2 10697,61
∑ 𝑌 − 𝑏 ∑ 𝑋 531 − (3,0351 ∗ 190,3) −46,5863
𝑎= = = = −0,4235
𝑛 110 110
𝑌̂ = 𝑎 + 𝑏𝑋 → 𝑌̂ = 3,0351𝑋 − 0,4235
Dónde:
𝑌̂: Variable dependiente (la que se va a predecir):
𝑎: Intercepto de la variable Y
𝑋: Variable independiente
𝑏: Pendiente de la recta
Para determinar la confiabilidad del modelo matemático o la recta de regresión se hará
uso del cálculo del Error estándar del estimado: el cual mide el grado de confiabilidad
de la ecuación de la recta estimada, indicando el grado de dispersión o variabilidad de
los datos observados alrededor de la línea de regresión:

∑ 𝒚𝟐 − 𝒂 ∑ 𝒚 − 𝒃 ∑ 𝒙𝒚
𝑆𝑒 = √
𝒏−𝟐

3601 + 0,4235(531) − 3,0351(1213,8)


=√
110 − 2

3825,8850 − 3684,0479 141,8371


=√ =√ = 1,14072
109 109

Del modelo matemático, que permite predecir el efecto de la variable grados de alcohol,
sobre el número de muertos, se puede concluir que es una estimación muy buena, pues
el Coeficiente de determinación es alto, cerca del 87%, lo que permite concluir que la
variación de los datos no es muy alta y se encuentra recogida dentro del modelo, la
información está determinada por la variabilidad de las estadísticas revisadas.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
15
Informe Final

Grados de Alcohol del Conductor -Curva de


regresión ajustada-
y = 3.0351x - 0.4235
14 R² = 1
NUMERO DE MUERTOS

12
GRADOS DE ALCOHOL DEL
10 CONDUCTOR
8
Pronóstico para Numero de
6 Muertos
4
Linear (Pronóstico para
2 Numero de Muertos)
0
-2 0.0 1.0 2.0 3.0 4.0
GRADOS DE ALCOHOL DEL CONDUCTOR

 Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Con el valor del error estándar del estimado, se procede a calcular el coeficiente
de determinación, que es la medida que permite estimar el porcentaje de la
información que es recogida o explicada por el modelo de regresión escogido; a
partir de medir la variación de la variable dependiente. Cuando el 𝑹𝟐 es cercano a 1,
se dice que el modelo de regresión lineal ajustado tiene un alto grado de
confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy bajo
y se recomienda no utilizar el modelo de regresión estimado
𝑺𝒆𝟐 1,14072
𝑹 = 𝟏 − ( 𝟐 ) = 𝑹𝟐 = 1 −
𝟐
= 0,8790
𝑺𝒚 9,4338
Primero toca calcular 𝑺𝟐𝒚 la varianza de la variable dependiente Y.

∑𝒚 3601
𝑺𝟐𝒚 = ( ̅𝟐 = 𝑺𝟐𝒚 = (
)−𝒚 ) − (4,8272)𝟐 = 9,4338
𝒏 𝟏𝟏𝟎
Generalmente, por cuestiones de interpretación, se usa con mayor frecuencia el
coeficiente de correlación lineal o coeficiente de Pearson, que es la raíz cuadrada
del coeficiente de determinación; esta toma valores que van desde +1 hasta el -1. e
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
16
Informe Final

indica el grado de asociación entre las variables, si es 0 indica que no existe relación
alguna y los valores extremos +1 y -1 indican una correlación perfecta positiva o
negativa respectivamente.

𝒓 = √𝑹𝟐 = 𝒓 = √0,8790 = 𝒓 = 𝟎, 𝟗𝟑𝟕𝟓


Como se puede apreciar la relación que existe entre las dos variables fuerte, de
cerca del 80% y existe una correlación lineal positiva entre las variables; por lo que
se puede decir que la relación entre el número de muertes por accidentes de tránsito
si se encuentra explicada por el grado de alcohol que tenga el conductor, pues es
cerca del 93%.

 Relacionar la información obtenida con el problema.

Como se pudo apreciar la relación entre las variables es alta, es además positiva lo
que quiere decir que la ocurrencia de una implica una afectación de la otra, y la
fuerza de explicación entre una y otra es alta, lo que indica que, si existe, con un
93% de probabilidad la ocurrencia de la otra. Saberlo implica mayor conciencia
sobre la responsabilidad que se tiene al conducir, pues si es evidente que se tiene
mayor probabilidad de verse involucrado en un accidente donde se presenten
muertos.
Regresión y Correlación Lineal Múltiple.

 Identificar una variable dependiente y dos o varias variables independientes


del estudio de investigación.

Para el desarrollo de este ejercicio tomare como variable dependiente Número de


Heridos y analizare como esta está determinada por el comportamiento de dos
variables independientes como lo son la velocidad y el grado de alcohol del
conductor.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
17
Informe Final

160
y = 16.488x + 44.684
140 R² = 0.7369
120
100
80
60
y = 1.1744x + 1.632
40 R² = 0.5109
20
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Velocidad Número de Heridos Linear (Velocidad) Linear (Número de Heridos)

 Realizar el diagrama de dispersión de dichas variables.

Como se puede apreciar cuando se calculan y grafican por separado, no en


regresion, da un coeficiente de correlacion mas bajo comparado cuando se ajusta
a la regresion y se hacen en un mismo plano.

Velocidad Curva de regresión


ajustada
10 y = 0.0586x - 0.6267
R² = 0.8851
Número de Heridos

8
Número de Heridos
6

4 Pronóstico Número de
Heridos
2
Linear (Pronóstico
0 Número de Heridos)
0 50 100 150 200
Velocidad

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
18
Informe Final

Grados de Alcohol del Conductor


Curva de regresión ajustada
8
7 y = 1.1744x + 1.632
R² = 0.9633
Número de Heridos

6
5 Número de Heridos
4
Pronóstico Número de
3
Heridos
2
Linear (Pronóstico
1 Número de Heridos)
0
0.0 1.0 2.0 3.0 4.0
Grados de Alcohol del Conductor

𝑋1 𝑋2 𝑌 𝑋1 𝑌 𝑋2 𝑌 𝑋1 𝑋2 𝑋1 2 𝑋2 2 𝑌2

Total 15535, 62543


190,3 8053 403 811,4 31606 426,5 1739
∑ 2 3

 Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

𝑌̂ = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2

∑ 𝑌 = 𝑛𝑎 + 𝑏1 ∑ 𝑋1 + 𝑏2 ∑ 𝑋2 → 403 = 110𝑎 + 190,3𝑏1 + 8053𝑏2

∑ 𝑋1 𝑌 = 𝑎 ∑ 𝑋1 + 𝑏1 ∑ 𝑋1 2 + 𝑏2 ∑ 𝑋1 𝑋2 → 811,4

= 190,3𝑎 + 426,5𝑏1 + 15535,2𝑏2

∑ 𝑋2 𝑌 = 𝑎 ∑ 𝑋2 + 𝑏1 ∑ 𝑋1 𝑋2 + 𝑏2 ∑ 𝑋2 2 → 31606

= 8053𝑎 + 15535,2𝑏1 + 625433𝑏2


Desarrollamos como un sistema de ecuaciones lineales y por el medio del método
de Gauss, es decir transformar en una matriz escalonada

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
19
Informe Final

110 190,3 8053 403


(190,3 426,5 15535,2| 811,4 ) 𝑓2 − 1,73(𝑓1)
8053 15535,2 625433 31606
110 190,3 8053 403 8053
→ 𝑓2 ( 0 97,281 1603,51| 114,21) 𝑓3 − 𝑓1
110
805315535,2 625433 31606
110 190,3 8053 403
0 97,281 1603,51 114,21 1603510
→ 𝑓3 ( |
3946821 231301 ) 𝑓3 − 𝑓2
97281
0 1603,51
110 110
110 190,3 8053 403
0 97,281 1603,51 114,21
→ 𝑓3 ( 10111381849| 2908810)
0 0
1070091 13211
110𝑎 190,3𝑏1 8053𝑏2 = 403
{ 0 97,281𝑏1 1603,51𝑏2 = 114,21 (1)
10111381849 2908810
0 0 𝑏2 =
1070091 13211

𝑎 = 0,59
𝑏1 = 0,79
𝑏2 = 0,023
𝑌̂ = 𝑎 + 𝑏𝑋 → 𝑌̂ = 0,79𝑋1 + 0,023𝑋2 + 0.59
Dónde:
𝑌̂: Variable dependiente (la que se va a predecir):
𝑎: Intercepto de la variable Y
𝑋1 , 𝑋2: Valores de las Variables independientes
𝑏1 , 𝑏2 : Pendientes asociadas con cada variable independiente en la recta

∑ 𝒀𝟐 − 𝒂 ∑ 𝒀 − 𝑏1 ∑ 𝑿𝟏 𝒀 − 𝑏2 ∑ 𝑿𝟐 𝒀
𝑆𝑒 = √ → 𝑆𝑒
𝒏−𝟑

𝟏𝟕𝟑𝟗 − (𝟎, 𝟓𝟗 ∗ 𝟒𝟎𝟑) − (𝟎, 𝟕𝟗 ∗ 𝟖𝟏𝟏, 𝟒) − (𝟎, 𝟎𝟐𝟑 ∗ 𝟑𝟏𝟔𝟎𝟔)


=√
𝟏𝟏𝟎 − 𝟑

𝟏𝟕𝟑𝟗 − 𝟐𝟑𝟕, 𝟕𝟕 − 𝟔𝟒𝟏. 𝟎𝟎𝟔 − 𝟕𝟐𝟔, 𝟗𝟑𝟖 𝟏𝟑𝟑, 𝟐𝟐𝟔


=√ =√ = 𝟏. 𝟏𝟏𝟎𝟔𝟔
𝟏𝟎𝟖 𝟏𝟎𝟖

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
20
Informe Final

̅𝟐
𝒂 ∑ 𝒀 + 𝑏1 ∑ 𝑿𝟏 𝒀 + 𝑏2 ∑ 𝑿𝟐 𝒀 − 𝒏𝒚
𝑹𝟐 =
∑ 𝒀𝟐 − 𝒏𝒚
̅𝟐
(0,59 ∗ 403) + (0,59 ∗ 403) + (0,79 ∗ 811,4) − (110 ∗ 13,422)

1739 − (110 ∗ 13,422)
237,77 + 641.006 + 726,938 − 1476,445 129,269
= = = 0,49235
1739 − 1476,445 262,554

𝒓 = √𝑹𝟐 = 𝒓 = √0,49235 = 𝒓 = 𝟎, 𝟕𝟎𝟏𝟔


 Relacionar la información obtenida con el problema.

Como se puede apreciar el modelo matemático hallado; explica, en combinación de


las dos variables, muy bien el comportamiento del número de heridos frente al
registro de velocidad y grados de alcohol del conductor, como se puede apreciar el
proceso de predicción es más asertivo al usar los dos datos. Esto es debido a que
los datos no varían mucho y se concentran permitiendo mejorar las predicciones de
los mismos. Se tiene que el modelo explica de manera muy baja la información
obtenida (𝑹𝟐 = 50%), sin embargo el coeficiente de correlación es alto, permitiendo
concluir que las variables si tienen alta relación, es decir el número de heridos si se
explica por las altas velocidades y el grado de alcohol de los conductores.
Propuesta Individual

Del diagrama estadístico de dispersión se desprende que existe una correlación


lineal directa entre el número de heridos y el grado de alcohol; esta información está
confirmada por el valor del coeficiente de determinación que nos indica que el
modelo de regresión nos explica cerca del 87% de los casos de accidentes
observados en el estudio, es decir el modelo es altamente confiable. Así mismo si
revisamos el polígono de frecuencias, la media de alcohol dentro de la muestra es
de 1,74 grados, donde hay que resaltar que cerca del 70 por ciento de las muestras
se concentran en un rango de alcohol de entre 0,5 y 2,7, razón por la cual hasta el
más leve nivel de alcohol representa un riesgo importante para el bienestar de los
peatones.
Otro dato que también es importante analizar es la edad de los conductores
involucrados en los accidentes, aunque la media y la moda estén muy cercanas,

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
21
Informe Final

vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los picos
o segmentos de edad de los conductores donde es mayor la probabilidad de verse
involucrado en un accidente de tránsito y estas edades son los 46 (con 14 casos),
los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17, 18 29 y
59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor control a
los conductores con este tipo de edades, pues su sola edad implica un aumento en
la probabilidad de verse involucrado en un accidente, quizá porque en estas edades
aumentan los consumos de alcohol.

A este análisis se debe sumar el que se hizo con respecto a la velocidad donde se
encontró un alto nivel de confiabilidad en el modelo de regresión que analiza la
relación entre heridos y velocidad, cerca del 88 de los accidentes se explican por
este concepto, donde según el modelo se encuentra que después de 28km/h se
corre el riesgo de cometer un accidente y que esto aumenta en la medida que
aumente de ahí en adelante la velocidad. Sin embargo al analizar en un mismo
sistema la velocidad y los grados de alcohol (análisis de regresión múltiple), vemos
que el nivel de confiabilidad del modelo, explicada por el coeficiente de
determinación, cae a solo el 49%, sin embargo el nivel de correlación es alto, pues
cerca es del 70%, lo que nos indica que existe una correlación lineal positiva entre
el número de heridos explicada por el grado de alcohol y la velocidad del carro.
Según la ecuación de la recta cada herido se explica en un 56% por el efecto
alcohol, un 42% por otro tipo de situaciones, esto es el error, y un 2% por el efecto
velocidad. Esto nos pone de relieve que el problema central es el grado de alcohol,
que se debe controlar en un segmento específico de la población y se debe hacer
énfasis en la medida de lo posible en la disminución de la velocidad.

Propuesta Individual: la propuesta individual deriva de mi perfil profesional; soy


estudiante de Ingeniería de Sistemas, y teniendo en cuenta la tecnología con la que

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
22
Informe Final

posiblemente contaremos en la próxima década, podría implementarse un tipo de


chip biológico, que estableciera un patrón general que regulase algunos
componentes fisicoquímicos del conductor, entre los cuales estaría la capacidad
sensorial y emocional, ya que pese a que el alcohol es uno de los altos indices de
riesgos de accidentalidad, la capacidad fisicoquímica hace la gran diferencia entre
el poder y el querer. De igual forma se pretendería entrar a un nivel futurista pero
posible, dando lugar a la llamada inteligencia artificial, que ha logrado posicionar al
ser humano como perfecto. Por otro lado se podrían implementar reductores de
velocidad instalados en los frenos de los automóviles, monitoreados satelitalmente
mediante ondas electromagnéticas, reduciendo el índice de altas velocidades, lo
que generaría una reducción de aproximadamente el 38,63%.

La propuesta individual y el perfil profesional, de acuerdo a la carrera que me


encuentro estudiando ingeniería de sistema, propongo de acuerdo a los dato que
se obtuvieron, para reducir la accidentalidad ya que los accidente fueron ocasionado
por los conductores quienes se encontraban en acto de alcohol, que los nuevos
vehículos traigan instalado un dispositivo que cuando el conductor, se suba al
vehículo tenga que soplar y si le sale grado de alcohol positivo el vehículo no le
encienda, para así reducir el acto riesgo de accidente, también las personas puedan
conducir de acuerdo a sus edades, de acuerdo a cada edad, tengan una velocidad
permitida, y que la velocidad no superen los 80 kHz. También una alternativa es que
en el promedio de la hora en que ocurrieron los accidente fuero aproximadamente
a las 11:10hrs, y cada vehículo tenga una distancia al otro de por lo menos 5 metros,
para así prevenir los herido y muerto ocasionado por lo accidente de tránsito, esto
se desprende de un análisis de regresión de los resultado de la tabla de velocidad,
grado de alcohol, numero de muerto y herido. Cuando analizamos estos
encontramos una correlación lineal positiva, ya que la mayor parte de los accidente
de tránsito fueron ocasionado por los conductores en acto grado de alcohol y por
velocidad, y una posible solución, es tener más controles sobre estos conductores,
que la pena sea pagada con cárcel, y sobre las vía, tener mucho más reductores de
velocidad, puesto control y velocímetro en las carretera, para así prevenir los

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
23
Informe Final

accidentes, tener cámara de seguridad en las carretera cada tres kilómetro de


distancia para poder observar cuando ocurra un accidente de tránsito.

Propuesta consolidada
Del diagrama estadístico de dispersión se desprende que existe una correlación
lineal directa entre el número de heridos y el grado de alcohol; esta información está
confirmada por el valor del coeficiente de determinación que nos indica que el
modelo de regresión nos explica cerca del 87% de los casos de accidentes
observados en el estudio, es decir el modelo es altamente confiable. Así mismo si
revisamos el polígono de frecuencias, la media de alcohol dentro de la muestra es
de 1,74 grados, donde hay que resaltar que cerca del 70 por ciento de las muestras
se concentran en un rango de alcohol de entre 0,5 y 2,7, razón por la cual hasta el
más leve nivel de alcohol representa un riesgo importante para el bienestar de los
peatones.
También una alternativa es que en el promedio de la hora en que ocurrieron los
accidente fuero aproximadamente a las 11:10hrs, y cada vehículo tenga una
distancia al otro de por lo menos 5 metros, para así prevenir los herido y muerto
ocasionado por lo accidente de tránsito, esto se desprende de un análisis de
regresión de los resultado de la tabla de velocidad, grado de alcohol, numero de
muerto y herido.
Otro dato que también es importante analizar es la edad de los conductores
involucrados en los accidentes, aunque la media y la moda estén muy cercanas,
vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los picos
o segmentos de edad de los conductores donde es mayor la probabilidad de verse
involucrado en un accidente de tránsito y estas edades son los 46 (con 14 casos),
los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17, 18 29 y
59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor control a
los conductores con este tipo de edades, pues su sola edad implica un aumento en
la probabilidad de verse involucrado en un accidente, quizá porque en estas edades

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
24
Informe Final

aumentan los consumos de alcohol. A este análisis se debe sumar el que se hizo
con respecto a la velocidad donde se encontró un alto nivel de confiabilidad en el
modelo de regresión que analiza la relación entre heridos y velocidad, cerca del 88
de los accidentes se explican por este concepto, donde según el modelo se
encuentra que después de 28km/h se corre el riesgo de cometer un accidente y que
esto aumenta en la medida que aumente de ahí en adelante la velocidad. Sin
embargo al analizar en un mismo sistema la velocidad y los grados de alcohol
(análisis de regresión múltiple), vemos que el nivel de confiabilidad del modelo,
explicada por el coeficiente de determinación, cae a solo el 49%, sin embargo el
nivel de correlación es alto, pues cerca es del 70%, lo que nos indica que existe una
correlación lineal positiva entre el número de heridos explicada por el grado de
alcohol y la velocidad del carro. Según la ecuación de la recta cada herido se explica
en un 56% por el efecto alcohol, un 42% por otro tipo de situaciones, esto es el
error, y un 2% por el efecto velocidad. Esto nos pone de relieve que el problema
central es el grado de alcohol, que se debe controlar en un segmento específico de
la población y se debe hacer énfasis en la medida de lo posible en la disminución
de la velocidad. Siendo un poco más atrevidos, podría pretenderse establecer un
patrón general que regulase algunos componentes fisicoquímicos del conductor,
entre los cuales estaría la capacidad sensorial y emocional, ya que pese a que el
alcohol es uno de los altos índices de riesgos de accidentalidad, la capacidad
fisicoquímica hace la gran diferencia entre el poder y el querer.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
25
Informe Final

Recomendaciones
Algunas recomendaciones para prevenir estos accidentes son:

 Reducir la velocidad en las esquinas, así sea que no se encuentre un pare.


 No seguir de cerca un vehículo que este en frente.
 Respetar las señales de tránsito.
 Usar en todo momento el cinturón de seguridad.
 No distraerse durante la conducción de un vehículo.
 Evitar conducir en la noche.
 No hablar por celular mientras se conduce un vehículo.
 No conducir un vehículo con cansancio o fatiga.
 Mantener el vehículo en buen estado y revisarlo ante de conducirlo.
 No manejar en acto grado de alcohol.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
26
Informe Final

Bibliografía

Holguín Quiñones, F. (1981). Estadística descriptiva aplicada a las ciencias sociales.


México: UNAM.
Gorostizaga, J. C. (n.d.). ESCUELA TÉCNICA SUPERIOR DE NÁUTICA Y MÁQUINAS
NAVALES. From ESTADÍSTICA DESCRIPTIVA:
http://www.ehu.eus/juancarlos.gorostizaga/apoyo/estadistica.htm
www.ditutor.com. (n.d.). www.ditutor.com. From Tipos de Variables:
http://www.ditutor.com/estadistica/variables_tipos.html
Velazco, C. (01 de 05 de 2013). Youtube.com. From Deciles para datos no agrupados:
https://www.youtube.com/watch?v=w8uSEV7M9L0
Velazco, C. (2014 de 04 de 2014). Youtube.com. From Cuartiles con su interpretación
para datos no agrupados: https://www.youtube.com/watch?v=LUSpXiyZ90c
Hernández, E. (11 de 10 de 2012). Youtube.com. From Tabla de Distribución de
Frecuencias: https://www.youtube.com/watch?v=3JRoegqw9v0
Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.
130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219.
Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.
México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r
&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9.
Holguín Quiñones, F. (1981). Estadística descriptiva aplicada a las ciencias
sociales. México: UNAM.
Ortegón Pava, Milton Fernando, (2010) Estadística Descriptiva, segunda versión
Universidad Nacional Abierta y a Distancia UNAD
Regresión lineal. (s.f.). En Wikipedia. Recuperado el 18 de noviembre de 2016 de
https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
27

S-ar putea să vă placă și