Sunteți pe pagina 1din 13

ESTADISTICA DESCRIPTIVA

GRUPO 100105_122

FASE INTERMEDIA TRABAJO COLABORATIVO 3

DIEGO ALEXANDER SASTRE. CODIGO:


GUILLERMO EMIRO CRUZ. CDIGO: 93.394.240

TUTOR
ING. FRANCISCO CABRERA DAZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA
CEAD JAG
NOVIEMBRE 26, 2016
Introduccin
En la estadstica descriptiva, el punto fundamental es el anlisis de datos para lograr
encontrar el resultado a un fenmeno determinado. Es importante para realizar dichos
anlisis la interpretacin de una o dos variables que determinen el fenmeno que se
presenta. En el presente trabajo, se realizara el anlisis de dos variables con el fin de
determinar si existe una relacin entre las dos, esto se denomina regresin, correlacin
lineal y correlacin lineal mltiple.

Objetivos.

Establecer la relacin entre dos variable, una independiente y otra dependiente.


Determinar el procedimiento mediante el cual se pueda relacin dos variables.
Graficar la relacin de dos variables.
Interpretar por medio grafico la tendencia de la relacin de dos variables.

1. Identificar dos variables cuantitativas de la situacin estudiada que puedan


estar relacionadas.
Tomaremos entonces dos variables de la base de datos: Grados de alcohol y
nmero de muertos. Para tomar dichas variables, podemos apreciar el aumento
que cada una presenta con el nmero de observacin. Es decir, un conductor
con menos grados de alcohol ser responsable de menos muertes en accidentes
de trnsito. Tambin se aprecia cmo dicha relacin se mantiene al aumentar los
grados de alcohol en el conductor.

2. Realizar el diagrama de dispersin de dichas variables y determinar el tipo


de asociacin entre las variables.

Grados de Alcohol del conductor(x) VS Nmero de Muerto


14

12

10
f(x) = 3.04x - 0.42
8 R = 0.86

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

La grfica de dispersin de las variables muestra una tendencia muy evidente.


Esta tendencia, puede ser entendida como una relacin lineal positiva.

3. Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. Es confiable?

Siendo la lnea de tendencia de la forma de la forma y=mx +b , podemos

calcular los coeficientes de dicha ecuacin de la siguiente forma:


GRADOS DE ALCOHOL DEL NUMERO DE
XY X2 Y2
CONDUCTOR (X ) MUERTOS (Y )
0,0 1 0 0 1
0,3 1 0,3 0,09 1
0,0 1 0 0 1
0,2 1 0,2 0,04 1
0,6 1 0,6 0,36 1
0,4 2 0,8 0,16 4
0,2 1 0,2 0,04 1
0,6 2 1,2 0,36 4
0,7 2 1,4 0,49 4
0,5 2 1 0,25 4
1,4 2 2,8 1,96 4
0,8 2 1,6 0,64 4
0,6 2 1,2 0,36 4
1,0 1 1 1 1
0,7 2 1,4 0,49 4
0,4 2 0,8 0,16 4
0,6 2 1,2 0,36 4
0,0 2 0 0 4
0,2 2 0,4 0,04 4
0,7 2 1,4 0,49 4
0,8 2 1,6 0,64 4
0,9 2 1,8 0,81 4
0,7 2 1,4 0,49 4
0,6 2 1,2 0,36 4
0,8 2 1,6 0,64 4
0,9 2 1,8 0,81 4
1,0 2 2 1 4
0,9 2 1,8 0,81 4
1,2 2 2,4 1,44 4
1,1 2 2,2 1,21 4
0,8 2 1,6 0,64 4
1,2 3 3,6 1,44 9
1,4 3 4,2 1,96 9
0,8 3 2,4 0,64 9
0,9 3 2,7 0,81 9
1,2 3 3,6 1,44 9
1,1 3 3,3 1,21 9
1,0 3 3 1 9
1,2 3 3,6 1,44 9
1,0 3 3 1 9
1,4 3 4,2 1,96 9
1,6 3 4,8 2,56 9
1,5 3 4,5 2,25 9
1,4 3 4,2 1,96 9
1,9 3 5,7 3,61 9
1,8 3 5,4 3,24 9
1,6 3 4,8 2,56 9
1,8 3 5,4 3,24 9
1,5 3 4,5 2,25 9
1,6 3 4,8 2,56 9
2,0 3 6 4 9
1,8 3 5,4 3,24 9
1,7 3 5,1 2,89 9
1,6 4 6,4 2,56 16
1,2 4 4,8 1,44 16
1,8 4 7,2 3,24 16
1,7 4 6,8 2,89 16
1,6 4 6,4 2,56 16
1,4 4 5,6 1,96 16
1,8 4 7,2 3,24 16
1,7 4 6,8 2,89 16
1,4 4 5,6 1,96 16
1,5 4 6 2,25 16
1,9 5 9,5 3,61 25
2,0 5 10 4 25
1,9 5 9,5 3,61 25
1,8 5 9 3,24 25
2,1 5 10,5 4,41 25
2,2 5 11 4,84 25
2,0 5 10 4 25
2,1 5 10,5 4,41 25
2,3 5 11,5 5,29 25
2,4 6 14,4 5,76 36
2,2 6 13,2 4,84 36
2,4 6 14,4 5,76 36
2,1 6 12,6 4,41 36
1,9 7 13,3 3,61 49
2,3 7 16,1 5,29 49
2,2 7 15,4 4,84 49
2,0 7 14 4 49
2,3 7 16,1 5,29 49
2,4 7 16,8 5,76 49
2,2 7 15,4 4,84 49
2,3 7 16,1 5,29 49
2,4 7 16,8 5,76 49
2,5 7 17,5 6,25 49
2,5 8 20 6,25 64
2,4 8 19,2 5,76 64
2,3 8 18,4 5,29 64
2,6 8 20,8 6,76 64
3,0 9 27 9 81
2,8 9 25,2 7,84 81
3,4 8 27,2 11,56 64
3,1 8 24,8 9,61 64
3,3 8 26,4 10,89 64
3,3 8 26,4 10,89 64
2,9 10 29 8,41 100
3,0 9 27 9 81
3,2 9 28,8 10,24 81
3,0 9 27 9 81
3,2 10 32 10,24 100
3,2 9 28,8 10,24 81
3,5 11 38,5 12,25 121
3,2 11 35,2 10,24 121
3,0 11 33 9 121
3,2 12 38,4 10,24 144
3,3 12 39,6 10,89 144
3,4 12 40,8 11,56 144
3,4 12 40,8 11,56 144
3,5 12 42 12,25 144
190,3 531,0 1213,8 426,5 3601,0

Para y =mx+b

Donde mes la pendiente

Donde b es la ordenada
Para calular m :

n
n xi y i x i y i
i=1
m=
n x 2( x i)

( 1101213,8 )(190,3531)
m=
( 110426,5 )(190,3)2

( 133518,0 )( 101049,3 )
m=
( 46911,7 )( 36214,09 )

32468,7
m=
10697,61

m=3,035135885

Para calcular b :

x i y i x i x iy i
n x i ( xi )
b=

( 426,5531 ) ( 190,31213,8 )
b=
( 110426,5 )( 190,3 )2

( 226455,6 )( 230986,14 )
b=
( 46911,7 )( 36214,09 )
4530,6
b=
10697,61

b=0,423512355

Eso concluye, que la ecuacin matemtica que representa el comportamiento de la


variable Nmero de muertos, en funcin de la variable Grados de alcohol del
conductor es:

y ( x )=3,035135885 x0,423512355

4. Determine el porcentaje de explicacin del modelo y el grado de relacin de


las dos variables

Ahora se deben hallar las medias aritmticas.

190,3
X= =1,73
110

531
Y= =4,827272727
110

Ahora se calcula la covarianza.


1213,8
xy = ( 1,734,827272727 )=2,683363636
110

Las deviaciones tpicas:


x=
426,5
110
2
( 1,73 ) =0,9404109353

y=
3601
110
2
( 4,827272727 ) =3,071449438

Ahora se aplica la frmula del coeficiente de correlacin lineal.

2,683363636
r= =0,929149215
0,94041093533,071449438

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Como es un valor

muy prximo a 1 se puede concluir que la relacin es muy fuerte. Eso significa que la

variable X, si explica a la variable Y en un alto porcentaje.

Es decir, si una persona tiene 1 grado de alcohol en la sangre, es muy probable que
haya sido responsable de:

y ( x )=3,035135885(1)0,423512355

y (1 ) =3,0351358850,423512355

y (1 ) =2,61162353 muertos .

5. De las siguientes variables determina quien depende de la otra:

Grados de alcohol del conductor.

Edad.

Velocidad.
Nmero De Heridos.

Nmero De Muertos.

Hora.

Costo estimado del siniestro.

Para determinar si una variable explica a la otra, haremos una matriz con el valor
de correlacin entre cada pareja de variables. Los valores que estn ms cerca a

una correlacin negativa (1) , tendr un color ms rojizo, mientras que

aquellos que tengan un valor ms cercano a una correlacin positiva (1)

tendrn un valor verde. La matriz resultante se puede consultar a continuacin:

Nmero
Grados Nmero de Costo
de Velocid de Muerto Siniestr
Alcohol Edad ad heridos s Hora o
Grados de
-- -0,02 0,86 0,71 0,93 -0,05 -0,15
Alcohol
Edad -0,02 -- 0,01 -0,12 0,00 0,15 -0,04
Velocidad 0,86 0,01 -- 0,69 0,89 0,01 -0,10
Nmero de
0,71 -0,12 0,69 -- 0,69 -0,15 -0,04
heridos
Nmero de
0,93 0,00 0,89 0,69 -- 0,00 -0,14
Muertos
Hora -0,05 0,15 0,01 -0,15 0,00 -- -0,06
Costo
-0,15 -0,04 -0,10 -0,04 -0,14 -0,06 --
Siniestro

De la tabla anterior, podemos concluir las siguientes dependencias entre variables:

La velocidad de un accidente de trnsito se puede decir que depende de los


grados de alcohol del conductor. Tienen las variables una correlacin positiva,
es decir, si aumenta una, aumenta la otra.
El nmero de heridos de un accidente de trnsito depende de los grados de
alcohol en la sangre del conductor. Tienen las variables una correlacin
positiva, es decir, si aumenta una, aumenta la otra.
El nmero de muertos de un accidente de trnsito depende de los grados de
alcohol del conductor. Tienen las variables una correlacin positiva, es decir,
si aumenta una, aumenta la otra.
El nmero de heridos en un accidente de trnsito depende de la velocidad del
accidente. Tienen las variables una correlacin positiva, es decir, si aumenta
una, aumenta la otra.
El nmero de muertos de un accidente de trnsito depende de la velocidad
del accidente. Tienen las variables una correlacin positiva, es decir, si
aumenta una, aumenta la otra.

Las parejas de variables que tienen un color ms cercano al amarillo indican un valor de
correlacin ms cercano a 0. Esto significa que la correlacin es dbil, indicando
prcticamente una inexistente relacin de dependencia entre las variables del caso.
Laboratorio de regresin y correlacin lineal

Una empresa de mensajera de entrega puerta a puerta, con el fin de mejorar la


prestacin del servicio desea establecer la relacin que puede existir entre el tiempo
empleado y la distancia recorrida para la entrega de un determinado producto.

Distancia Tiempo
Km (x) entrega (y)
825 3.5
215 1.0
1070 4.0
550 2.0
480 1.0
920 3.0
1350 4.5
325 1.5
670 3.0
1215 5.0

1. Realizar un diagrama de dispersin a partir de los datos.


2. Determinar la mejor ecuacin que se ajusta a los datos.

Diagrama de dispersin
Diagrama de dispersion
6.0

4.0 f(x) = 0x + 0.12


R = 0.9
Tiempo de entrega
2.0

0.0
0 200 400 600 800 1000 1200 1400 1600
Distancia en Km

S-ar putea să vă placă și