Sunteți pe pagina 1din 12

Informe Estadística Inferencial Kuiper

Realizado Por:

Deivy Johan Gonzalez Arevalo

Hugo Garzon

Presentado a: Efrain Moreno Sarmiento

Politécnico Grancolobiano

31 de agosto de 2018
Introducción

En este documento se estudia las diferentes características que se toman en


cuenta a la hora de evaluar el precio de un auto tales como kilometraje, marca,
modelo, tamaño del motor, estilo interior y control de crucero. El diferente tipo de
variables a considerar según un estudio realizado por Kelly Blue Book para más
de ochocientos mil autos elaborados por la General Motors en el año 2005.

Con base a lo evaluado se consideraran las variables para determinar por


ejemplo que le pasa al auto y a su precio mientras mas kilometros recorre, de
acuerdo a esto nacen algunas preguntas, se emplearan herramientas de
medicion como la regresion simple y multiple en donde podremos determinar que
pasa con el precio, que pasa si dos vehiculos tienen el mismo precio pero su
kilometraje es diferente.

Objetivo

Lograr identificar las variables e identificar que tipo de variable se va a utilizar


para cada escenario, en este caso se identifica que la variable a trabajar sera la
cuantitativa continua, dentro del objetivo tambien se buscara lograr valorar la
unidad de medida dentro de cada caso, nombres de las variables en el caso, el
tipo de poblacion que se manejara en el escenario estipulado, escala de medida
entre otros resultados de igual importancia.

Metodología

Las siguientes son las variables que consideramos importantes al momento de


responder la interrogante impuesta la cual es ¿Cuánto es el valor de su auto?

Para ello tomamos en cuenta una cantidad de datos proporcionados por unas
tablas provistas por Kelly Blue Book en el año 2005 para una muestra de más de
ochocientos mil autos elaborados por la General Motors tales como :
Análisis descriptivo

 Precio: Es el valor minorista sugerido por General Motors, también es el


nombre de la variable a evaluar

Precio

Media 21343.1438
Error típico 348.611879
Mediana 18024.995
Moda 10921.9454
Desviación estándar 9884.8528
Varianza de la muestra 97710314.9
Curtosis 3.29114862
Coeficiente de asimetría 1.57579474
Rango 62116.5358
Mínimo 8638.9309
Máximo 70755.4667
Suma 17159887.6
Cuenta 804

Nota: Para corregir se debe tener en cuenta la descripción vista en clase


y aplicarla, no es necesario validar la fórmula que se está dando para
encontrar la media o por ejemplo la desviación estándar, para la
descripción es importante dar la unidad de medida para la variable
ejemplo: el precio de un auto esta dado por la unidad de medida numérica
21343.1438 según la base de datos.

 Media: en el precio de los vehiculos identificamos que la media esta


en promedio de 21343.1438 tomando todos los datos (precio)
sumándolos y dividiéndolos por la misma cantidad de datos.
 Error típico: el error típico dentro de la muestra está dada por
348.611879 se calcula dividiendo la desviación estándar por la raíz
cuadrada de la muestra. (error tipico es igual a la desviación
estándar).
 Mediana: la media de la muestra entre los 804 datos esta en
18024.995 según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 10921.9454 en 2 veces.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de precio es 9884.8528
 Varianza de la muestra: la variancia de la muestra esta dada por
97710314.9
 Curtosis: la curtosis es de 3.29114862 lo que quiere decir que esta
por encima es leptocurtica. Cuando esta por debajo es platicurtica
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
1.57579474
 Rango: el rango entre el valor máximo y el valor mínimo esta dado
por 62116.5358
 Minimo: valor o precio minimo dentro de la base de datos de un
vehiculo 8638.93.09
 Maximo: valor o precio maximo dentro de la base de datos de un
vehiculo 70755.4667
 Suma: suma todos los 804 datos de la base de datos en la variable
de precio para un total de 17159887.6
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Kilometraje: Cantidad de millas que el auto ha sido conducido

Kilometraje

Media 19831.9341
Error típico 289.061909
Mediana 20913.5
Moda 18910
Desviación estándar 8196.31971
Varianza de la muestra 67179656.7
Curtosis 0.1839093
Coeficiente de asimetría -0.1312466
Rango 50121
Mínimo 266
Máximo 50387
Suma 15944875
Cuenta 804

 Media: la cantidad de millas que el promedio cada vehiculo esta


recorriendo es de 19831.9341 unidad numerica.
 Error típico: el error típico dentro de la muestra está dada por
289.061909 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en
20913.5 según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de18910 para un total de 3.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de kilometros es 8196.31971
 Varianza de la muestra: la variancia de la muestra esta dada por
67179656.7
 Curtosis: la curtosis es de 0.1839093 lo que quiere decir que esta
por encima es leptocurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
-0.1312466
 Rango: el rango entre el valor máximo y el valor mínimo esta dado
por 50121
 Minimo: el kilometraje minimo dentro de la base de datos de un
vehiculo 266
 Maximo: el kilometraje maximo dentro de la base de datos de un
vehiculo 50387
 Suma: suma todos los 804 datos de la base de datos en la variable
de kilometros para un total de 15944875
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Cilindro: cantidad de cilindros en el motor

Cilindraje

Media 5.26865672
Error típico 0.04893445
Mediana 6
Moda 4
Desviación estándar 1.38753127
Varianza de la muestra 1.92524303
-
Curtosis 0.75180984
Coeficiente de asimetría 0.63297427
Rango 4
Mínimo 4
Máximo 8
Suma 4236
Cuenta 804

 Media: la cantidad de cilindros en el motors esta dado por


5.26865672 unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.04893445 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 6
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 4 para un total de 394 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 1.38753127
 Varianza de la muestra: la variancia de la muestra esta dada por
1.92524303
 Curtosis: la curtosis es de -0.75180984 lo que quiere decir que esta
por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
0.63297427
 Rango: el rango entre el valor máximo y el valor mínimo esta dado
por 4
 Minimo: el cilindraje minimo dentro de la base de datos de un
vehiculo 4
 Maximo: el cilindraje dentro de la base de datos de un vehiculo 8
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de cilindraje para un total de 4236
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Litros:

litros

Media 3.03731343
Error típico 0.03899016
Mediana 2.8
Moda 2.2
Desviación estándar 1.10556196
Varianza de la muestra 1.22226724
-
Curtosis 0.09749853
Coeficiente de asimetría 0.71792252
Rango 4.4
Mínimo 1.6
Máximo 6
Suma 2442
Cuenta 804

 Media: la cantidad de litros en el motor esta dado por 3.03731343


unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.03899016 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 2.8
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 2.2 para un total de 190 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 1.10556196
 Varianza de la muestra: la variancia de la muestra esta dada por
1.22226724
 Curtosis: la curtosis es de -0.09749853 lo que quiere decir que esta
por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
0.71792252
 Rango: el rango entre el valor máximo y el valor mínimo esta dado
por 4.4
 Minimo: los litros minimos dentro de la base de datos de un
vehiculo 1.6
 Maximo: los litros dentro de la base de datos de un vehiculo 6
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de litros para un total de 2442
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Puertas:

puertas

Media 3.52736318
Error típico 0.02998314
Mediana 4
Moda 4
Desviación estándar 0.85016884
Varianza de la muestra 0.72278706
-
Curtosis 0.45434198
Coeficiente de asimetría -1.2437019
Rango 2
Mínimo 2
Máximo 4
Suma 2836
Cuenta 804
 Media: la cantidad de litros en el motor esta dado por 3.52736318
unidad numerica
 Error típico: el error típico dentro de la muestra está dada por
0.02998314 debemos tener encuenta la desviacion estandar ya
que dicha variable hace parte del error tipico
 Mediana: la media de la muestra entre los 804 datos esta en 4
según la muestra de menor a mayor.
 Moda: en la moda identificamos que el valor que mas veces se
repite es de 4 para un total de 644 según la muestra de 804.
 Desviacion estandar: la desviacion estandar la podemos
determinar sacando la raiz cuadrada de la varianza muestral para
nuestra variable de cilindraje es 0.85016884
 Varianza de la muestra: la variancia de la muestra esta dada por
0.72278706
 Curtosis: la curtosis es de -0.45434198 lo que quiere decir que esta
por debajo es platicurtica.
 Coeficiente de asimetría: el coeficiente de asimetría esta dado por
-1.2437019
 Rango: el rango entre el valor máximo y el valor mínimo esta dado
por 2
 Minimo: las puertas minimas dentro de la base de datos de un
vehiculo 2
 Maximo: las puertas maximas dentro de la base de datos de un
vehiculo 4
 Suma: la suma de todos los 804 datos de la base de datos en la
variable de litros para un total de 2836
 Cuenta: nos proporciona el numero exacto dentro de la base de
datos a manejar con el precio para este caso 804

 Crucero:

crucero

Media 0.75248756
Error típico 0.01522967
Mediana 1
Moda 1
Desviación estándar 0.43183559
Varianza de la muestra 0.18648197
-
Curtosis 0.62731438
-
Coeficiente de asimetría 1.17228508
Rango 1
Mínimo 0
Máximo 1
Suma 605
Cuenta 804

 Sonido:

sonido

Media 0.67910448
Error típico 0.01647375
Mediana 1
Moda 1
Desviación estándar 0.4671113
Varianza de la muestra 0.21819297
-
Curtosis 1.41250902
-
Coeficiente de asimetría 0.76877233
Rango 1
Mínimo 0
Máximo 1
Suma 546
Cuenta 804

 Cuero: variable indicadora que representa si el auto tiene asientos de


cuero

cuero

Media 0.7238806
Error típico 0.01577699
Mediana 1
Moda 1
Desviación estándar 0.44735488
Varianza de la muestra 0.20012639
-
Curtosis 0.99566282
-
Coeficiente de asimetría 1.00340428
Rango 1
Mínimo 0
Máximo 1
Suma 582
Cuenta 804

 Muestra : En una muestra representativa de más de ochocientos mil autos


se toma los datos de 804 automóviles
 Consecutivo: lo determinamos según el orden de las variables por la base
de datos.
 Unidad Temporal: El tiempo en el cual se evalúan las variables son los
autos realizados por la General Motors en el año 2005
 Tipo de variable: Ya que la variable a evaluar es el precio de un auto y
esta es una variable que adopta un valor numérico se considera
cuantitativa y ya que son precios que cambian constantemente que no
tienen una cantidad de dinero definida se consideran continuas
 Escala de medición : La variable a medir cambia constantemente de valor
dependiendo el tipo de auto que sea y que cuente con un tipo de
características específicas ,eso hace que su precio sea mayor o menor ,
como el precio se maneja en ese tipo de escala se considera a la variable
de intervalo
 Unidad de medida : Numérica
 Población : General Motors
 Unidad estadistica: periodo de tiempo en el cual se generaran cambios en
las variables ej: cambio de precio entre 2003 y 2005
 Marca: Fabricante del automóvil que en este caso serian Saturno , Pontiac
, Chevrolet ,SAAB, Buick y Cadillac
 Modelo : Modelos específicos para cada fabricante . Para el Buick (
Lacrosse , Century , Lesabre , Park Avenue ) , para el Cadillac ( CST-V ,
CTS , Deville , STS-V6 , STS V8 ,XLR-V8) , para el Chevrolet ( Aveo ,
Cavalier , Classic , Cobalt , Corvette , Impala , Malibu , Monte Carlo ) ,
para el Pontiac ( Boneville , Gran am , Gran Prix , G6 , GTO , Sunfire ,
Vibe ) , para el SAAB ( 9_3 HO ,9_5 , 9_3 , 9_5 HO , 9-2x AWD ) y para
el Saturn ( ION , L series )
 Recorte (del automóvil): tipo específico de modelo de automóvil, como
SE Sedan 4D, Quad Coupe 2D

 Tipo: tipo de cuerpo como sedán, coupé, etc.

 Cilindro: cantidad de cilindros en el motor

 Litros

 Puertas

 Crucero

 Sonido
 Cuero: variable indicadora que representa si el auto tiene asientos de
cuero

Dentro de la metodologia se solicitara la especificacion de las variables y como


se pueden complementar entre si para arrojar los resultados deceados por medio
de la regresion ya sea simple o multiple EJ:

x (axisas) y (ordenadas)
independiente dependiente
millas
recorridas precio minorista

Kilometraje Precio
8221 € 17,314
9135 € 17,542
13196 € 16,219
16342 € 16,337
19832 € 16,339
22236 € 15,709
22576 € 15,230
22964 € 15,048
24021 € 14,862
27325 € 15,295
30000 -€ 72,379

y = -6.4926x + 122,399.0526
Kilometrage vs precio R² = 0.8454
30000

25000
Kilometraje vehiculos

20000

15000

10000

5000

0
€ 14,500 € 15,000 € 15,500 € 16,000 € 16,500 € 17,000 € 17,500 € 18,000

Precio coches

Resultados
Con base a las variables anteriormente explicadas se desarrollara el proyecto de
aula el cual buscara adquirir el conocimiento necesario para resolver problemas
cotidianos como el que se estudiara en este caso Kuiper, con una muestra de
804 vehiculos los cuales tienen diferentes caractiristicas y recorrido, lo cual va a
permitir utilizar las regresiones simple y multiple obteniendo datos coherentes y
acertivos para contestar las preguntas que nascan.

Kilometrage vs precio
€ 18,000

€ 17,500

€ 17,000

€ 16,500

€ 16,000

€ 15,500

€ 15,000

€ 14,500
0 5000 10000 15000 20000 25000 30000

En la anterior imagen se utiliza la regresion simple para determinar que pasa


con el precio del vehiculo cuando el recorrido del vehiculo aumenta dicho
resultado es lo que se espera al finalizar el proyecto sin embargo se acalara
que esta imagen es solo un ejemplo ya que no cuenta con los datos en general
de lo que se necesita para responder cuanto varia el precio de un vehiculo con
respecto a su recorrido.

S-ar putea să vă placă și