Sunteți pe pagina 1din 14

TRABAJO COLABORATIVO

ESTADÍSTICA INFERENCIAL SEMANAS 3, 4 Y 5

PRESENTADO POR:

CAMARGO RODRIGUEZ MARIA ALEJANDRA 1911981756

ORTEGA RAMIREZ DIEGO ALEJANDRO 1911983000

QUINTERO BUSTAMANTE KAREN JOHANA 1911981291

ZUÑIGA ANDAPIÑA HEIDY PAOLA 1910650218

INSTITUCIÓN UNIVERSITARIA POLITÉCNICO GRANCOLOMBIANO

FACULTAD DE INGENIERIA Y CIENCIAS BÁSICAS

ESTADÍSTICA INFERENCIAL

SUBGRUPO 18

2020
CONTENIDO

INTRODUCCIÓN............................................................................................................................. 3
OBJETIVOS. ..................................................................................................................................... 4
OBJETIVO GENERAL………………………………………………………………………… .... 4
OBJETIVOS ESPECÍFICOS .......................................................................................................... 4
DESCRIPCIÓN ................................................................................................................................. 5
DESARROLLO ................................................................................................................................. 6
CONCLUSIONES ........................................................................................................................... 13
ANEXOS .......................................................................................................................................... 14
INTRODUCCIÓN

La estadística inferencial es una materia que deriva de las matemáticas y la probabilidad que

sigue una variable aleatoria de una determinada población a través de una muestra obtenida

de la misma población para y dar resultados generales.

La inferencia es llegar a puntos objetivos, metas claras y cifras puntuales o bajo ciertos rangos

destinados a informar acerca de un comportamiento de una población mediante la extracción

de una muestra para posteriormente analizarla.


OBJETIVOS

OBJETIVO GENERAL

Comprender el procedimiento para construir intervalo de confianza para estimar la diferencia

de dos promedios poblacionales e interpretarlo.

OBJETIVOS ESPECÍFICOS

 Identificar variables constantes y parámetros, y las relaciones que pueden existir entre

ellos y su representación matemática.

 Desarrollar la estimación de parámetros y variables estadísticas mediante toma de

muestras
DESCRIPCIÓN

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las

transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el

comportamiento de compra del cliente frente a diferentes productos. Específicamente, el

problema que estamos tratando de predecir la variable dependiente (el monto de la compra)

con la ayuda de la información contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID Identificador único del comprador

Product_ID Identificador único del producto.

Gender Sexo del comprador

Age Edad del comprador dividida en contenedores

Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual.

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra categoría


Product_Category_3 El producto puede pertenecer a otra categoría

Purchase Valor de la compra en dólares

DESARROLLO

1. Realice un histograma y explique la forma y la curtosis según el contexto.

El histograma de frecuencia muestra una gran dispersión de los datos por lo que hay que

tener en cuenta las posibilidades que hacen que los datos varíen, aun así, se puede apreciar

la aproximadamente cual fue la marca de clase más relativa. Se determina que la curtosis

presenta gran variedad de los valores entorno a su media.


2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e

interprete los resultados.

Media 9333,85985

Mediana 8.062

Moda 6.855

Desviación estándar 4.981

Coeficiente de variación 0,53

 Media: Según la tabla de frecuencia se puede decir que el valor promedio de gasto

en el blackfriday es de $ 8.062

 Desviación estándar: los datos están dispersor aproximadamente en 4981.02 con

respecto a la mediana.

 Coeficiente de desviación: la dispersión de los datos esta alrededor de un 0,53% es

más representativa porque su coeficiente de variación es bajo.

3. En relación a la variable dada en la tabla anterior, responda y justifique los

resultados:

3.1.¿Cuál es la categoría de edades que más realiza compras en el black-friday?


La función CONTAR.SI donde especificaremos y seleccionaremos todos los valores de la

tabla, rango de celdas a contar; y especificar el criterio con el cual se va a contar, es decir el

rango de edad correspondiente, para que la función solo se limite a esos valores

En la tabla podemos observar que la categoría que más realiza compras y es la 26-35

EDADES FRECUENCIA

0-17 14707

18-25 97634

26-35 214690

36-45 107499

46-50 44526

51-55 37618

55+ 20903

3.2.¿Cuál es promedio de gatos de la categoría de la edad que más compra?

La edad que más produce gastos es de los 26-35 años con un promedio de 9,314,6 como se

muestra en la siguiente tabla

rango de edad promedio compra

26-35 9314,6
3.3.¿La proporción de hombres que compran es mayor que la de mujeres?

El rango (columna GENDER) y "M" es el criterio, es decir, se pide que cuente en los datos

de la columna GENDER únicamente el criterio M y arroje el valor, de igual forma se maneja

para sacar el valor de las mujeres usando el criterio “F”.

GENDER PURCHASE
M 405.380
F 132.196

De este modo podemos evidenciar que efectivamente la proporción de hombres que

compraron es mayor que la proporción de mujeres.

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

GENDER PROMEDIO DE GASTOS

M 9.504,8

F 8.809,8

4. Intervalos de confianza

4.1.Proponga una alternativa para determinar el tamaño de una muestra para la variable

compra (Purchase).

La fórmula para hallar el tamaño de muestra para Purchase con una población conocida.

donde cada variable significa:

N= Tamaño de la población
Z= Nivel de confianza

P= Probabilidad de éxito

Q= Probabilidad de fracaso

D= Precisión

En caso de no conocer el tamaño de la población podemos usar la siguiente formula que es

para una población infinita:

Donde

Z = nivel de confianza,

p = probabilidad de éxito, o proporción esperada

q = probabilidad de fracaso

d = precisión (error máximo admisible en términos de proporción)


4.2.Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para

la diferencia de los gastos para los hombres y mujeres e interprete el resultado

obtenido.

Para determinar el intervalo de confianza utilice la fórmula:

Lo cual significa que la media poblacional se encontraría en el intervalo dado por la siguiente

fórmula:

Y teniendo en cuenta los gastos de los hombres y las mujeres se calcularía el valor de

estimación para determinar el intervalo de confianza:

 Gastos de los hombres: 3.853.044.357

 Gastos de las mujeres: 1.164.624.021

 Diferencia entre los gastos de los hombres y las mujeres: 2.688.420.336

Reemplazando los valores en la fórmula anterior:

Por lo tanto, con 95% de confianza, la diferencia entre los gastos de los hombres y las mujeres

se encontraría en el intervalo
Utilizando la fórmula de Excel para la estimación del intervalo de confianza se puede

comprobar la similitud de los resultados:

INTERVALO.CONFIANZA.NORM(alfa;desv_estandar;tamaño)

Donde

 Alfa es el nivel de confianza: 0,05

 Desv_estandar es la desviación estándar de la población: 4981,022

 Tamaño se refiere al tamaño de la muestra: 537578

La fórmula de Excel quedaría:

INTERVALO.CONFIANZA.NORM(0.05;49841,022;537578)

Y el intervalo de confianza estaría dado por:


CONCLUSIONES

Gracias al desarrollo de este trabajo colaborativo en las semanas 3, 4 y 5, se logro adquirir

conocimientos en temas importantes como lo son Intervalos de confianza en una variable

mediante la aplicación de las formulas otorgadas por el material de apoyo; también se puso

en práctica la elaboración de diagramas y tablas para el desarrollo del mismo y se indago en

el trabajo en equipo para la búsqueda de los procedimientos y las respuestas acertadas.

De igual forma se investigaron formulas y procedimientos los cuales nos ayudan a dar

solución a problemas en nuestra vida y en el ambiente de las estadísticas lo cual será de

gran ayuda para nuestra formación como profesionales.


ANEXOS

ANEXO 1. Archivo Excel con cálculos relacionados llamado DESARROLLO TRABAJO

COLABORATIVO GRUPO 18

S-ar putea să vă placă și