Sunteți pe pagina 1din 4

Nombre: Cesar Augusto Chuquihuamaní collantes

1.- estudio descriptivo e inferencial entre los clientes(tarjeta de crédito); variables de interés:

VARIABLE CUALITATIVA
Genero Masculino
Femenino
NOMINAL Vivienda
Principal uso de crédito Autos
Otros
ORDINAL Categoría del cliente A1
A2

VARIABLE CUANTITATIVA
Cobro del mes de mayo por cajero el día del cierre Número de retiros
Monto de crédito adeudado en Enero del 2009 Miles de Soles

RAZON Monto de crédito adeudado en Mayo del 2009 Miles de Soles


Pagos en establecimientos comerciales el día del cierre de cobro Numero de pagos
del mes de mayo
Edad del clientes Edades en años
Ingreso mensual del cliente Ingreso en soles
Número de hijos de los clientes Número de hijos

2.- si para una distribución rectangular de temperaturas:

𝑎 √3
𝑆= = 0.25 ⇒ 𝑎 =
2. √3 2

1 2√3
=
𝑎 3

Sabemos:

𝑇 = 𝐼 + 𝐶𝑜𝑟𝑟𝑒𝑐𝑐𝑖𝑜𝑛𝑐𝑒𝑟𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑜

Entonces como no considero la correcion del valor más representativo(media) de los datos:

1 2√3
𝐼= = , 𝐶𝑜𝑟𝑟𝑒𝑐𝑐𝑖𝑜𝑛 = 0
𝑎 3

Considerando la corrección:
2√3
𝑇 = 𝐼 + 𝐶𝑜𝑟𝑟𝑒𝑐𝑐𝑖𝑜𝑛𝑐𝑒𝑟𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑜 = + 0.07 = 1.224700538
3

Determinando su varianza correcta:

𝑎 1⁄1.224700538
𝑆= = = 0.23571079 ≅ 0.24
2. √3 2. √3

3.- la afirmación que no presenta un uso adecuado del análisis exploratorio de datos es:

a) debido que nos ayuda a ver si los datos presenta alguna distribución conocida.

4.- analizar si los datos sigue una distribución normal, plantear hipótesis, usar prueba de
Anderson-Darling : que distribución sigue, conclusión.

Hipótesis:

Ho: los datos de humedad tiene una distribución normal

H1: los datos de humedad No tiene una distribución normal

#Prueba Anderson-Darling:distribucion normal

> humedad <- read.table(file.choose(), header=T)

> qqPlot(humedad[,1],dist="norm",main="Normalidad para humedad

> ad.test(humedad[,1])

Anderson-Darling normality test

data: humedad[, 1]

A = 0.81295, p-value = 0.03136


Como p-valor < 0.05, entonces se rechaza Ho (los datos no tienen una distribución normal)

5.- Se recomienda utilizar el termómetro de marca 3; debido que su media de los datos coincide
con la del punto crioscopico (0°C), y su dispersión de sus valores es mas pequeño.

El de la marca 1 se aleja un poco del punto requerido por encima con una mayor dispersión de los
datos, con n punto atípico y mayor variabilidad.

El de la marca 2 se aleja del punto requerido por debajo, y una distribución menos homogénea
con poca dispersión.

En la marca 4 presenta poca variabilidad de los datos, pero alejado del punto requerido por
encima.

La marca 5 está cerca del punto requerido su media, pero por encima y con variabilidad moderada
, pero presenta puntos atípicos por debajo y por encima.

6.- La desviación estándar de la distribución de probabilidad uniforme o rectangular con ancho 2𝑎


es 𝑠 = 𝑎 √3. Demuestre.

Considerando el centro en el origen de coordenadas, sea:

F(x)= 1/a ; cte

𝑉𝑎𝑟(𝑥) = 𝐸(𝑥 2 ) − [𝐸(𝑥)]2


𝑎/2 𝑎/2
1 1 𝑥 3 𝑎/2
𝐸(𝑥 2 ) = ∫ 𝑥 2 . 𝐹(𝑥). 𝑑𝑥 = ∫ 𝑥 2 . . 𝑑𝑥 = . ( )/
−𝑎/2 −𝑎/2 𝑎 𝑎 3 −𝑎/2

1 𝑎3 𝑎2
𝐸(𝑥 2 ) = .( ) =
3. 𝑎 4 12

[𝐸(𝑥)]2 = 0

Entonces, la desviación estándar:

𝑎2 𝑎
𝑆=√ =
12 2. √3

7.- Hipotesis para varianzas homogéneas de la prueba de Barllett:

Ho: todas las varianzas son iguales

H1: almenos un par las varianzas son diferentes

Como P-value = 0.3174> alfa=0.05 entonces se acepta Ho (las varianzas son homogéneas)

8.- Luego de realizar la calibración de un termómetro se obtiene una curva de calibración de tipo
lineal. Para comprobar la adecuación del modelo a los datos de calibración se grafican los residuos
del modelo:

Se observa que el ajuste de tipo lineal no es tan conveniente, debido que los residuos presenta un
patrón casi cuadrático (parabólico) algo disperso (no son tan aleatorio), pero sus datos si se ajusta
a una distribución normal. Se Podría comparar con un ajuste cuadrático los datos y ver cual
presenta una mejor aleatoriedad de residuos.

S-ar putea să vă placă și