Sunteți pe pagina 1din 14

Clase n°2 nueva variable salario

P y q hacemos un supuesto que sea 0.5 y 0.5 tomamos como máximo.


Py q son 0.3 y 0.7cuando existe un estudio previo de este tema al cual vamos analizar.
Coeficiente de variación muestra si la variable tiene que transformarse
Cv=27% o 0.27=desv stan/mediana.
Es normal cuando el CV es menor del 25%.
Hemos decidido hacer una transformación de box cox (transformación de logaritmos).

Estadísticos descriptivos

N Mínimo Máximo Media Desv. típ.

salario actual 55 350.00 990.00 659.2727 175.01645


N válido (según lista) 55

Asimetría positiva sesgo hacia la derecha

Aumenta el ingreso en un 20 % que es lo que pasa

Prueba de Kolmogorov-Smirnov para una muestra

gasto mensual

N 55
Parámetros normalesa,b Media 505.5455
Desviación típica 96.04529
Diferencias más extremas Absoluta .186
Positiva .186
Negativa -.136
Z de Kolmogorov-Smirnov 1.377
Sig. asintót. (bilateral) .045

a. La distribución de contraste es la Normal.


b. Se han calculado a partir de los datos.

P valor 0.032 y alfa es 0.05 rechazamos la prueba de hipótesis y concluimos

Para crear una nueva variable de salario la hay un aumento del salario .

La transformación de logaritmos
Estadísticos descriptivos

N Media Desv. típ.

lognuevo_salario 55 2.8832 .11563


N válido (según lista) 55

¿Cuál es el problema de hacer transformación? Es que al final a la rpta tengo que hacer un
antilogaritmo y se pierde un 10% de las variables originales .y es mejor los logaritmos en
series de tiempo.

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

sexo N Porcentaje N Porcentaje N Porcentaje

gasto mensual valor 28 100.0% 0 .0% 28 100.0%

mujer 27 100.0% 0 .0% 27 100.0%

Descriptivos

Sexo Estadístico Error típ.


gasto mensual valor Media 496.0714 19.42009

Intervalo de confianza para Límite inferior 456.2247


la media al 95% Límite superior 535.9182

Media recortada al 5% 488.0952

Mediana 450.0000

Varianza 10559.921

Desv. típ. 102.76147

Mínimo 400.00

Máximo 750.00

Rango 350.00

Amplitud intercuartil 117.50

Asimetría 1.298 .441

Curtosis .366 .858

mujer Media 515.3704 17.20897

Intervalo de confianza para Límite inferior 479.9968


la media al 95% Límite superior 550.7439

Media recortada al 5% 511.5226

Mediana 500.0000

Varianza 7996.011

Desv. típ. 89.42042

Mínimo 400.00

Máximo 700.00

Rango 300.00

Amplitud intercuartil 75.00

Asimetría 1.082 .448


Curtosis .259 .872

La muestra debe ser aleatoria si io hago una muestra de la misma pobkacion entonces el 95% la media
se va encontrar entre 479 y 559 y en epromedio el gasto mensual es.

Intevalo de confianza… calcular un valor

Prueba de hipótesis….. tomo una decisión y se hace sobre parámetros y no sobre estimadores

Ho:ui=u2

-TERMINO DE INDEPENDENCIA

HO:VARIANZAS =
HI:VARIANZAS DIFERENTES

TEST DE INDEPENDENCIA NOS AYUDA LOS CUADROS ESTADISTICOS EN ESTE CASO CONCLUIMOS QUE
LAS VARIANZAS SON IGUALES

ACEPTA LA HO SE DICE QUE LOS GASTOS MENSUALES DE LAS MUJERES Y VARONES SON IGUALES.

MEDIDA DE ASOCIACION(VARIABLES NOMINALES CATEGORICAS)

ANALISIS …ESTADISTICOS DESCRIP… TABLA DE CONTIGENCIA…

FILAS; ESTADOCIVIL

COLUMNA: SEXO ESTADISTICO CHI CUADRADO

HO:LAS VARIABLES DE ANALISI SON INDEPENDIENTES NO DEPENDEN DEL SEXO.

HI:LAS VARIABLES DE ANALISI NO SON INDEPENDIENTES

¿EXISTE ASOCIACION ENTRE EL GASTO Y PESO? EVALUE

N…FACEAC

ADM=32% 15

ECON=35% 30

CONT=35% 10

PRUEBA D EBONDAD DE AJUSTE (ES COHERENTE CON LA POBLACION)

HO:LA PROPORCION DE LA MUESTRA SI CORRESPONDE A LA MUESTRA .

HI: NO CORRESPONDE.

𝑂𝐼−𝐸𝐼 2
CHI CUADRADO ( BONDAD DEAJUSTE)…X2=∑ 𝐸𝐼
)

ANALISIS ..ESTADIS DESCRIP….GRAFICA DE BARRAS


El 5% de la media recortada 511.522 es un indicador robusto ya que se kita 5% de los datos arriba y 5%
de datos aboajos en este caso no es muy necesario ya ue la dispersión es muy bajo ,si fuera muy
disperso utiliamos la media recortada.

ANALISIS DEL GASTO MENSUAL RESPECTO AL SEXO.

Gráficos de tallo y hojas


gasto mensual Stem-and-Leaf Plot for
sexo= valor

Frequency Stem & Leaf

13.00 4 . 0111222333444
7.00 4 . 5557889
1.00 5 . 1
1.00 5 . 5
1.00 6 . 0
3.00 6 . 588
2.00 Extremes (>=690)

Stem width: 100.00


Each leaf: 1 case(s)

gasto mensual Stem-and-Leaf Plot for


sexo= mujer

Frequency Stem & Leaf

2.00 4 . 00
2.00 4 . 33
3.00 4 . 455
3.00 4 . 667
3.00 4 . 899
4.00 5 . 0001
4.00 5 . 2223
1.00 5 . 4
5.00 Extremes (>=650)

Stem width: 100.00


Each leaf: 1 case(s)
Estadísticos de grupo

Error típ. de la
sexo N Media Desviación típ. media

gasto mensual valor 28 496.0714 102.76147 19.42009


mujer 27 515.3704 89.42042 17.20897

Prueba de muestras independientes

Prueba de Levene para la


igualdad de varianzas Prueba T p

Dife
F Sig. t gl Sig. (bilateral) m
gasto mensual Se han asumido varianzas .964 .331 -.742 53 .461
iguales
Prueba de muestras independientes

Prueba de Levene para la


igualdad de varianzas Prueba T p

Dife
F Sig. t gl Sig. (bilateral) m

gasto mensual Se han asumido varianzas .964 .331 -.742 53 .461


iguales

No se han asumido -.744 52.460 .460


varianzas iguales

Tablas de contingencia

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

estado civil * sexo 55 100.0% 0 .0% 55 100.0%

Tabla de contingencia estado civil * sexo


Recuento

sexo

Valor mujer Total

estado civil soltero 16 8 24


casado 5 13 18

separado 7 6 13
Total 28 27 55

Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)

Chi-cuadrado de Pearson 6.283a 2 .043


Razón de verosimilitudes 6.460 2 .040
Asociación lineal por lineal 1.305 1 .253
N de casos válidos 55
Pruebas de chi-cuadrado

Sig. asintótica
Valor gl (bilateral)

Chi-cuadrado de Pearson 6.283a 2 .043


Razón de verosimilitudes 6.460 2 .040
Asociación lineal por lineal 1.305 1 .253
N de casos válidos 55

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mínima esperada es 6.38.

Estadísticos
lugar de procedencia

N Válidos 55

Perdidos 0

lugar de procedencia

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado

Válidos ayacucho 17 30.9 30.9 30.9

san juan 12 21.8 21.8 52.7

carmen alto 8 14.5 14.5 67.3

Magdalena 7 12.7 12.7 80.0

nazarena 6 10.9 10.9 90.9

6 5 9.1 9.1 100.0

Total 55 100.0 100.0


Cual es la edad promedio de las señotitas que son de san juan?

Como evaluamos

Primero selecciones genro ( mo f)

1 varon 2 mujeres

Procedencia

2san juan

56
Datos..seleccionar casos … si opc ….

Sexo =2&procedencia=2

Estadísticos descriptivos de edad y poner solo su media.


Estadísticos descriptivos

N Media

edad 6 23.83
N válido (según lista) 6

…………

Estadísticos descriptivos

N Media
edad 6 23.83
N válido (según lista) 6

Estadísticos descriptivos

N Media

edad 6 23.83
N válido (según lista) 6

Estadísticos de contraste

escuela
profesiona

Chi-cuadrado 11.818a
gl 2
Sig. asintót. .003

a. 0 casillas (.0%) tienen


frecuencias esperadas menores
que 5. La frecuencia de casilla
esperada mínima es 18.3.

Como es p – valor es 0.003


GRAFICO DE TALLOS Y HOJAS
edad Stem-and-Leaf Plot for
sexo= varon

Frequency Stem & Leaf

6.00 2 . 001111
7.00 2 . 2222223
7.00 2 . 4444555
4.00 2 . 6677
.00 2 .
2.00 3 . 00
2.00 Extremes (>=34)

Stem width: 10
Each leaf: 1 case(s)

3 personas con 26 años

Y la caja si es mas grandee s mas dispersa y cuando es poko es menos disperso.

Hay 4 valores extremos

19* valor extremo que el investigar debe sacar este dato xk esta sesgado este valor es de la persona que
tenia 39 años.

Los otros valores son 18,12,42.

S-ar putea să vă placă și