Sunteți pe pagina 1din 10

Propiedades de la varianza:

Sean X, Y variables, K constante I) II) III) IV) V) VI) V(x) > 0 (x si es una constante) V(x=k)=0 V(x+ k)=k2 v(x) V(Kx)=k2 v(x) V(x+ y) = v(x) + v(y) + 2 Cons (x.y) V(k1 x + k2) = k21 v(x) Ejemplo: 1) Xi: 18,20,17,25,20 (muestra) meses x2 = 9.5 meses 2 = 20.0 meses - El prximo mes: yi: 19, 21, 18, 26,21 Yi: x+1 v (y) = v(x)= x2 = 21.0 meses Mes anterior V(x-1) = V (x) 2) Sueldo soles: Xi: 2000, 1500, 1800, 1600,1700 : 1720 x2= 37.000 (192.35384)2 = (192.35)2 = (Desv. Estndar)2 Se aumenta sueldo en 20% Yi: 2400, 1800, 2160, 1920,2040 = 2064 Y= 53,280 Usando propiedades Y= x+020 x = x (1+0.2) = 1.2x V (y) = x (1.2x) = (1.2)2 v(x) = 1.44 (37000) = 53.280 El coeficiente de variacin (CV): En muchas ocasiones la desviacin estndar ala varianza no permite evaluar si la variabilidad de los datos puede ser considerada tolerable o no tolerable. Existe un ndice que permite evaluar la magnitud de la variabilidad de los datos o comparar la variabilidad de los datos cuando estn medidos en unidades diferentes. Este coeficiente de variacin no tiene unidad de medida.

Para calcular el coeficiente de variacin de un conjunto de datos puede usrsela siguiente formula. C.V = Gx: Desviacin estndar poblacional Mx: Media poblacional CV: Coeficiente de variacin poblacional Sin embargo lo que ms se usa es el coeficiente de variacin muestral, y esto es igual: C.V X 100

1x: Desviacin estndar muestral : Media muestral Estudios experimentales o de control es deseable que el coeficiente de variacin tenga un nivel bajo, si bien es cierto no existen valores fijos para establecer niveles del coeficiente, establecen los siguientes niveles para el coeficiente de variacin. Bajo : CV < 10 % Medio : CV entre 10,20 % Alto: CV > 20 % Ejemplo: X: Colesterol en pollos (carne) Xi: 65,68,66,67,70,71,67 Calcular e interpretar C.V C.V = C.V = 2.9 % Variabilidad de colesterol es aceptable o es esta bajo. ,

III) Medidas de forma:


Esta forma de caracterizar a un conjunto de datos es mediante su deformacin estas medidas tienden a mostrar la dispersin de los datos con respecto a su valor central. Generalmente para evaluar la deformacin se toma como diferencia la distribucin normal o campana de Gauss.
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Categora 1 Categora 2 Categora 3 Categora 4

Las medidas estadsticas ms usadas para evaluar el grado de deformacin de un conjunto de datos mustrales son: a) Asimetra: Se dice que una figura es asimtrica cuando la frecuencia de sus valores X distantes del valor central. En una distribucin de frecuencias simtricas consisten en el centro, la media, la mediana y la moda. XI 4 5 6 7 8 X= 6.0 Me= 6.0 ni 12 30 45 30 12 Ni 12 42 87 117 129

Mo= 6.0 DISTANCIA SIMETRICA XI 13 15 17 14 21 NO ES SIMETRIA ni 5 20 60 30 12

A) Medida de Asimetra
i) Usando funcin de nmeros: AS= AS= ii) DATOS NO AGRUPADOS DATOS AGRUPADOS

Coeficiente de PEARSON AS= Nota: AS >0 Asimetra Positiva (Sesgo derecho) AS<0 Asimetra Negativa (Sesgo Izquierdo) AS=0 Simetra
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Categora 1 Categora 2 Categora 3 Categora 4

Sesgo > Me > Mo

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Categora 1 Categora 2 Categora 3 Categora 4

Sesgo < Me < Mo

Serie 1
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Categora 1 Categora 2 Categora 3 Categora 4

= Me = Mo, Me= En medio B) Custores O Apuntamiento: La apuntosis es la medida de deformacin vertical de un conjunto de datos o de una distribucin de frecuencia. - La punteosis mide el apuntamiento o deformamiento de una distribucin tomando como referencia la altura mxima de la curva normal. - Medidas de apuntamiento o de custosis

i)

Usando funcin de momentos. K1= K1= = DATOS NO AGRUPADOS DATOS AGRUPADOS

Ki > 3 Distribucin lepto curtica Ki< 3 Distribucin Platicurtica Ki= 3 Distribucin herpcurtica ii) Usando Cuantels K2 = = K2 > 0. 263 Distribucin lepto curtica K2> = 0.263 Distribucin Platicurtica K2= 0.263 Distribucin herpcurtica

Se tienen la distribucin de una muestra de pollos que corresponde a la muestra experimental sometido a cierto tratamiento, para disminuir el colesterol en la granja. LI - LS 52 - 54 54 - 56 56 - 58 58 - 60 60 - 62 63 - 64 64 - 66 66 - 68 68 - 70 TOTAL XI 53 55 57 59 61 63 65 67 69 ni 14 25 42 50 69 52 44 46 19 360 (xi- )3 ni (xi- )4

- 61.45 Me= 61.00 01 = 59 03 = 65 P90 = 67 P10= 55 I= 01 desde Ni> 63 P90 Ni >

Estimar la asimetra usando la funcin de nmeros y el coeficiente de Pearson Segn Pearson AS= = 0.32

Ligeramente seguido a la derecha C) Coeficiente Curtosis: Usando nmeros K1 - Usando Cuantiles K2= = 0.25

NOTA: Se puede usar el diagrama de cajas para representar la forma de un conjunto de datos viviendo tambin para detectar datos atpicos o extremos datos OUTLIERS. Para construir un diagrama podemos hacerlo, se ordena los datos de la muestra (NUMERO GRANDE), identificando el mximo y el mnimo, Obtener el cuartil, cuartil 2, cuartil 3 Se dibuja un rectngulo con extremos Q1 Y Q3 e indicar la posicin de la mediana como un segmento. Obtener los lmites de tolerancia, superior o inferior. Mediante segmentos (BIGOTES) que sirve para aumentar los valores atpicos, se corta el bigote de Xmax y Xmin , si estn en los lmites de tolerancia. LT5 = 63 + 1.5 (63 - 11) SUPERIOR LT1 = 61, - 1.5 (63 Q1) INFERIOR RQ = Q3 Q1 RANGO INTERCUARTILICO EJEMPLO

Xi: 72,85,90,110,,246 Xmax= 240 Q1= 169 Q2= 177 Xmax= 240 Q3= 200 Xmin= 72 RQ=36 LT5 200 + 1.5 (36) = 254 LT1 164 1.5 (36) = 110

Los datos que se encuentran por encima o por debajo de los lmites de tolerancia son los datos atpicos o datos OUTLIERS.

Medidas de Asociacin: Las medidas de asociacin pueden usarse cuando cada individuo o elemento se puede obtener 2 o ms variables es decir datos bidimensionales o de mayor dimensin lo podemos presentar: 1 X1 Y1 2 X2 Y2 3 X3 Y3 n Xn xy

i xi yi

i: Pollos Xi: Peso total Yi: Peso vsceras

i: Vacas xi: Posicin Yi: Colesterol en la leche

i: Conejos Xi: Preez Yi: Colesterol

a) Diagrama de dispersin: La relacin entre 2 variables comienza como un intento de describir la formula aproximada de la relacin representando los datos abreviados en un sistema de coordenadas. XY, Permitiendo decidir el tipo de relacin entre variables esta grafica recibe el nombre de diagrama de dispersin o nube de puntos. En caso se puede identificar la variable independiente esta debe aparecer en el eje X, para luego obtener los puntos bidimensionales. i xi yi 1 1.7 7.0

b) Correlacin Lineal: Es aquella que mide la relacin entre las variables X, Y, y evaluada la variacin conjunta de 2 variables, su grado, nivel de relacin, y su sentido positivo o negativo. Para determinar la fuerza de relacin se puede hacer uso del ndice de conclusin de PEARSON para variables cuantitativos. COEFICIENTES DE CONCLUCION (PEARSON): Para el caso de una poblacin del coeficiente est dado por el numerador Eo V (xy): Covarianza XY Gx: Desviacin estndar X Gy: Desviacin estndar Y

P= Esta dada por varianza de Sx Sy R= =

Cov (xy)=

SX=

S4=

Dnde: =

CARACTERISTICAS DEL COEFICIENTE: i) ii) -1 iii) R es adimensional Variado 1 a 1 0 1

Si R + existe una relacin directa es decir al aumentar X aumenta Y Si R= 1 o R=-1, Existe una relacin lineal perfecta Si = 0 no existe asociacin alguna.

EJEMPLO: i 1 2 3 4 5 6 7 8 TOTAL X: Protena Y: Colesterol Sx= 83815 S4= 1.7984 = = = 24.5 9.375 - . = ( )= 16.28125 xi 30 33 38 25 24 15 12 9 186 yi 10 12 13 9 9 8 7 8 75 xiyi 300

1874

Cov (xy) = Sx= 9.7436 S4= 1.7984

= 0.929 Existe una relacin lineal fuerte: Nota Si || >, 0.80 Relacin fuerte Si || <, 0.20 Relacin dbil 30 , 10 M+ 0.20 < || <, 0.80 , Relacin moderada

S-ar putea să vă placă și