Sunteți pe pagina 1din 9

1.

DIAGRAMA DE DISPERSIN
1.1.
Concepto
Es una representacin grfica de la relacin entre dos variables, muy utilizada en
las fases de Comprobacin de teoras e identificacin de causas raz y en el Diseo de
soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente
destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la
clave de la resolucin eficaz de un problema, que las relaciones de causa-efecto casi
siempre muestran variaciones, y que es ms fcil ver la relacin en un diagrama de
dispersin que en una simple tabla de nmeros.
El anlisis de un diagrama de dispersin consta de un proceso de cuatro pasos, se
elabora una teora razonable, se obtienen los pares de valores y se dibuja el diagrama, se
identifica la pauta de correlacin y se estudian las posibles explicaciones. Las pautas de
correlacin ms comunes son correlacin fuerte positiva (Y aumenta claramente con X),
correlacin fuerte negativa (Y disminuye claramente con X), correlacin dbil positiva
(Y aumenta algo con X), correlacin dbil negativa (Y disminuye algo con X),
correlacin compleja (Y parece relacionarse con X pero no de un modo lineal) y
correlacin nula (no hay relacin entre X e Y). Errores comunes son no saber limitar el
rango de los datos y el campo de operacin del proceso, perder la visin grfica al
sintetizarlo todo en resmenes numricos, entre otros.
1.1.1. Correlacin Directa
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

1.1.2.

Correlacin Inversa

La recta correspondiente a la nube de puntos de la distribucin es una recta


decreciente.

1.1.3. Correlacin Nula


En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.

1.1.4. Correlacin Fuerte


La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

1.1.5.
La
ms

separados

Correlacin Dbil
correlacin ser dbil cuanto
estn los puntos de la recta.

Ejemplo: Este es el diagrama de dispersin que expresa la cantidad de dinero


que se gan Mateo cada semana trabajando en la tienda de su padre.

Las semanas estn diagramadas en el eje x, y la cantidad de dinero que se gan en


esa semana en el eje y. En general, la variable independiente (la variable que no est
influenciada por nada) est en el eje x y la variable dependiente (la que es modificada
por la variable independiente) est en el eje y.
En este diagrama se puede ver que en la semana 2 Mateo se gan alrededor de
Bs.125, y en la semana 18 estuvo cerca de los Bs.165. Pero ms importante an es la
tendencia. Con estos datos se puede ver que Mateo gana cada vez ms segn pasan las
semanas. Quiz su padre le da ms horas a la semana o ms responsabilidades.
2. ECUACIN DE LA RECTA

La ecuacin explcita de una recta tiene la forma y=mx+b donde m es la pendiente


de la recta y b el trmino independiente.
Ejemplo: Hallar la ecuacin de la recta que tiene pendiente m=3 e intercepto
b=10.
Se tiene que hallar la ecuacin de la recta, esto es, y=mx+b.
Se usa la informacin que se tiene:
m=3 y b=10 y se sustituye en la ecuacin
y=3x+10.
La ecuacin que se pide es y=3x+10.
3. REGRESIN LINEAL
3.1.
Concepto
Permite determinar el grado de dependencia de las series de valores X e Y,
prediciendo el valor y estimado que se obtendra para un valor x que no est en la
distribucin. El anlisis de regresin es una tcnica estadstica para investigar la
relacin funcional entre dos o ms variables, ajustando algn modelo matemtico. La
regresin lineal simple utiliza una sola variable de regresin y el caso ms sencillo es el
modelo de lnea recta.
El modelo de regresin lineal es el ms utilizado a la hora de predecir los valores
de una variable cuantitativa a partir de los valores de otra variable explicativa tambin
cuantitativa (modelo de regresin lineal simple). Una generalizacin de este modelo, el
de regresin lineal mltiple, permite considerar ms de una variable explicativa
cuantitativa.

4. ECUACIN DE UNA RECTA DE REGRESIN LINEAL USANDO LOS


MNIMOS CUADRADOS
El objetivo de un anlisis de regresin es determinar la relacin que existe entre
una variable dependiente y una o ms variables independientes. Para poder realizar esta
relacin, se debe postular una relacin funcional entre las variables. Cuando se trata de
una variable independiente, la forma funcional que ms se utiliza en la prctica es la

relacin lineal. El anlisis de regresin entonces determina la intensidad entre las


variables a travs de coeficientes de correlacin y determinacin.
'
La ecuacin de la regresin lineal es: Y =a+ bX , donde:
Y' es el valor pronosticado de la variable Y para un valor seleccionado de X.
a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor estimado
de Y cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una
unidad en X.
El principio de mnimos cuadrados se utiliza para obtener a y b. Las ecuaciones
para determinar a y b son:
b=

n ( XY )( X)( Y )
2

n ( X ) ( X )
2

Y X
; a= n b n

Ejemplo: Pedro Prez, presidente de la sociedad de alumnos de la Universidad


Nacional Experimental de Guayana, se ocupa de estudiar el costo de los libros
de texto. l cree que hay una relacin entre el nmero de pginas en el texto y el
precio de venta del libro. Para proporcionar una prueba, selecciona una muestra
de ocho libros de texto actualmente en venta en la librera. Desarrolle una
ecuacin de regresin para la informacin dada que se puede utilizar para
estimar el precio de venta basado en el nmero de pginas.
Libro
Fundamentos de la Administracin
lgebra
Contabilidad de Costos
Contabilidad Intermedia
Mercadotecnia
Metodologa de la Investigacin
Finanzas Pblicas
Finanzas Municipales

Libro
Fundamentos
Administracin

de

la

Paginas
X
500

Paginas
500
700
800
600
400
500
600
800

Precio (Bs.)
Y
84

Precio (Bs.)
84
75
99
72
69
81
63
93

XY
42.000

X2
250.000

Y2
7.056

lgebra
Contabilidad de Costos
Contabilidad Intermedia
Mercadotecnia
Metodologa
de

la

700
800
600
400
500

75
99
72
69
81

Investigacin
Finanzas Pblicas
600
63
Finanzas Municipales
800
93
TOTAL
4.900
636
8 ( 397200 ) ( 4900)(636)
b=
=0.05143
2
8 ( 3150000 )( 4900)

a=

52.500
79.200
43.200
27.600
40.500

490.000
640.000
360.000
160.000
250.000

5.625
9.801
5.184
4.761
6.561

37.800
74.400
397.200

360.000
640.000
3.150.000

3.969
8.649
51.606

636
4900
0.05143
=48.0
8
8

Entonces:
Y'=48.0+0.05143X
Se puede utilizar la ecuacin de regresin para estimar valores de Y.
Y ' =48.0+ 0.05143 X=48.0+0.05143 ( 800 )=89.14
El precio de venta estimado de un libro de 800 pginas es de Bs.89,14.

5. COVARIANZA Y ESTIMACIN DE ERROR


5.1.
Covarianza
Es un valor que indica el grado de variacin conjunta de dos variables aleatorias.
Es el dato bsico para determinar si existe una dependencia entre ambas variables y
adems es el dato necesario para estimar otros parmetros bsicos, como el coeficiente
de correlacin lineal o la recta de regresin.
El signo de la covarianza, por lo tanto, expresa la tendencia en la relacin lineal
entre las variables.
La frmula suele aparecer expresada como:

X i Y i ( X i X )(Y i Y )

^xy = i =1
Q
= i=1
n1

n1

Ejemplo: Calcula la covarianza de las variables estadsticas X, Y dadas por la


tabla de valores:
X
Y

4
1.4

5
1.3

6
1.4

7
1.5

8
1.5

9
1.6

10
1.6

11
1.7

Se deben calcular las medias de X y de Y, y calcular los productos XiYi. Los


resultados que se obtienen son:
n

xi

60
x = i=1 = =75 ;
n
8

yi

12
y = i=1 = =1,5
n
8

Una vez calculadas las medias se procede a realizar el clculo de la varianza:


n

x i yi =92,1
i=1

5.2.

xi yi

; Q = i =1
xy

xy =0,26

Error de Estimacin

Es una medida de su precisin que se corresponde con la amplitud del intervalo de


confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms
estrecho deber ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, ms observaciones debern incluirse en la muestra estudiada.
Este error de estimacin, cuya unidad de medida es sigma (), se basa en el
clculo de la raz cuadrada de la varianza:

2x x
=
=
n n

Ejemplo: De acuerdo a los datos proporcionados por el Instituto Nacional de


Estadstica se tiene una varianza de 0,98 de un total de datos de 1000.
=

0,982 0,98
0,98
=
=
=0,03
1000 1000 31,62

Segn los resultados manejados por el INE el error de estimacin es de 0,03.


6. COEFICIENTE DE DETERMINACIN
Una vez ajustada la recta de regresin a la nube de observaciones es importante
disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si
el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de
bondad del ajuste se utiliza el coeficiente de determinacin, definido como sigue:
n

( ^y i y )2

scE i=1
R=
= n
scG
2

( y 1 y )

(6.15) o bien

2
scR
n2 s^ R
R =1
=1
scG
n1 s^ 2Y
2

i=1

Como scE < scG, se verifica que 0 < R2 < 1.


El coeficiente de determinacin mide la proporcin de variabilidad total de la
variable dependiente (Y) respecto a su media que es explicada por el modelo de
regresin. Es usual expresar esta medida en tanto por ciento, multiplicndola por cien.
^y i y = ^ 1 (x x )
Por otra parte, teniendo en cuenta que
, se obtiene
1

s 2XY
R = 2 2 ( 6.16 )
s X sY
2

Dadas dos variables aleatorias cualesquiera X e Y, una medida de la relacin lineal


que hay entre ambas variables es el coeficiente de correlacin definido por:
Cov ( X , Y )
=
(6.17)
( X ) (Y )
donde (X) representa la desviacin tpica de la variable X (anlogamente para
(Y)). Un buen estimador de este parmetro es el coeficiente de correlacin lineal
muestral (o coeficiente de correlacin de Pearson), definido por:
s
r= XY =signo ( ^ 1 ) R2(6.18)
s X sY

Por tanto, r [-1,1]. Este coeficiente es una buena medida de la bondad del ajuste de
la recta de regresin. Evidentemente, existe una estrecha relacin entre r y

^ 1

aunque estos estimadores proporcionan diferentes interpretaciones del modelo:


r es una medida de la relacin lineal entre las variables X e Y.
^ 1 mide el cambio producido en la variable Y al realizarse un cambio de una
unidad en la variable X.
De las definiciones anteriores se deduce que:
s XY =0 ^ 1=0 r =0
Si r es significativo (distinto de cero) ya que ello implica que el modelo de
regresin lineal es significativo. Desafortunadamente la distribucin de r es complicada
pero para tamaos muestrales mayores que 30 su desviacin tpica es

(r) 1/ n , y

puede utilizarse la siguiente regla:


2
|r|> res significativo(con =0 05)
n
En la interpretacin del coeficiente de correlacin se debe tener en cuenta que:
r=1 indica una relacin lineal exacta positiva (creciente) o negativa
(decreciente).
r=0 indica la no existencia de relacin lineal estocstica, pero no indica
independencia de las variables ya que puede existir una relacin no lineal incluso
exacta.
Valores intermedios de r (0 < r < 1 -1 < r < 0) indican la existencia de una
relacin lineal estocstica, ms fuerte cuanto ms prximo a +1 ( -1) sea el valor de r.

S-ar putea să vă placă și