Sunteți pe pagina 1din 15

“Año de la consolidación del mar de Grau”

 Estudiantes:

 Gaona Viera, Jhan Pier


 Ramírez Vidal, Marina de los Milagros.
 Reyes Ibarra, Edward.
 Sosa Ortiz, María de los Ángeles.
 Timoteo Chuquirima, Lennin.
 Vílchez Estrada, Mirella Concepción.

 Docente:

 Alfredo Sullón León.

 Especialidad:

 Contabilidad.

 Materia:

 Estadística aplicada a la contabilidad.

 Tema:

 Correlación lineal y regresión lineal de dos variables.

 Ciclo:

 V.

 Grupo:

 I.

PROEDUNP-SULLANA.

Sullana, 11 de mayo del 2016


“Año de la consolidación del mar de Grau”

 Estudiantes:

 Gaona Viera, Jhan Pier


 Ramírez Vidal, Marina de los Milagros.
 Reyes Ibarra, Edward.
 Sosa Ortiz, María de los Ángeles.
 Timoteo Chuquirima, Lennin.
 Vílchez Estrada, Mirella Concepción.

 Docente:

 Alfredo Sullón León.

 Especialidad:

 Contabilidad.

 Materia:

 Estadística aplicada a la contabilidad.

 Tema:

 Correlación lineal y regresión lineal de dos variables.

 Ciclo:

 V.

 Grupo:

 I.

PROEDUNP-SULLANA.

Sullana, 11 de mayo del 2016


INTRODUCCIÓN.

Analizar el grado de la relación existente entre variables utilizando modelos


matemáticos y representaciones gráficas. Así pues, para representar la relación
entre dos o más variables desarrollaremos una ecuación que permitirá estimar una
variable en función de la otra. Por ejemplo, ¿en qué medida, un aumento de los
gastos en publicidad hace aumentar las ventas de un determinado producto?

El análisis de correlación y regresión comprende el análisis de los datos muéstrales


para saber qué es y cómo se relacionan entre si dos o más variables en una
población. El análisis de correlación produce un número que resume el grado de la
fuerza de relación entre dos variables; y el análisis de regresión da lugar a una
ecuación matemática que describe dicha relación.

La correlación y la regresión son una herramienta muy útil cuando se trata de


relacionar dos o más variables, relacionadas entre sí.

No solo se manejara la definición del tema, se darán ejemplos, ejemplos prácticos


en diferentes áreas, se mostraran tablas y graficas de correlación y regresión lineal.
Este trabajo será realizado para comprender este tema de una manera teórica y
práctica.
OBJETIVOS.

 Aprender a calcular la correlación entre dos variables.

 Saber dibujar un diagrama de dispersión.

 Representar la recta que define la relación lineal entre dos variables.

 Saber estimar la recta de regresión por el método de mínimos cuadrados e


interpretar su ajuste.

 Realizar inferencia sobre los parámetros de la recta de regresión.

 Construir e interpretar intervalos de confianza e intervalos de predicción


para la variable dependiente.

 Realizar una prueba de hipótesis para determinar si el coeficiente de


correlación es distinto de cero.
MODELO DE REGRESIÓN Y CORRELACION LINEAL CON DOS
VARIABLES.

La regresión y la correlación son dos técnicas estrechamente


relacionadas y comprenden una forma de estimación. En forma más especifica el
análisis de correlación y regresión comprende el análisis de los datos muéstrales
para saber qué es y cómo se relacionan entre si dos o más variables en una
población.

El análisis de correlación produce un número que resume el grado de la


correlación entre dos variables; y el análisis de regresión da lugar a una ecuación
matemática que describe dicha relación.

El análisis de correlación generalmente resulta útil para un trabajo de


exploración cuando un investigador o analista trata de determinar que variables
son potenciales importantes, el interés radica básicamente en la fuerza de la
relación.

La correlación mide la fuerza de una entre variables; la regresión da lugar


a una ecuación que describe dicha relación en términos matemáticos.

Los datos necesarios para análisis de regresión y correlación provienen


de observaciones de variables relacionadas.
REGRESIÓN LINEAL.

La regresión lineal simple comprende el intento de desarrollar una línea recta


o ecuación matemática lineal que describe la reacción entre dos variables. La
regresión puede utilizadas de diversas formas.

Se emplean en situaciones en la que las dos variables miden


aproximadamente lo mismo, pero en las que una variable es relativamente costosa,
o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra
variable no ocurre lo mismo.

La finalidad de una ecuación de regresión seria estimar los valores de una


variable con base en los valores conocidos de la otra.

Otra forma de emplear una ecuación de regresión es para explicar los valores
de una variable en término de otra. Es decir se puede intuir una relación de causa
y efecto entre dos variables.

El análisis de regresión únicamente indica qué relación matemática podría


haber, de existir una. Ni con regresión ni con la correlación se pude establecer si
una variable tiene “causa “ciertos valores de otra variable.

La regresión es el conjunto de técnicas usadas para explorar y cuantificar la


relación de dependencia entre una variable cuantitativa llamada variable
dependiente o respuesta y una o más variables independientes llamadas variables
predictores.

El primer paso para determinar si puede existir o no dependencia/relación


entre variables es representando gráficamente los pares de valores observados
mediante una nube de puntos, lo que se conoce como diagrama de dispersión.

Una vez representados los datos y tras detectar que entre dos o más variables
existe una relación el siguiente paso sería intentar modelizar dicha relación.
La modelización estadística más sencilla para expresar la variable
dependiente a través de sus variables predictores es mediante una ecuación lineal
de la forma Y=β0+β1X1+⋯+βnXkY=β0+β1X1+⋯+βnXk.

El caso más simple para una única variable sería una recta Y=mx+nY=mx+n
y recibirá el nombre de regresión lineal simple. Cuando k>1k>1 la llamaremos
regresión múltiple.

Así, el proceso consistiría en ajustar la recta a nuestro conjunto de datos y


crear una expresión matemática que permita predecir, de forma aproximada, el
valor de la variable dependiente en un individuo cuando se conoce el valor de una
variable predictor (regresión simple) o varias variables predictores (regresión
múltiple) en ese mismo individuo. A la ecuación que representa esta relación se le
llama modelo de regresión (Pérez, 2014).

Podemos considerar varias formas de estimar los parámetros de la ecuación


del modelo de regresión. Sin embargo, nos centraremos en el método de mínimos
cuadrados por ser el de más amplia aceptación, aunque existan también otros
métodos como el de máxima verosimilitud.

Ecuación Lineal

Dos características importantes de una ecuación lineal: la independencia de la recta


y la localización de la recta en algún punto. Una ecuación lineal tiene la forma

y = a + box.

En la que a y b son valores que se determina a partir de los datos de la muestra; a


indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que
se habrá de predecir, y x es la variable predictor.
PRUEBA DE HIPÓTESIS.

Se plantea los siguientes casos:

a) Cuando ß1 = 0; es decir, si la variable Y no está relacionada


linealmente con la variable X. Esto equivale a plantear la hipótesis
Hp: ß1=0, y vía una prueba F comparar el valor de F calculado (Fc)
con el valor F tabular (Fo), donde Fc=CMR/CME y Fo=Fα (1, n-
2)gl. Si Fc>Fo, se rechaza la hipótesis planteada, esto supone un
valor ß1 distinto de cero y se concluye que Y se puede expresar en
términos de X linealmente.

b) Cuando ß1 tiene un valor específico distinto de cero ß10; es decir,


Hp: ß1=ß10. En este caso, para la prueba de esta hipótesis se usa el
estadístico t de Student. El valor t calculado es hallado mediante la
expresión: tc = (b1-ß10)/Sb1

Si tc> tα se rechaza la hipótesis planteada, donde tα es el valor de la tabla al nivel


α y n-2 gl.

Para realizar un análisis de regresión lineal múltiple se hacen las


siguientes consideraciones sobre los datos:

a) Linealidad: los valores de la variable dependiente están generados por el


siguiente modelo lineal:

Y = X*B +U

b) Homocedasticidad: todas las perturbaciones tienen las misma varianza:

V(ui) =σ2
c) Independencia: las perturbaciones aleatorias son independientes entre sí:

E(ui⋅u j ) = 0,∀i ≠ j

d) Normalidad: la distribución de la perturbación aleatoria tiene distribución


normal:

U ≈ N(0,σ2)

e) Las variables explicativas Xkse obtienen sin errores de medida.

Si admitimos que los datos presentan estas hipótesis entonces el teorema


de Gauss-Markov establece que el método de estimación de mínimos cuadrados
va a producir estimadores óptimos, en el sentido que los parámetros estimados
van a estar centrados y van a ser de mínima varianza
CORRELACION LINEAL.

Un análisis de correlación nos permite cuantificar el grado de asociación


lineal entre variables continuas, indica la fuerza y dirección de la relación lineal
entre dos o más variables. Cuando exista dicha relación se podrá proceder a la
obtención del modelo de regresión (simple o múltiple) que veremos
posteriormente (Pérez, 2014).

Existen diferentes tipos de correlación, la correlación simple, la correlación


múltiple y la correlación parcial. Utilizaremos la correlación simple cuando
contemos con una sola variable predictor para explicar una respuesta, y los
coeficientes de correlación parcial y múltiple cuando tengamos varios predictores.

Utilizamos la correlación lineal simple para estudiar el grado de variación


conjunta entre dos o más variables. Queremos detectar si la variación de una de las
variables tiene conexión con la variación de la otra, esperamos que si una variable
de desvía de la media, la otra variable se desvíe de la media de manera similar.

Una relación lineal positiva entre dos variables indica que los valores de las
dos variables varían de forma parecida: los sujetos que puntúan alto en una variable
tienden a puntuar alto en la otra y los que puntúan bajo en la primera tienden a
puntuar bajo en la segunda, existe una relación directa entre ambas variables.

Una relación lineal negativa significa que los valores de las dos variables
tienen una relación inversa: valores pequeños de una variable van asociados ahora
a valores grandes de la otra y, equivalentemente, valores grandes de una se asocian
a valores pequeños de la otra.

La forma más directa e intuitiva de formarnos una primera impresión sobre


el tipo de relación existente entre dos variables es a través de un diagrama de
dispersión. Se trata de un gráfico en el que una de las variables, XX, se coloca en
el eje de abscisas, la otra, YY, en el de ordenadas y los pares (Fiyi) (Fiyi) se
representan como una nube de puntos. La forma de la nube de puntos nos informa
sobre el tipo de relación existente entre las variables.
Una regla fundamental es que cuanta mayor correlación haya entre dos
variables en la representación bidimensional, más próximos a la recta estarán los
valores.

Sin embargo, la covarianza no es una medida útil para comparar rectas de


regresión de variables distintas, o comparar el grado de asociación lineal entre
distintos pares de variables, ya que depende de las escalas de medida de las
variables. La solución está en estandarizarla y es de aquí de donde surgen llamados
coeficientes de correlación.

Coeficientes de correlación.

El más importante de los coeficientes de correlación es el Coeficiente de


Pearson, que explicaremos en mayor profundidad, pero también están la Rho de
Spearman y la Tau de Kendall. Veamos sus propiedades generales:

• Todos los coeficientes varían entre -1 y 1.

Si el coeficiente de correlación es -1 existe correlación negativa, es decir, a


medida que una variable aumenta, la otra disminuye. Cuando el coeficiente es 1
hay correlación positiva, cuando aumenta una variable, también aumenta la otra.

• Un valor cercano o igual a cero indica poca o nula relación lineal entre las
variables.

• Se utilizan como una medida de la fuerza de asociación: valores ±0.1±0.1


representan pequeñas asociación, ±0.3±0.3 asociación mediana,
±0.5±0.5asociación moderada, ±0.7±0.7 gran asociación y ±0.9±0.9 asociación
muy alta.

Las principales diferencias entre los coeficientes son:

• La correlación de Pearson funciona bien con variables cuantitativas y que


sigan bien la distribución normal.
• La correlación de Spearman se utiliza para datos ordinales o de intervalo
que no satisfacen la condición de normalidad. (Usualmente tiene valores muy
parecidos a la de Pearson).

• La correlación de Kendall es una medida no paramétrica para el estudio de


la correlación. Debemos utilizar este coeficiente en vez de la de Spearman cuando
tengamos un conjunto de datos pequeño y muchas puntuaciones estén en el mismo
nivel.
BIBLIOGRAFIA

 http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf

 http://www.mcgraw-hill-

educacion.com/pye01e/cap13/13analisis_de_correlacion_y_regr

esion.pdf

 http://recursostic.educacion.es/descartes/web/materiales_didact

icos/Correlacion_regresion_recta_regresion/correlacion_y_regr

esion.htm

 http://www.fao.org/docrep/003/x6845s/x6845s02.htm

 http://www.vitutor.com/estadistica/bi/coeficiente_correlacion.ht

ml

 http://www.seduca2.uaemex.mx/ckfinder/uploads/files/u3tema_

1_coeficiente.pdf
CONCLUSIONES

La venta es consecuencia de la labor del empresario para captar clientes que


estén dispuestos a cancelar por el bien o servicio ofrecido, demandándole,
pues cubre alguna de sus necesidades y está dispuesto a pagar por ello un
precio que se encuentra en el mercado.
La empresa de mochilas “PORTA S.A.” tiene un total de ventas 76 millones
de soles y como promedio 19 millones de soles.
Se define como publicidad aquella técnica dirigida a compartir o a informar
al público en general sobre un bien o servicio a través de los diferentes
medios de comunicación con el objetivo de motivar al público hacia la acción
de consumo.
La empresa de mochilas “PORTA S.A” tiene un total de gasto de publicidad
13 millones de soles, con un promedio de 3.25 millones de soles.
La empresa de mochilas “PORTA S.A.” tiene una tasa de crecimiento de
8.03%.
La empresa de mochilas “PORTA S.A.” tiene un modelo de correlación de
Y= - 7.10+8.03X, donde “y” son las ventas y “x” son los gastos de publicidad.
La empresa de mochilas “PORTA S.A.” tiene como gasto de publicidad de 8
millones de soles y tiene como ventas estimadas un monto de 57.14 millones
de soles.
La tasa de crecimiento de la empresa mochilas “PORTA S.A.” se encuentra
entre 4.06 y 20.12 millones de soles con una probabilidad de 0.95.
Las ventas estimadas de la empresa mochilas “PORTA S.A.” se encuentra
entre 45.05 y 68.47 millones de soles con una probabilidad de 0.95.
El grado de asociación que existe entre ventas y publicidad de esta empresa
es de 0.93.

S-ar putea să vă placă și