Sunteți pe pagina 1din 12

Instituto Tecnológico Nacional de

Querétaro Unidad Jalpan de Serra

Tecnológico Nacional de México


Departamento de Educación Presencial a Distancia

Carrera:
Ingeniería Sistemas Computacionales.

Presenta:
Marco Antonio Mendoza Carranza
Samuel Alonso Correa
Eudorico Castillo Marín
Número de Control:
18141481
Actividad:
Regresión lineal
Asesor: Ing. Yuriko tanahi colina

Tutor: Lic. María Rosa Trejo Bocanegra

Materia: Probabilidad y estadística

Jalpan de Serra Querétaro 16 de Noviembre del 2019.


Introducción
Dentro de Probabilidad y estadística es encontrado el modelo matemático de
regresión lineal, en donde se estipula que la regresión lineal es una manera de saber
la aproximación de una cierta dependencia entre una variable de tipo dependiente
y otra de tipo independiente, pero conociendo que existen tipo de esta regresión y
que son utilizadas de distintas manera se darán a conocer estas y como es que
funcionan, una de las regresiones más importante y más utilizadas es la de tipo
simple en donde se aplica en aquellas investigaciones en las que deseamos conocer
la posible relación (lineal) entre dos variables. Normalmente, ambas variables son
cuantitativas, aunque se verá que este requisito puede ser salvado en lo que
respecta a la variable independiente, que puede ser una variable cualitativa, con lo
que el modelo de regresión puede extenderse a los contrastes de medias y análisis
de la varianza, sin pérdida de generalidad. Además de este tipo de regresión las
características de otras son las que marcan la diferencia, debido a su modo de
empleo y las áreas que cubre cada una, en el siguiente documento será organizada
toda esta información explicando de la manera más técnica posible lo que da a
entender cada modelo implementado y mencionando las áreas en las que la
regresión lineal tiene influencia.
¿Qué Significa Regresión lineal?

Este método tomo su primera forma cuando se realizó el estudio de las variables
antropométricas, en donde se estipulaba que al comparar la estatura de padres e
hijos, donde resultó que los hijos cuyos padres tenían una estatura muy superior al
valor medio, tendían a igualarse a éste, mientras que aquellos cuyos padres eran
muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio. La constatación empírica de esta propiedad se vio
reforzada más tarde con la justificación teórica de ese fenómeno.

La regresión lineal consiste en encontrar (aproximar) los valores de una variable a


partir de los de otra, usando una relación funcional de tipo lineal, es decir, buscamos
cantidades a (ordenada en el origen) y b (pendiente de la recta lineal) tales que se
pueda escribir Y  a  bX  , con el menor error posible entre Ŷ e Y

Para cada valor observado de la variable independiente xi podemos considerar dos


valores de la variable dependiente, el observado yi y el estimado a partir de la
ecuación de la recta, i a bxi y   . Para cada observación podemos definir el error
o residuo como la distancia vertical entre el punto (xi, yi) y la recta, es decir: yi – (a
+ bxi)

Por cada recta que consideremos, tendremos una colección diferente de residuos.
Se trata de buscar la recta que dé lugar a los residuos más pequeños, es decir la
recta que hace mínima la suma de cuadrados de las distancias verticales entre cada
punto y la recta, de tal manera que se minimice la suma de los errores al cuadrado.
Mientras que el término lineal se empleó en la distinción de técnicas de regresión,
donde son empleados modelos basados en cualquier clase de función matemática,
es decir: Los modelos lineales son una explicación simplificada de la realidad,
mucho más ágiles y con un soporte teórico mucho más extenso por parte de la
matemática y la estadística.

También conocido como ajuste lineal y denominado un modelo matemático, es


utilizado para la aproximación de la relación entre una dependencia y una variable
dependiente y las variables dependientes a manejar serán representadas como Xn
y Y un término de tipo aleatorio, la fórmula para este modelo matemático es la
siguiente:

En donde se las variables:

Yt: variable dependiente, explicada o regresando.


X1, X2, X3, Xp: variables explicativas, independientes o regresores.
B1, B2, B3, Bp: parámetros, miden la influencia que las variables explicativas tienen
sobre el regrediendo.

También la variable B0 se determina cuando se tiene la intersección o término


"constante", las Bi (i>0) son los parámetros respectivos a cada variable
independiente, y p es el número de parámetros independientes a tener en cuenta
en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
Dentro del modelo de regresión lineal son relacionadas las variables dependientes
con variables explicitas, o cualquier transformación de estas que sean generadas
en un hiperplano de parámetros desconocidos, esto se interpreta de la siguiente
manera:

En donde la variable ᵋ significa la perturbación aleatoria existente, la cual recolecta

a todos aquellos factores de la realidad que no pueden ser controlados u


observados y que por consecuencia son asociados con el azar esto le confiere al
modela un carácter estocástico.
Existen más tipos de casos, uno de estos y el más sencillo e con una sola variable
explicita, el hiperplano es una recta:

En donde el problema a de la regresión consiste en la elección de unos valores


determinados para los parámetros desconocidos, de tal manera que la ecuación
quede completamente específica, en la observación i-esima cualquiera de estas es
registrada como un comportamiento simultaneo de una variable independiente y de
las variables explicitas.

Los valores seleccionados como estimadores de los parámetros son los coeficientes
de regresión sin que se pueda garantizar que coincidan con los parámetros reales
del proceso generado.
Tipos de regresión lineal
Dentro de la regresión es definida por el tipo de variables que esta tenga, uno de
estos tipos es la regresión lineal simple, en donde se estipula el uso de una variable
independiente por lo que solo cuenta con dos parámetros.

En donde el símbolo interpreta el error que se encuentra asociado a la medición

del valor Xi y siguen los supuestos de modo que de esto es obtenido

lo siguiente , una vez derivando

esta función con respecto de e igualando a cero son obtenidas dos


ecuaciones, las cuales llevan por nombre ecuaciones normales, y estas generan
una solución para ambos parámetros.

Además de esto los gráficos nos proporcionan la forma más sencilla e intuitiva de
estudiar la relación entre dos variables.
Nos ofrece una cierta idea de la naturaleza de la relación; si es lineal o no, su
intensidad, así como el sentido .El gráfico del diagrama de dispersión constituye una
primera aproximación no muy rigurosa al estudio de la linealidad.
Aparentemente lo es. Podemos completarlo mediante un gráfico en el que se
comparan las puntuaciones residuales y predichas.

El objetivo de esta es explicar el comportamiento de una variable Y, que será


denominada variable explicada a partir de otra variable x que se denominará
variable explicativa.

Regresión lineal Múltiple


Esta permite trabajar con una variable a nivel de intervalo, es posible el análisis de
la relación entre dos o más variables por medio de ecuaciones, a lo que se le es
denominado regresión múltiple o regresión lineal múltiple, constantemente la
práctica de la investigación estadística exige la localización de variables que de
alguna manera se relacionen entre sí por lo que es posible que una de las variables
tenga relación matemáticamente en función de otras variables.

La fórmula que maneja es la siguiente:

En donde el símbolo interpreta el error que se encuentra asociado a la medición

del valor y siguen los supuestos de modo que


Rectas de Regresión
Son las rectas que mejor se ajustan a la nube de puntos generada por una
distribución binomial. Matemáticamente, son posibles dos rectas de máximo ajuste:

Características
El error estándar en los casos reales, los ajustes absolutos a la realidad no se dan,
es por eso que existe una cierta medida que describe como de precisa es la
predicción de y en función de x. a esta medida se le denomina erros estándar de
estimación, y es utilizada en el análisis de regresión lineal para medir la dispersión
alrededor de la línea de regresión.
Supuestos del modelo, si las observaciones son de una muestra aleatoria que viene
de una población, entonces el interés estará en realizar inferencias sobre la misma.
Para que estas inferencias sucedan, se debe de cumplir con las siguientes
condiciones.
 En la población, la relación entre variables X e Y debe ser aproximadamente
lineal.
 Los residuos se distribuyen según una curva normal de media 0.
 Además, los residuos son independientes unos de otros.
 Los residuos tienen varianza constante.
La inferencia en el modelo de regresión, una vez calculada la recta de regresión y
la bondad de ajuste que se ha conseguido con el modelo, el siguiente paso es
realizar un contraste de hipótesis en el que la hipótesis nula se corresponderá con
la ausencia de relación y el rechazo de la hipótesis nula con la presencia de una
relación significativa.
Para esto se tiene que hacer un cierto contraste si la correlación entre ambas
variables es distinta de cero o si el modelo de regresión es válido en el sentido de
contrastar si el análisis de nuestra variable endógena (Y) es válido a través de la
influencia de la variable explicativa (X).
Características
Ventajas

 Representa la relación entre dos variables de forma gráfica, lo que hace más
fácil visualizar e interpretar los datos.
 Calculando la correlación de dos variables, permite cuantificar el grado de
relación entre ambas, así como su signo.
Utilidades

 Obtener información para determinar si dos variables están relacionadas.


 Comprobar cómo afecta a una variable los cambios producidos en otra.
 Probar las posibles relaciones causa / efecto.
Aplicaciones
Líneas de tendencia:
Dentro de una serie de datos obtenidos a través de un largo periodo, este tipo de
líneas puede describir si un conjunto de datos en particular han aumentado o
decrementado en un determinado período. Las líneas de tendencia son
generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de
mayor grado dependiendo de la curvatura deseada en la línea.

Medicina:
Las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de
estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran
cantidad de variables en su análisis de regresión en un esfuerzo por eliminar
factores que pudieran producir correlaciones espurias.

Informática:
Conclusión
Dentro de lo anteriormente mostrado se es entendido más el tema de la regresión
lineal, y como es que esta funciona, en pocas palabras la regresión lineal es una
clave para entender algunas relaciones entre variables en estadística. Además de
esto, es permitida para el uso en varios campos, debido a que maneja ciertas
probabilidades de cualquier suceso y es así como son calculadas algunos eventos,
todo es dependiendo del contexto en que se encuentre y que además las variables
deben ser coherentes conforme a la fórmula para que así esta tenga un resultado
preciso y no sea falso al momento de ser interpretado.
Referencias
 Clara Laguna, xx/xx/xxxx, Correlación y regresión lineal,08/12/2019,
http://www.ics-aragon.com/cursos/salud-publica/2014/pdf/M2T04.pdf
 Paula Villasante, 11/04/2019, Análisis de regresión lineal: concepto y
características,08/12/2019, https://lamenteesmaravillosa.com/analisis-de-
regresion-lineal-concepto-y-caracteristicas/
 Microsoft Word,xx/xx/xxxx, Regresión lineal simple,08/12/2019,
https://personal.us.es/vararey/adatos2/Regsimple.pdf
 Wikipedia, 29/10/2019, Regresión lineal,08/12/2019,
https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

S-ar putea să vă placă și