Sunteți pe pagina 1din 67

BIBLIOGRAFIA

• Basmadjian, the art of modeling in science and


1 engineering

• Canavos G., probabilidad y estadística: aplicaciones y


2 metodos

• Devore, Jay L., probabilidad y estadística para


3 ingenierías y ciencias

• Lopez, Alfonso, probabilidad y estadística, conceptos,


4 modelos, aplicaciones en Excel.

• Walpole, R. probabilidad y aplicaciones en estadística


5

• Lohr, Sharon. Muestreo. Thompson


6
Al buscar la palabra “lineal” en el diccionario se encuentra, entre otras
definiciones, la siguiente: lineal: (del lat. linealis). 1. adj. Perteneciente o
relativo a la línea. Sin embargo, en matemáticas la palabra “lineal” tiene un
significado mucho más amplio. Una gran parte de la teoría de álgebra lineal
elemental es, de hecho, una generalización de las propiedades de la línea
recta. A manera de repaso:

i) La pendiente m de una recta que pasa por los puntos (𝑋1 , 𝑌1 ) y (𝑋2 , 𝑌2 )
está dada por:

ii) Si 𝑋2 - 𝑋1 = 0 y 𝑌2 ≠ 𝑌1 , entonces la recta es vertical y se dice que la


pendiente es indefinida.

iii) Cualquier recta (a excepción de aquella que tiene una pendiente


indefinida) se puede describir con su ecuación en la forma pendiente-
ordenada al origen 𝑌 = 𝑚𝑥 + 𝑏, donde m es la pendiente de la recta y b
es la ordenada al origen (el valor de y en el punto en el que la recta
cruza el eje y).
III. Cualquier recta (a excepción de aquella que tiene una pendiente indefinida) se puede
describir con su ecuación en la forma pendiente-ordenada al origen 𝑌 = 𝑚𝑥 + 𝑏, donde m
es la pendiente de la recta y b es la ordenada al origen (el valor de y en el punto en el que
la recta cruza el eje y). (de la diap. anterior)

IV. Dos rectas distintas son paralelas si y sólo si tienen la misma pendiente.

V. Si la ecuación de la recta se escribe en la forma 𝑎𝑥 + 𝑏𝑦 = 𝑐, (𝑏 ≠ 0), entonces se puede


calcular fácilmente la pendiente m, como 𝑚 = −𝑎/𝑏.

VI. Si m1 es la pendiente de la recta 𝐿1 , 𝑚2 es la pendiente de la recta 𝐿2 , 𝑚1 ≠


0 𝑦 𝐿1 𝑦 𝐿2 son perpendiculares, entonces 𝑚2 = −1/𝑚1.

VII. Las rectas paralelas al eje x tienen pendiente cero.

VIII. Las rectas paralelas al eje y tienen pendiente indefinida.


ECUACIONES LINEALES CON DOS INCÓGNITAS

Considere el siguiente sistema de dos ecuaciones lineales con dos incógnitas x y y:

Donde 𝑎11 , 𝑎12 , 𝑎21 , 𝑎22 , 𝑏1 y 𝑏2 son números dados. Cada una de estas ecuaciones
corresponde a una línea recta. Cualquier par de números reales (x, y) que satisface el sistema
se denomina como solución.

Propiedad A - Si a = b y c = d, entonces a + c = b + d.
Propiedad B - Si a = b y c es cualquier número real, entonces c.a = c.b

1. La propiedad A establece que si se suman dos ecuaciones se obtiene una tercera ecuación
correcta.
2. La propiedad B establece que si se multiplican ambos lados de una ecuación por una
constante se obtiene una segunda ecuación válida.
ECUACIONES LINEALES CON DOS INCÓGNITAS

Sistema con una solución única


3𝑥 − 2𝑦 = 4
5𝑥 + 2𝑦 = 12

Rta/. Cuando existe solo un par de números que satisfacen las ecuaciones (𝑋 = 2 ; 𝑌 = 1)

Sistema con un número infinito de soluciones

𝑥−𝑦 =7
2𝑥 − 2𝑦 = 14

Estas dos ecuaciones son equivalentes. Esto es, cualesquiera dos números, 𝑋 𝑦 𝑌, que
satisfacen la primera ecuación también satisfacen la segunda, y viceversa. Para comprobar
esto se multiplica la primera ecuación por 2, esto está permitido por la propiedad B. Al ser
ambas ecuaciones equivalentes, lo único que podemos hacer es despejar una incógnita en
términos de cualquiera otra de las dos ecuaciones.
ECUACIONES LINEALES CON DOS INCÓGNITAS

Sistema sistema sin solución


𝑥−𝑦 =7
2𝑥 − 2𝑦 = 13

Rta/. Si se multiplica la primera ecuación por 2 (que de nuevo está permitido por la propiedad
B) se obtiene 2𝑥 − 2𝑦 = 14. Esto contradice la segunda ecuación. Por lo tanto, el sistema
no tiene solución.
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS

m ecuaciones con n incógnitas: eliminación de Gauss-Jordan y gaussiana

En esta sección se describe un método para encontrar todas las soluciones (si es que
existen) de un sistema de m ecuaciones lineales con n incógnitas. Al hacerlo se verá que,
igual que en el caso de 2 x 2, estos sistemas o bien no tienen solución, tienen una solución
única o tienen un número infinito de soluciones.

Solución de un sistema de tres ecuaciones con tres incógnitas: solución única

Ejercicio: 𝟐𝑿𝟏 + 𝟒𝑿𝟐 + 𝟔𝑿𝟑 = 𝟏𝟖


𝟒𝑿𝟏 + 𝟓𝑿𝟐 + 𝟔𝑿𝟑 = 𝟐𝟒
𝟑𝑿𝟏 + 𝑿𝟐 − 𝟐𝑿𝟑 = 𝟒
AYUDA

¿CUAL ES EL PASO SIGUIENTE?


ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS

En el sistema se pueden escribir como los elementos


de una matriz A, llamada matriz de coeficientes del sistema

Al usar la notación matricial, el sistema se puede escribir


como la matriz aumentada

Operaciones elementales por renglones

Las tres operaciones elementales por renglones aplicadas a la matriz aumentada que
representa un sistema de ecuaciones son:

i) Multiplicar (o dividir) un renglón por un número diferente de cero.


1 0 0 𝑋
ii) Sumar un múltiplo de un renglón a otro renglón. 0 1 0 𝑌
iii) Intercambiar dos renglones. 0 1 1 𝑍
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS

Operaciones elementales por renglones

𝟐𝑿𝟏 + 𝟒𝑿𝟐 + 𝟔𝑿𝟑 = 𝟏𝟖 2 4 6 18


Ejercicio: 𝟒𝑿𝟏 + 𝟓𝑿𝟐 + 𝟔𝑿𝟑 = 𝟐𝟒 4 5 6 24
𝟑𝑿𝟏 + 𝑿𝟐 − 𝟐𝑿𝟑 = 𝟒 3 1 −2 4

i) Multiplicar (o dividir) un renglón por un número diferente de cero.


ii) Sumar un múltiplo de un renglón a otro renglón.
iii) Intercambiar dos renglones.
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS

Operaciones elementales por renglones

𝟐𝑿𝟏 + 𝟒𝑿𝟐 + 𝟔𝑿𝟑 = 𝟏𝟖


𝟒𝑿𝟏 + 𝟓𝑿𝟐 + 𝟔𝑿𝟑 = 𝟐𝟒
𝟑𝑿𝟏 + 𝑿𝟐 − 𝟐𝑿𝟑 = 𝟒

Ejercicio:
𝟐𝑿𝟏 + 𝟒𝑿𝟐 + 𝟔𝑿𝟑 = 𝟏𝟖
Existe un
𝟒𝑿𝟏 + 𝟓𝑿𝟐 + 𝟔𝑿𝟑 = 𝟐𝟒 2 4 6 18
número infinito
𝟐𝑿𝟏 + 𝟕𝑿𝟐 + 𝟏𝟐𝑿𝟑 = 𝟑𝟎 4 5 6 24
2 7 12 30 de soluciones
Ejercicio:
𝟐𝑿𝟐 + 𝟑𝑿𝟑 = 𝟒 Es un sistema
0 2 3 4 inconsistente al
𝟐𝑿𝟏 − 𝟔𝑿𝟐 + 𝟕𝑿𝟑 = 𝟏𝟓 2 −6 7 15
𝑿𝟏 − 𝟐𝑿𝟐 + 𝟓𝑿𝟑 = 𝟏𝟎 observar las 2
1 −2 5 10
filas inferiores
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS
Ejercicio:
Un departamento de pesca y caza de la represa de hidro-sogamoso proporciona tres tipos de
comida a un lago que alberga a tres especies de peces.
• Cada pez de la especie 1 consume cada semana un promedio de 1 unidad del alimento
A, 1 unidad del alimento B y 2 unidades del alimento C.
• Cada pez de la especie 2 consume cada semana un promedio de 3 unidades del alimento
A, 4 del B y 5 del C.
• Cada pez de la especie 3, el promedio semanal de consumo es de 2 unidades del
alimento A, 1 unidad del alimento B y 5 unidades del C.
Cada semana se proporcionan al lago: 25000 unidades del alimento A, 20000 unidades del
alimento B y 55000 del C. Si suponemos que los peces se comen todo el alimento, ¿cuántos
peces de cada especie pueden coexistir en el lago?

GUIA: Sean 𝑋1 , 𝑋2 y 𝑋3 el número de peces de cada especie que hay en el ambiente del
lago. Si utilizamos la información del problema, se observa que 𝑋1 peces de la especie 1
consumen 𝑋1 unidades del alimento A, 𝑋2 peces de la especie 2 consumen 3𝑋2 unidades del
alimento A y 𝑋3 peces de la especie 3 consumen 2𝑋3 unidades del alimento A.
ECUACIONES LINEALES CON DOS O MAS INCÓGNITAS
Ejercicio:
ECUACIONES RESULTADO

𝑋1 = 40000 − 5𝑋3
𝑋2 = 𝑋3 − 5000 𝑃𝑜𝑟 𝑒𝑗𝑒𝑚𝑝𝑙𝑜, 𝑠𝑖 𝑋3 = 6000, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑋1 = 10000 𝑦 𝑋2 = 1000
5000≤ 𝑋3 ≤ 8000
REGRESION LINEAL

El ejemplo más simple de una aproximación por mínimos cuadrados es ajustar una línea
recta a un conjunto de observaciones definidas por puntos: (x1, y1), (x2, y2),…, (xN, yN).
La expresión matemática para la línea recta es:

𝒀 = 𝒂𝟎 + 𝒂𝟏 𝒙 + 𝒆

donde 𝒂𝟎 y 𝒂𝟏 son coeficientes que representan la intersección con el eje y y la


pendiente, respectivamente, e es el error, o diferencia, entre el modelo y las
observaciones, el cual se representa al reordenar la ecuación como

𝒆 = 𝒚 − 𝒂𝟎 − 𝒂 𝟏 𝒙

Así, el error o residuo es la discrepancia entre el valor verdadero de y y el valor


aproximado, 𝒂𝟎 + 𝒂𝟏 𝒙, que predijo la ecuación lineal.
REGRESION LINEAL: Criterio para un “mejor” ajuste

Una estrategia para ajustar una “mejor” línea a través de los datos
será minimizar la suma de los errores residuales de todos los datos
disponibles, como sigue:

donde n = número total de puntos. Sin embargo, éste es un criterio


inadecuado, como lo muestra la figura, la cual presenta el ajuste
de una línea recta de dos puntos. Obviamente, el mejor ajuste es la
línea que une los puntos. Sin embargo, cualquier línea recta que
pase a través del punto medio que une la línea (excepto una línea
perfectamente vertical) da como resultado un valor mínimo de la
ecuación igual a cero, debido a que los errores se cancelan.
REGRESION LINEAL: Criterio para un “mejor” ajuste

Por lo tanto, otro criterio lógico podría ser minimizar la


suma de los valores absolutos de las discrepancias,

La figura muestra por qué este criterio también es


inadecuado. Para los cuatro puntos dados, cualquier línea
recta que esté dentro de las líneas punteadas minimizará
el valor absoluto de la suma. Así, este criterio tampoco
dará un único mejor ajuste.
REGRESION LINEAL: Criterio para un “mejor” ajuste

Una tercera estrategia para ajustar una mejor línea es el criterio


minimax. En esta técnica, la línea se elige de manera que minimice
la máxima distancia a que un punto se encuentra de la línea. Como
se ilustra en la figura, tal estrategia es inadecuada para la regresión,
ya que da excesiva influencia a puntos fuera del conjunto; es decir, a
un solo punto con un gran error. Deberá observarse que el principio
minimax es, en algunas ocasiones, adecuado para ajustar una
función simple a una función complicada (Carnahan, Luther y
Wilkes, 1969).

La estrategia que supera las deficiencias de los procedimientos


mencionados consiste en minimizar la suma de los cuadrados de los
residuos entre la y medida y la y calculada con el modelo lineal.
REGRESION LINEAL: Ajuste de una línea recta por mínimos cuadrados

Para determinar los valores de 𝒂𝟎 y 𝒂𝟏 , la ecuación (anterior) se deriva con respecto a cada
uno de los coeficientes:

Observe que hemos simplificado los símbolos de la sumatoria; a menos que se indique otra
cosa, todas las sumatorias van desde i = 1 hasta n. Al igualar estas derivadas a cero, se dará
como resultado un Sr mínimo. Si se hace esto, las ecuaciones se expresan como:
REGRESION LINEAL: Ajuste de una línea recta por mínimos cuadrados

Ahora, si observamos que Σ𝒂𝟎 = 𝒏𝒂𝟎 , expresamos las ecuaciones como un conjunto de dos
ecuaciones lineales simultáneas, con dos incógnitas (𝒂𝟎 y 𝒂𝟏 ):

Éstas se llaman ecuaciones normales, y se resuelven en forma simultánea

Este resultado se utiliza conjuntamente con la ecuación 𝒏𝒂𝟎 + ( 𝑿𝒊 )𝒂𝟏 = 𝒀𝒊 para obtener

donde Ῡ y Ẋ son las medias de Y y X, respectivamente.


REGRESION LINEAL: Ajuste de una línea recta por mínimos cuadrados

𝒏𝒂𝟎 + 𝑿𝒊 𝒂𝟏 = 𝒀𝒊

𝑿𝒊 𝒂𝟎 + 𝑿𝒊 𝟐 𝒂𝟏 = 𝑿𝒊 𝒀𝒊

𝒏𝒂𝟎 + 𝑿𝒊 𝒂𝟏 = 𝒀𝒊
EJEMPLO: Ajuste de una línea recta por mínimos cuadrados

A siete estudiantes enfermos de sus dedos por tanto estudiar con lapiceros convencionales,
se quiere averiguar la línea de tendencia que une dichos procesos de enfermedad. Los
datos son los siguientes:

ESTUDIANTE PESO (Gr) ẋi*Ῡi Xi^2 n 7


1 0,5 0,5 1
SῩi 24,0
2 2,5 5,0 4
3 2,0 6,0 9 Sẋi 28
4 4,0 16,0 16 Ῡ 3,43
5 3,5 17,5 25 ẋ 4,00
6 6,0 36,0 36
7 5,5 38,5 49,0
119,5 140,0 a1 0,839
a0 0,071

𝑦 = 0,0714285 + 0,83 2857𝑋


REGRESION POR MINIMOS
COEFICIENTE DE CORRELACION:
MÍNIMOS CUADRADOS: coeficiente de correlación

Cualquier otra línea diferente a la calculada en el ejemplo dará


como resultado una suma mayor de los cuadrados de los
residuos. Así, la línea es única y, en términos de nuestro criterio
elegido, es la “mejor” línea a través de los puntos.

Varias propiedades de este ajuste se observan al examinar más


de cerca la forma en que se calcularon los residuos. Recuerde que
la suma de los cuadrados se define como [ecuación mostrada].

En el primer caso, el cuadrado del residuo representa el cuadrado


de la discrepancia entre el dato y una estimación de la medida de
tendencia central: la media. En la ecuación, el cuadrado del
residuo representa el cuadrado de la distancia vertical entre el
dato y otra medida de tendencia central: la línea recta.
MÍNIMOS CUADRADOS: coeficiente de correlación

La analogía se puede extender aún más en casos Donde: a Sy/x se le llama error
donde estándar del estimado. El subíndice
“y/x” designa que el error es para un
1. la dispersión de los puntos alrededor de la línea valor predicho de y correspondiente a
es de magnitud similar en todo el rango de los un valor particular de X. También,
datos. observe que ahora dividimos entre n–2
2. la distribución de estos puntos cerca de la línea debido a que se usaron dos datos
es normal. estimados (𝒂𝟎 y 𝒂𝟏 ), para calcular Sr;
así, se han perdido dos grados de
Es posible demostrar que si estos criterios se libertad. Como lo hicimos en nuestro
cumplen, la regresión por mínimos cuadrados análisis para la desviación estándar,
proporcionará la mejor (es decir, la más adecuada) otra justificación para dividir entre n–2
estimación de 𝒂𝟎 y 𝒂𝟏 (Draper y Smith, 1981). Esto es que no existe algo como “datos
se conoce en estadística como el principio de dispersos” alrededor de una línea
máxima verosimilitud. Además, si estos criterios se recta que une dos puntos. De esta
satisfacen, una “desviación estándar” para la línea manera, en el caso donde n=2, la
de regresión se determina como sigue: ecuación da un resultado sin sentido,
infinito.
MÍNIMOS CUADRADOS: coeficiente de correlación

Así como en el caso de la desviación estándar, el error estándar


del estimado cuantifica la dispersión de los datos. Aunque, Sy/x
cuantifica la dispersión alrededor de la línea de regresión, como
se muestra en la figura b, a diferencia de la desviación estándar
original Sy que cuantifica la dispersión alrededor de la media
figura a.

Los conceptos anteriores se utilizan para cuantificar la “bondad”


de nuestro ajuste. Esto es en particular útil para comparar
diferentes regresiones (figura a y b). Para hacerlo, regresamos
a los datos originales y determinamos la suma total de los
cuadrados alrededor de la media para la variable dependiente
(en nuestro caso, y). Esta cantidad se designa por St. Ésta es la
magnitud del error residual asociado con la variable
dependiente antes de la regresión.
MÍNIMOS CUADRADOS: coeficiente de correlación

Así como en el caso de la desviación estándar, el error estándar del estimado


cuantifica la dispersión de los datos. Aunque, Sy/x cuantifica la dispersión
alrededor de la línea de regresión

Después de realizar la regresión, calculamos Sr, es decir, la suma de los


cuadrados de los residuos alrededor de la línea de regresión.

Esto caracteriza el error residual que queda después de la regresión. Es por lo


que, algunas veces, se le llama la suma inexplicable de los cuadrados. La
diferencia entre estas dos cantidades, St – Sr , cuantifica la mejora o
reducción del error por describir los datos en términos de una línea recta en
vez de un valor promedio. Como la magnitud de esta cantidad depende de la
escala, la diferencia se normaliza a St para obtener:
MÍNIMOS CUADRADOS: coeficiente de correlación

Donde r2 se conoce como el coeficiente de determinación y r es el


coeficiente de correlación (= 𝑟 2 ). En un ajuste perfecto, 𝑆𝑟 = 0 y 𝑟 = 𝑟 2 = 1,
significa que la línea explica el 100% de la variabilidad de los datos.

Si 𝑟 = 𝑟 2 = 0 , Sr = St el ajuste no representa alguna mejora. Una


representación alternativa para r que es más conveniente para implementarse
en una computadora es:
EJEMPLO: Ajuste de una línea recta por mínimos cuadrados
A siete estudiantes enfermos de sus dedos por tanto estudiar con lapiceros convencionales,
se quiere averiguar la línea de tendencia que une dichos procesos de enfermedad. Los
datos son los siguientes:

ESTUDIANTE PESO (Gr)


1 0,5
2 2,5
3 2,0
4 4,0
5 3,5
6 6,0
7 5,5
REGRESION POLINOMIAL:
REGRESION POLINOMIAL
En la ingeniería, aunque algunos datos exhiben un patrón marcado, como
el que se advierte en la figura, son pobremente representados por una
línea recta, entonces, una curva podrá ser más adecuada para ajustarse a
los datos. un método para lograr este objetivo es utilizar transformaciones.
𝒀 = 𝒂𝟎 + 𝒂𝟏 𝒙 + 𝒆 Otra alternativa es ajustar polinomios a los datos mediante regresión
polinomial.

El procedimiento de mínimos cuadrados se puede extender fácilmente al


ajuste de datos con un polinomio de grado superior. Por ejemplo, suponga
que ajustamos un polinomio de segundo grado o cuadrático:

En este caso, la suma de los cuadrados de los residuos es


REGRESION POLINOMIAL

Al seguir el procedimiento de la sección anterior, obtenemos la derivada de


la ecuación con respecto a cada uno de los coeficientes desconocidos del
polinomio.

Estas ecuaciones se igualan a cero y se reordenan para desarrollar el


siguiente conjunto de ecuaciones normales:
REGRESION POLINOMIAL
Donde todas las sumatorias van desde i = 1 hasta n. Observe que las tres
ecuaciones anteriores son lineales y tienen tres incógnitas: 𝒂𝟎 , 𝒂𝟏 y 𝒂𝟐 . Los
coeficientes de las incógnitas se evalúan de manera directa, a partir de los
datos observados.

Observamos que el problema de determinar un polinomio de segundo grado


por mínimos cuadrados es equivalente a resolver un sistema de tres
ecuaciones lineales simultáneas. El caso bidimensional se extiende con
facilidad a un polinomio de m-ésimo grado como sigue:

El análisis anterior se puede extender fácilmente a este caso más general.


Así, se reconoce que la determinación de los coeficientes de un polinomio de
m-ésimo grado es equivalente a resolver un sistema de m+1 ecuaciones
lineales simultáneas. En este caso, el error estándar Sx/y se formula como
sigue:
EJEMPLO: Ajuste de una línea recta por mínimos cuadrados
ajustar los siguientes datos a una regresión polinomica:

Xi Yi
0 2,1
1 7,7
2 13,6
3 27,2
4 40,9
5 61,1
EJEMPLO: Ajuste de una línea (Extensión mínimos cuadrados)

ajustar los siguientes datos a una regresión polinomica:

Xi Yi
Media 25,43 Syi 152,6
0 2,1
m 2 S(xi^2) 55,00
1 7,7
n 6 S(xi^3) 225,00
2 13,6
Ẋ 2,50 S(xi^4) 979,00
3 27,2
ȳ 25,43 S(xi*yi) 585,60
4 40,9
Sxi 15 S((xi^2)*yi) 2488,80
5 61,1

6 𝑎0 + 15 𝑎1 + 55 𝑎2 = 152,6
Xi Yi (Yi-ȳ)^2 Xi^2 Xi^3 Xi^4 Xi*yi Xi^2*yi
0 2,1 544,44 0,00 0,00 0,00 0,00 0,00 15 𝑎0 + 55 𝑎1 + 225 𝑎2 = 585,60
1 7,7 314,47 1,00 1,00 1,00 7,70 7,70
55 𝑎0 + 225 𝑎1 + 7 𝑎2 = 2488,80
2 13,6 140,03 4,00 8,00 16,00 27,20 54,40
3 27,2 3,12 9,00 27,00 81,00 81,60 244,80
4 40,9 239,22 16,00 64,00 256,00 163,60 654,40 6 15 55 𝑎0 152,6
5 61,1 1272,11 25,00 125,00 625,00 305,50 1527,50 15 55 225 𝑎1 = 585,60
15 152,6 2513,39 55,00 225,00 979,00 585,60 2488,80 55 225 7 𝑎2 2488,80
EJEMPLO: Ajuste de una línea recta por mínimos cuadrados
ajustar los siguientes datos a una regresión polinomica:
Xi Yi
0 2,1 6 𝑎0 + 15 𝑎1 + 55 𝑎2 = 152,6
1 7,7
2 13,6 15 𝑎0 + 55 𝑎1 + 225 𝑎2 = 585,60
3 27,2
4 40,9
55 𝑎0 + 225 𝑎1 + 7 𝑎2 = 2488,80
5 61,1
𝑎0 = 2.47857
𝑌 = 2,47857 + 2,35 2 𝑋1 + 1,86071𝑋2
𝑎1 = 2.35929
𝑎2 = 1.86071
(Yi-a0-a1X1-a2Xi2)2
0,14332
1,00286
1,08158
0,80491
0,61951
0,09439
3,74657
EJEMPLO: Ajuste de una línea recta por mínimos cuadrados
Xi Yi
0 2,1 6 𝑎0 + 15 𝑎1 + 55 𝑎2 = 152,6
1 7,7
2 13,6
15 𝑎0 + 55 𝑎1 + 225 𝑎2 = 585,60
3 27,2 55 𝑎0 + 225 𝑎1 + 7 𝑎2 = 2488,80
4 40,9
5 61,1

Conclusión: Estos resultados indican que con el modelo se explicó el 99.851% de la


incertidumbre original. Este resultado apoya la conclusión de que la ecuación
cuadrática representa un excelente ajuste.
INTERPOLACION:
INTERPOLACION

Con frecuencia se encontrará con que tiene que estimar valores intermedios
entre datos definidos por puntos. El método más común que se usa para este
propósito es la interpolación polinomial.

Polinomio de n-esimo grado

Dados n+1 puntos, hay uno y sólo un polinomio de grado n que pasa a través
de todos los puntos. Por ejemplo, hay sólo una línea recta (es decir, un
polinomio de primer grado) que une dos puntos (figura a). De manera similar,
únicamente una parábola une un conjunto de tres puntos (figura b). La
interpolación polinomial consiste en determinar el polinomio único de n-
ésimo grado que se ajuste a n + 1 puntos. Este polinomio, entonces,
proporciona una fórmula para calcular valores intermedios.
INTERPOLACIÓN POLINOMIAL DE NEWTON
EN DIFERENCIAS DIVIDIDAS

INTERPOLACIÓN LINEAL: La forma más simple de interpolación


consiste en unir dos puntos con una línea recta. Dicha técnica,
llamada interpolación lineal, se ilustra de manera gráfica en la figura.
Utilizando triángulos semejantes,

Que es una fórmula de interpolación lineal. La notación 𝒇𝟏 (𝒙)


designa que éste es un polinomio de interpolación de primer grado.
Observe que además de representar la pendiente de la línea que une
los puntos, el término 𝒇 𝑿𝟏 − 𝒇 𝑿𝟎 / 𝑿𝟏 − 𝑿𝟎 es una aproximación
en diferencia dividida finita a la primer derivada. cuanto menor sea el
intervalo entre los datos, mejor será la aproximación. Esto se debe al
hecho de que, conforme el intervalo disminuye, una función continua
estará mejor aproximada por una línea recta.
INTERPOLACIÓN POLINOMIAL DE NEWTON EN DIFERENCIAS DIVIDIDAS

INTERPOLACIÓN CUADRÁTICA: Una estrategia para mejorar la


estimación consiste en introducir alguna curvatura a la línea que une
los puntos. Si se tienen tres puntos como datos, éstos pueden
ajustarse en un polinomio de segundo grado (también conocido como
polinomio cuadrático o parábola). Una forma particularmente
conveniente para ello es:
Agrupando
términos

Donde:

Así, las ecuaciones anteriores son formas alternativas, equivalentes del único polinomio
de segundo grado que une los tres puntos. Un procedimiento simple puede usarse para
determinar los valores de los coeficientes. Para encontrar 𝒃𝟎 , en la ecuación se evalúa
con 𝑿 = 𝑿𝟎 para obtener: 𝒃𝟎 = 𝒇(𝑿𝟎 )
INTERPOLACIÓN POLINOMIAL DE NEWTON EN DIFERENCIAS DIVIDIDAS

La ecuación 𝒃𝟎 = 𝒇 𝑿𝟎 se sustituye en la
después se evalúa en 𝑿 = 𝑿𝟏 para obtener:

Por ultimo para obtener 𝒃𝟐

Debemos examinar la forma del coeficiente 𝒃𝟐 . Es muy similar a la aproximación en


diferencias divididas finitas de la segunda derivada. Así, la ecuación comienza a
manifestar una estructura semejante a la expansión de la serie de Taylor. Esta
observación será objeto de una mayor exploración cuando relacionemos los polinomios
de interpolación de Newton con la serie de Taylor.
FORMA GENERAL DE LOS POLINOMIOS DE INTERPOLACIÓN DE NEWTON

El análisis anterior puede generalizarse para ajustar un


polinomio de n-ésimo grado a n+1 datos. El polinomio de n-
ésimo grado es:

Como se hizo antes con las interpolaciones lineales y


cuadráticas, los puntos asociados con datos se utilizan para
evaluar los coeficientes 𝒃𝟎 , 𝒃𝟏 ,..., 𝒃𝒏 . Para un polinomio de n-
ésimo grado se requieren n+1 puntos: [ 𝑿𝟎 , 𝒇(𝑿𝟎 )] , [ 𝑿𝟏 ,
𝒇(𝑿𝟏 )],..., [𝑿𝒏 , 𝒇(𝑿𝒏 )]. Usamos estos datos y las siguientes
ecuaciones para evaluar los coeficientes:

donde las evaluaciones de la función colocadas entre paréntesis


son diferencias divididas finitas. Por ejemplo, la primera
diferencia dividida finita en forma general se representa como:
FORMA GENERAL DE LOS POLINOMIOS DE INTERPOLACIÓN DE NEWTON
La segunda diferencia dividida finita, que representa la
diferencia de las dos primeras diferencias divididas, se
expresa en forma general como:

En forma similar, la n-ésima diferencia dividida finita es:

Estas diferencias sirven para evaluar los coeficientes en las ecuaciones, los cuales se sustituirán para
obtener el polinomio de interpolación.
FORMA GENERAL DE LOS POLINOMIOS DE INTERPOLACIÓN DE NEWTON

Se conoce como polinomio de interpolación de Newton en diferencias divididas.

• Debe observarse que no se requiere que los datos utilizados en la ecuación


estén igualmente espaciados o que los valores de la abscisa estén en orden
ascendente.

• También, advierta cómo las ecuaciones son recursivas (es decir, las
diferencias de orden superior se calculan tomando diferencias de orden
inferior. Tal propiedad se aprovechará cuando desarrollemos un programa
computacional para implementar el método.
LINEALIZACION DE ECUACIONES NO
LINEALES (TRANSFORMACIONES):
LINEALIZACION DE ECUACIONES

La regresión lineal ofrece una poderosa técnica para ajustar una mejor
línea a los datos. Sin embargo, se considera el hecho de que la relación
entre las variables dependiente e independiente es lineal.

Éste no es siempre el caso, y el primer paso en cualquier análisis de


regresión deberá ser graficar e inspeccionar los datos en forma visual,
para asegurarnos que sea posible usar un modelo lineal.

Por ejemplo, la figura, muestra algunos datos que obviamente son


curvilíneos. En algunos casos, las técnicas como la regresión polinomial,
son apropiadas. En otros, se pueden utilizar transformaciones para
expresar los datos en una forma que sea compatible con la regresión
lineal. Un ejemplo es el modelo exponencial.
LINEALIZACION DE ECUACIONES

En el modelo exponencial 𝜶𝟏 y 𝜷𝟏 son constantes. Este modelo se


emplea en muchos campos de la ingeniería para caracterizar cantidades
que aumentan (𝜷𝟏 positivo) o disminuyen (𝜷𝟏 negativo), a una velocidad
que es directamente proporcional a sus propias magnitudes. Por
ejemplo, el crecimiento poblacional o el decaimiento radiactivo tienen
este comportamiento.

Figura (a) Como se ilustra en la figura a, la ecuación representa una relación no


lineal (para 𝜷𝟏 ≠ 0) entre Y y X.

Otro ejemplo de modelo no lineal es la ecuación de potencias

Donde 𝜶𝟐 y 𝜷𝟐 son coeficientes constantes. Este modelo tiene muchas


aplicaciones en todos los campos de la ingeniería. Como se ilustra en la
figura b, la ecuación (para 𝜷𝟐 ≠ 0 o 1) es no lineal.

Figura (b)
LINEALIZACION DE ECUACIONES

Un tercer ejemplo de un modelo no lineal es la ecuación de razón del


crecimiento

donde 𝜶𝟑 y 𝜷𝟑 son coeficientes constantes. Este modelo


particularmente es adecuado para caracterizar la razón de crecimiento
poblacional bajo condiciones limitantes, también representa una relación
no lineal entre Y y X que se iguala o “satura”, conforme X aumenta.

Figura (c) Hay técnicas de regresión no lineal disponibles para ajustar estas
ecuaciones de manera directa a datos experimentales. una alternativa
simple consiste en usar manipulaciones matemáticas para transformar
las ecuaciones en una forma lineal. Después, se utiliza la regresión
lineal simple para ajustar las ecuaciones a los datos.
LINEALIZACION DE ECUACIONES

ECUACION LINEALIZACION DESCRIPCION


Modelo exponencial - La ecuación se linealiza a partir
del logaritmo natural: una gráfica de 𝒍𝒏 y contra 𝑋 dará
una línea recta con una pendiente 𝜷𝟑 y una
intersección con el eje de las ordenadas igual a 𝒍𝒏 𝜶𝟏
Modelo de potencias - La ecuación es linealizada al
aplicar el logaritmo de base 10: De este modo, una
gráfica de 𝒍𝒐𝒈 𝒚 contra 𝒍𝒐𝒈 𝒙 dará una línea recta con
pendiente 𝜷𝟐 e intersección con el eje de las
ordenadas 𝐥𝐨𝐠 𝜶𝟐
Modelo no lineal - La ecuación es linealizada al
invertirla para dar: De esta forma, una gráfica de 𝟏/𝒚
contra 𝟏/𝒙 será lineal, con pendiente 𝜷𝟑 /𝜶𝟑 y una
intersección con el eje de las ordenadas 1/𝜶𝟑
LINEALIZACION
Modelo
exponencial

Modelo
de LINEALIZACION
potencias

Modelo
LINEALIZACION no
lineal
Y=0,5*(X^1,75) log X Vs log Y y = 1,7517x - 0,3002
R² = 1
9,000 8,359 1,000
0,924
8,000
0,800
0,756
7,000
5,657 0,600
6,000

log X
0,531
5,000 0,400
Eje Y

4,000 3,419
0,200 0,230
3,000
1,682
2,000 0,000
0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800
1,000 0,500 𝑌= 0,5𝑋1,75
-0,200
0,000 -0,301
0 1 2 3 4 5 6
-0,400
Eje X log Y

Log Y
-0,301
0,226
0,534
0,753
0,922

Así, la intersección con el eje de las ordenadas es 𝒍𝒐𝒈 𝜶𝟐 es igual a


–0.300 y, por lo tanto, al tomar el antilogaritmo, 𝜶𝟐 = 𝟏𝟎−𝟎,𝟑 =
𝟎. 𝟓 La pendiente es 𝛽2 = 1.75 En consecuencia, la ecuación de
potencias es 𝒚 = 𝟎. 𝟓𝑿𝟏,𝟕𝟓
VARIABLES
Y
FUNCIONES:
DATOS ESTADISTICOS

LOS DATOS: son colecciones de cualquier cantidad de observaciones relacionadas.


Podemos recopilar el número de teléfonos que diferentes empleados instalan en un día
dado o el número de teléfonos que instala un trabajador dado durante un día en un periodo
de varios días, y podemos llamar datos a estos resultados. Una colección de datos se conoce
como conjunto de datos; una sola observación es un dato puntual.

RECOLECCIÓN DE DATOS

Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones razonadas acerca de las causas y,
por tanto, de los efectos probables de ciertas características en situaciones dadas. El conocimiento de tendencias
derivado de la experiencia previa puede, también, permitir anticipar resultados posibles y actuar en consecuencia. (L.
Pag.8)

Cuando los datos se ordenan de manera compacta y útil, los responsables de tomar decisiones pueden obtener
información confiable sobre el entorno y usarla para tomar decisiones inteligentes. En la actualidad, las computadoras
permiten a los especialistas en estadística recolectar enormes volúmenes de observaciones y comprimirlas en tablas,
gráficas y cifras instantáneamente. (L. Pag.9)
DATOS ESTADISTICOS
RECOLECCIÓN DE DATOS

Éstas son formas compactas y útiles, pero ¿son confiables? Recuerde que los datos producidos por una
computadora son tan precisos como los datos que entraron en ella. Como dicen los programadores,
¡“BEBS”! o ¡“basura entra, basura sale!”. Los administradores deben tener mucho cuidado y cerciorarse que
los datos empleados estén basados en suposiciones e interpretaciones correctas. Antes de depositar nuestra
confianza en cualquier conjunto de datos interpretados, vengan de una computadora o no, póngalos a prueba
mediante las siguientes preguntas:

1. ¿De dónde vienen los datos? ¿La fuente es tendenciosa?, es decir, ¿es posible que exista interés
en proporcionar datos que conduzcan a cierta conclusión más que a otras?

2. ¿Los datos apoyan o contradicen otras evidencias que se tienen?

3. ¿Hace falta alguna evidencia cuya ausencia podría ocasionar que se llegue a una conclusión diferente?

4. ¿Cuántas observaciones se tienen? ¿Representan a todos los grupos que se desea estudiar?

5. ¿La conclusión es lógica? ¿Se ha llegado a conclusiones que los datos no confirman? (L. Pag.9)
DATOS ESTADISTICOS: MUESTRAS POBLACIONES

DIFERENCIA ENTRE MUESTRAS Y POBLACIONES

Los expertos en estadística recogen datos en una muestra y utilizan esta información para hacer inferencias
sobre la población que representa esa muestra. Así, una población es un todo y una muestra es una fracción
o segmento de ese todo.

El estudio de una muestra es más sencillo que el de la población completa, cuesta menos y lleva menos
tiempo. A menudo, Ejem: probar la resistencia de una parte de avión implica destruirla en su totalidad; en
consecuencia, es deseable probar la menor cantidad de partes.

En algunas ocasiones, la prueba implica un riesgo humano; el uso de muestras disminuye ese riesgo a un
nivel aceptable. Por último, se ha probado que incluso el examen de una población entera deja pasar algunos
elementos defectuosos. Por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Si usted se
pregunta cómo puede suceder esto, Ejem: piense en lo cansado y poco animoso que estaría si tuviera que
observar de manera continua miles y miles de productos en una banda continua.
DATOS ESTADISTICOS: MUESTRAS POBLACIONES

 Una población es un conjunto de todos los elementos que estamos estudiando,


acerca de los cuales intentamos sacar conclusiones. Debemos definir esa
población de modo que quede claro cuándo cierto elemento pertenece o no a
la población.

 Una muestra es una colección de algunos elementos de la población, no de


todos. Ejem: Una porción grande de relleno de frambuesas con sólo algunas
migajas en una muestra de tarta, pero no es una muestra representativa debido
a que las proporciones de los ingredientes no son las mismas en la muestra
que en el todo.

 Una muestra representativa contiene las características relevantes de la


población en las mismas proporciones en que están incluidas en tal población.
Muestreo probabilístico

Muestreo aleatorio con reemplazamiento

Muestreo aleatorio sin reemplazamiento

Muestreo estratificado

TIPOS Muestreo por conglomerados


DE Muestreo por áreas
MUESTREO
(General) Muestreo bietapico o polietapico

Muestreo sistemático

Muestreo polifásico

Muestreo por sub muestras interpretantes

Muestreo repetido (muestras especiales)


TIPOS DE MUESTREO

1, MUESTREO PROBABILISTICO 2, MUESTREO NO PROBABILISTICO


1,1 MAS (muestreo aleatorio simple) 2,1 Muestreo por cuotas
1,2 Muestreo aleatorio sistemático 2,2 Muestreo intencional o de conveniencia
1,3 Muestreo aleatorio estratificado 2,3 Muestreo bola de nieve
1,4 Muestreo aleatorio por conglomerados 2,4 Muestreo discrecional
TIPOS DE MUESTREO PROBABILISTICO

CARACTERISTICAS VENTAJAS INCONVENIENTES


Aleatorio simple Se selecciona una muestra de • Sencillo y de fácil comprensión. • Requiere que se posea de
tamaño n de una población de N • Cálculo rápido de medias y antemano un listado
unidades, cada elemento tiene una varianzas. completo de toda la
probabilidad de inclusión igual y • Se basa en la teoría estadística, población.
conocida de n/N. y por tanto existen paquetes • Cuando se trabaja con
informáticos para analizar los muestras pequeñas es
datos. posible que no represente a
la población
adecuadamente.
Sistemático • Conseguir un listado de los N • Fácil de aplicar. • Si la constante de muestreo
elementos de la población • No siempre es necesario tener está asociada con el
• Determinar tamaño muestral n. un listado de toda la fenómeno de interés, las
• Definir un intervalo k= N/n. población. estimaciones obtenidas a
• Elegir un número aleatorio, r, • Cuando la población está partir de la muestra pueden
entre 1 y k (r= arranque ordenada siguiendo una contener sesgo de selección
aleatorio). tendencia conocida, asegura
• Seleccionar los elementos de la una cobertura de unidades de
lista. todos los tipos.
TIPOS DE MUESTREO PROBABILISTICO

CARACTERISTICAS VENTAJAS INCONVENIENTES


Estratificado En ciertas ocasiones resultará • Tiende a asegurar que la muestra • Se ha de conocer la
conveniente estratificar la muestra represente adecuadamente a la distribución en la
según ciertas variables de interés. Para población en función de unas población de las
ello debemos conocer la composición variables seleccionadas. variables utilizadas
estratificada de la población objetivo a • Se obtienen estimaciones más para la
hacer un muestreo. Una vez calculado precisa estratificación.
el tamaño muestral apropiado, este se • Su objetivo es conseguir una
reparte de manera proporcional entre muestra lo más semejante posible
los distintos estratos definidos en la a la población en lo que a la o las
población usando una simple regla de variables estratificadoras se refiere.
tres.
Conglomerados • Se realizan varias fases de muestreo • Es muy eficiente cuando la • El error estándar es
sucesivas (polietápico) población es muy grande y mayor que en el
dispersa. muestreo aleatorio
• La necesidad de listados de las • No es preciso tener un listado de simple o estratificado.
unidades de una etapa se limita a toda la población, sólo de las • El cálculo del error
aquellas unidades de muestreo unidades primarias de muestreo. estándar es complejo.
seleccionadas en la etapa anterior.
PRESENTACION DE DATOS:
(Levin Cap.2)
AGRUPACIÓN Y PRESENTACIÓN DE DATOS : TABLAS Y GRÁFICAS

Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una colección de datos se
conoce como conjunto de datos; una sola observación es un dato puntual.

¿Qué representan estos datos?

Los datos no necesariamente son información; tener más datos no necesariamente produce mejores
decisiones. La meta es resumir y presentar los datos de manera útil para apoyar la toma de decisiones
efectiva y ágil.

La razón por la que los datos deben organizarse es ver si existe un patrón en ellos, patrones como el valor
más grande y el más pequeño, o el valor alrededor del cual parecen agruparse. Si los datos provienen de
una muestra, se suponen representativos de la población de la que se tomaron. Todos los buenos
estadísticos (y usuarios de datos) reconocen que usar datos sesgados o incompletos no conduce a las
mejores decisiones.
DATOS Y DISTRIBUCION DE FRECUENCIA

¿Cuál es el mayor y el menor de los datos, cual esta exactamente en la mitad?

Datos ordenados

VENTAJAS AL ORDENAR DATOS

1. Podemos identificar los valores mayor y menor rápidamente.


2. Es fácil dividir los datos en secciones.
3. Podemos ver si algunos valores aparecen más de una vez en el arreglo.
4. Podemos observar la distancia entre valores sucesivos de los datos.
DATOS Y DISTRIBUCION DE FRECUENCIA

3,8 4,3 2,0 5,5 4,9


Datos ventas de tiendas 4,0 4,7 3,4 5,5 4,9
de autoservicio 4,7 5,5 4,1 3,4 4,1
4,8 5,5 4,2 3,8 4,1

Los intervalos tienen por lo general tienen el mismo ancho y el ancho debe ser numero impar.

FORMAS PARA DETERMINAR LOS INTERVALOS DE CLASE

¿Por que se usa en una ecuación “n” y en otra “N”?


(Regla de Sturges)

(Regla de Sturges)
Otras formas: (Regla de Scott´s) sin factor de corrección
(Regla de Freedman) Usa intercuartiles
Rango (R) = Dato mayor valor – dato menor valor

Ancho de las clases = R/K

S-ar putea să vă placă și