Sunteți pe pagina 1din 6

AJUSTE DE CURVAS POR MNIMOS CUADRADOS USANDO MATLAB Mara E. Ascheri, Rubn A.

Pizarro
Departamento de Matemtica - Facultad de Ciencias Exactas y Naturales - Universidad Nacional de La Pampa. Uruguay 151 - (6300) - Santa Rosa (LP) - Argentina. e-mail: mavacheri@exactas.unlpam.edu.ar - Tel:. 02954-425166 - Fax: 02954-432679 Tema: Experiencia de Ctedra en docencia e investigacin en matemtica. Trabajo Original.

RESUMEN
A menudo se dispondr de un conjunto de datos representados por puntos y se desear ajustar curvas a dicho conjunto de datos. Los mtodos desarrollados para el ajuste de curvas dependen de la incertidumbre de los datos. El objetivo de este trabajo es introducir a los alumnos de Clculo Numrico, en el uso de la tcnica de ajuste de curvas por medio de la regresin con mnimos cuadrados en la solucin de problemas de ingeniera, de fsica y de matemtica aplicada, en general, utilizando el paquete MATLAB. Esta tcnica, les permitir resolver diferentes problemas cientficos y tecnolgicos, entre los que se encuentran los problemas que se deben afrontar frecuentemente en la prctica de la ingeniera. Adems de que se espera que los alumnos asimilen y dominen los conceptos especficos impartidos referidos a la regresin, se pretende que comprueben lo indispensable de la utilizacin de la computadora para resolver este tipo de problemas. Tambin se espera, a partir de las distintas actividades propuestas a realizar por los alumnos, que observen y reconozcan cundo la regresin con mnimos cuadrados resulta apropiada, arribando as a resultados satisfactorios. En resumen, se espera que los alumnos hayan aprendido a valorar la confiabilidad de las respuestas y ser capaces de escoger el mejor mtodo (o mtodos) para resolver los problemas que se les presenten.

INTRODUCCIN
Durante el desarrollo del curso "Clculo Numrico" describimos los mtodos numricos aplicados, a alumnos de tercer ao de las carreras: Ingeniera en Electrnica, Ingeniera Civil, Licenciatura en Fsica y Profesorado en Matemtica. Entre los objetivos propuestos en este curso podemos citar los siguientes: 1. que sea fcilmente comprensible para los alumnos con un conocimiento mnimo de matemticas; 2. capacitar a los alumnos para que practiquen los mtodos numricos en una computadora; 3. elaborar programas simples que puedan usarse de manera sencilla en aplicaciones cientficas; 4. proporcionar software que resulte fcil de comprender. La importancia de los mtodos numricos ha aumentado de forma drstica en la enseanza de la ingeniera y la ciencia, lo cual refleja el uso actual y sin precedentes de las computadoras. El desarrollo de un programa siempre es importante en el aprendizaje de mtodos numricos. Cuando los alumnos implementen con buen resultado los mtodos numricos en una computadora personal y los apliquen para resolver problemas que de otro modo resultan intratables, entonces tendrn una demostracin tangible de cmo les pueden ayudar las computadoras para su desarrollo profesional. Nuestra actitud previa era que cualquier lenguaje de programacin que los alumnos supieran podra resultar adecuado. Sin embargo, teniendo en cuenta que muchos de los alumnos que se matriculan en este curso no han aprendido o no tienen la prctica suficiente de computacin, que el paquete MATLAB se ha convertido en una herramienta para casi todos los campos de la ingeniera y de la matemtica aplicada, y que sus versiones nuevas han mejorado los aspectos de programacin, hemos pensado que los alumnos emplearn su tiempo de manera ms fcil y productiva si utilizan este paquete. Como profesores responsables del dictado de la asignatura "Clculo Numrico", hemos implementado en la misma el uso del paquete MATLAB, versin 5.1, lo cual nos ha facilitado el proceso de enseanza - aprendizaje de los mtodos numricos desarrollados a lo largo de todo el curso.

DESARROLLO
En la ciencia y en la ingeniera se da, a menudo, el caso de que un experimento produce un conjunto de datos (x1, y1),,(xn, yn), siendo las abscisas {xi} distintas entre s. Uno de los objetivos del

clculo numrico es la determinacin de una frmula y = f(x) que relacione las variables. Normalmente se dispone de una clase de frmulas previamente establecidas, y lo que hay que hallar son los valores ms adecuados de unos coeficientes o de unos parmetros para estas frmulas. Aunque hay muchos tipos distintos de funciones que se pueden usar, suele ocurrir que existe un modelo matemtico subyacente basado en la situacin fsica que se est estudiando, que determina la forma de la funcin salvo algunos coeficientes. Los alumnos han visto cmo se construye un polinomio cuya grfica pase por todos los puntos de un conjunto dado. Si todos los valores {xi}, {yi} se conocen con una precisin de varias cifras significativas, entonces la interpolacin polinomial produce buenos resultados, lo que no ocurre en otras circunstancias. Algunos experimentos se llevan a cabo con una maquinaria especializada que permite obtener los datos con varias cifras significativas de precisin; sin embargo, muchos experimentos se realizan con un equipamiento de, como mucho, dos o tres cifras significativas. A sto se aade, a menudo, un cierto error experimental de las mediciones de forma que, aunque se calculen tres o cuatro cifras de los valores {xi} e {yi}, sucede que el valor exacto f (xi) verifica f (xi) = yi + ci, donde ci es el error de la medicin. Cmo se encuentra la mejor aproximacin que pase cerca (no por encima de cada uno) de los puntos?. Para responder a esta pregunta introducimos el concepto del error cuadrtico medio. Un ajuste ptimo es aqul que minimiza este error (problema de mnimos cuadrados). El error cuadrtico medio es la eleccin tradicional porque es mucho ms fcil de minimizar computacionalmente que otros errores (por ejemplo, error mximo y error medio). El enfoque de mnimos cuadrados le da mucho ms peso a un punto que est fuera de la tendencia de los datos, pero no permite que el punto domine completamente a la aproximacin. Con base en la teora estadstica, con este mtodo, conocido con el nombre de regresin con mnimos cuadrados, se encuentra algn tipo de funcin que con mayor probabilidad se aproxima a los valores verdaderos. Hemos desarrollado la teora bsica para investigar todo lo referido al ajuste de curvas por medio de la regresin con mnimos cuadrados. Primero se aprendi a ajustar "la mejor" lnea recta a travs de un conjunto de datos inciertos (regresin lineal). Luego se analiz el ajuste potencial, se estudi una tcnica general para ajustar "al mejor" polinomio (regresin polinomial) y se analiz el hecho de que en algunos casos es ms apropiado efectuar transformaciones que expresen los datos de manera que sean compatibles con la regresin lineal. Presentamos una amplia variedad de problemas que ayudarn a mejorar las habilidades de los alumnos, tanto en el conocimiento de la teora como en la prctica del ajuste de curvas por medio de la regresin con mnimos cuadrados. Con la misma finalidad presentamos adems, algunas actividades referidas a resolver problemas reales de ingeniera y de matemtica aplicada, en general. Las tareas de computacin con el paquete MATLAB que proponemos, sirven para que los alumnos tengan la oportunidad de practicar sus habilidades en la computacin cientfica y adems, para que los ayude a realizar la componente numrica de los ejercicios que deban resolver en el laboratorio. Los siguientes casos de estudio son una muestra de aquellos que en forma rutinaria se encuentran en los estudios superiores. Ms an, son problemas representativos de aquellos que se encontrarn en la vida profesional. Los clculos hechos en una computadora debern ser presentados por los alumnos mediante tablas y grficos, de manera que les permitan visualizar e interpretar las aproximaciones numricas obtenidas. La Actividad 1 tomada de la fsica, muestra cmo se utiliza el ajuste potencial para modelar determinadas situaciones. La Actividad 2 tomada de la ingeniera qumica, demuestra cmo se puede linealizar un modelo no lineal y ajustarse a datos que usan regresin lineal. La Actividad 3 muestra que si los datos que se deben ajustar no son lineales y no presentan una naturaleza polinomial, entonces puede ocurrir que la curva resultante presente oscilaciones grandes (oscilacin polinomial). Esta actividad ilustra entonces, el hecho de que no se suelen usar polinomios de grado seis o mayor, a no ser que se sepa que la funcin de la que provienen los datos es un polinomio. Actividad 1 En 1601 el astrnomo alemn Johannes Kepler formul su tercera ley del movimiento planetario, T=Cx3/2, donde x es la distancia al sol medida en millones de kilmetros, T es el perodo orbital medido en das y C es una constante. Las parejas de datos (x, T) observados para los primeros cuatro planetas, Mercurio, Venus, La Tierra y Marte, son (58, 88), (108, 225), (150, 365) y (228, 687). Obtngase el coeficiente C por el mtodo de mnimos cuadrados y grafquese la curva junto con los puntos que representan a los datos. Escrbanse las conclusiones a las que se arribaron.

Resultados obtenidos por los alumnos:


Clculo de los coeficientes para un ajuste potencial

Distancia, xi 58 108 150 228

Perodo orbital, Ti 88 225 365 687

Ti xi3/2 38870.90592 252533.0076 670547.817 2365151.732 :3327103.461

xi3 195112 1259712 3375000 11852352 :16682176

El coeficiente es C = 0.199440616. La curva T = 0.199440616 x3/2 y las parejas de datos se muestran en la siguiente figura

El ajuste por mnimos cuadrados para los primeros cuatro planetas, T=0.199440616x3/2, usando la tercer ley de Kepler del movimiento planetario.

Conclusin a la que arribaron los alumnos luego de realizar esta actividad: El ajuste potencial ptimo en mnimos cuadrados para los cuatro primero planetas usando la tercera ley de Kepler del movimiento planetario, es aceptable. Actividad 2 Los modelos de crecimiento poblacional son importantes en muchos campos de la ingeniera. La suposicin de que la tasa de crecimiento de la poblacin (dp/dt) es proporcional a la poblacin actual (p) en el tiempo (t) es de fundamental importancia en muchos de los modelos, en forma de ecuacin

dp = kp , dt

(1)

en donde k es un factor de proporcionalidad conocido como la tasa de crecimiento especfico y tiene unidades de tiempo -1. Si k es una constante, entonces se puede obtener la solucin de la ecuacin (1) de la teora de ecuaciones diferenciales (2) p (t ) = p 0 e kt , en donde p0 es la poblacin en el tiempo t=0. Se observa que p(t) en la ecuacin (2) tiende a infinito a medida que t crece. Este comportamiento es claramente imposible en los sistemas reales. Por lo tanto, se debe modificar el modelo y hacerlo ms realista. Primero, se debe reconocer que la tasa de crecimiento especfico k no puede ser constante a medida que la poblacin crece. Esto es porque, cuando p tiende a infinito, el organismo que se modela se ve limitado por factores tales como el almacenamiento de comida y produccin de desperdicios txicos. Una manera de expresar esto matemticamente es la de usar el modelo de tasa de crecimiento y saturacin tal como

k = k mx

f , K+ f

(3)

en donde kmx es la mxima tasa de crecimiento posible para valores de comida (f) abundante y K es la constante de semi-saturacin. Vemos que cuando K = f, k= kmx /2. Por lo tanto, K es la cantidad de comida disponible que sostiene una tasa de crecimiento poblacional igual a la mitad de la tasa mxima. Las constantes K y kmx son valores empricos basados en medidas experimentales de k para varios valores de f. Como ejemplo, supngase que la poblacin p representa una levadura empleada en la produccin comercial de cerveza y f es la concentracin de la fuente de carbono a fermentarse. Las

medidas de k contra f de la levadura se muestran en el Cuadro 1. Se necesita calcular kmx y K de estos datos empricos.
Cuadro 1. Datos usados en la evaluacin de las constantes en un modelo de promedio de crecimiento de saturacin que caracteriza a la cintica microbial.

f, mg/l 7 9 15 25 40 75 100 150

k, das-1 0.29 0.37 0.48 0.65 0.80 0.97 0.99 1.07

sese el procedimiento de mnimos cuadrados lineal para determinar kmx y K y realcese el grfico correspondiente. Escrbanse adems, las conclusiones a las que se arribaron. Observacin. La ecuacin diferencial resultante se podr resolver usando los mtodos numricos que analizaremos oportunamente, cuando se conoce f(t). Resultados obtenidos por los alumnos: f, mg/l
7 9 15 25 40 75 100 150

k, das-1
0.29 0.37 0.48 0.65 0.80 0.97 0.99 1.07

Datos usados para la regresin lineal

1/f, L/mg
0.14286 0.11111 0.06667 0.04000 0.02500 0.01333 0.01000 0.00667

1/k,da
3.44828 2.70270 2.08333 1.53846 1.25000 1.03092 1.01010 0.93458

(1/f)2, L2/mg2
0.02041 0.01235 0.00444 0.00160 0.00063 0.00018 0.00010 0.00004

(1/f)(1/k), L/mg.da
0.49262 0.30030 0.13890 0.06154 0.03125 0.01374 0.01010 0.00623

: 0.41564

: 13.99837

: 0.03975

: 1.05468

kmx = 1.23 das -1, K = 22.18 mg/L. De estos resultados, de (3) y de (1), se obtiene

Se obtiene

dp f p. = 1.23 dt 22.18 + f

Linealizacin del modelo de promedio de saturacin. La lnea es un ajuste con mnimos cuadrados que se usa en la evaluacin de los coeficientes del modelo, kmx=1.23 das -1 y K=22.18mg/L, para levadura en la fabricacin de cerveza.

Conclusin a la que arribaron los alumnos luego de realizar esta actividad: Si f se aproxima a cero a medida que p crece, entonces dp/dt tiende a cero y la poblacin se estabiliza.

Actividad 3 Se usa la funcin f(x)=1.44/x2+0.24x para generar seis parejas de datos (0.25, 23.1), (1.0, 1.68), (1.5, 1.0), (2.0, 0.84), (2.4, 0.826) y (5.0, 1.2576). Obtngase los ajustes mediante polinomios ptimos en mnimos cuadrados, para 2, 3, 4 y 5 grados. Grafquense, para cada caso, el polinomio ptimo y la funcin f(x). Escrbanse adems, las conclusiones a las que se arribaron. Observacin. No deja de ser tentadora la posibilidad de utilizar un polinomio ptimo en el sentido de los mnimos cuadrados para ajustar datos que no son lineales. Pero si los datos no muestran una naturaleza polinomial, puede ocurrir que la curva resultante presente oscilaciones grandes. Este fenmeno llamado oscilacin polinomial, se hace ms pronunciado conforme aumenta el grado del polinomio, y por esta razn, no se suelen usar polinomios de grado 6 o mayor, a no ser que se sepa que la funcin de la cual provienen los datos es un polinomio. Resultados obtenidos por los alumnos: P2(x) = 22.93 - 16.96 x + 2.553 x2 P3(x) = 33.04 - 46.51 x + 19.51 x2 - 2.296 x3 P4(x) = 39.92 - 80.93 x + 58.39 x2 - 17.15 x3 + 1.680x4 P5(x) = 46.02 - 118.1 x + 119.4 x2 - 57.51 x3 + 13.03x4 - 1.085x5

(a) Ajuste de P2(x) a los datos (c) Ajuste de P4(x) a los datos

(b) Ajuste de P3(x) a los datos (d) Ajuste de P5(x) a los datos

Conclusiones a las que arribaron los alumnos luego de desarrollar esta actividad: 1.- P3(x), P4(x) y P5(x) presentan oscilaciones grandes en el intervalo [2, 5]. 2.- P5(x) pasa por los seis puntos; sin embargo, es la que peor se aproxima a la funcin. 3.- El polinomio que se ajusta a los datos y se aproxima a la funcin es P2(x).

RESULTADOS Y CONCLUSIONES
Una vez finalizado el anlisis de este tema, los alumnos deben haber aumentado en gran medida sus capacidades en el ajuste de curvas con datos por medio de la regresin con mnimos cuadrados. Tienen la suficiente informacin para aprovechar satisfactoriamente una amplia variedad de problemas de ingeniera y de matemtica aplicada relacionados con esta temtica. Deben dominar las distintas tcnicas, deben haber aprendido a valorar la confiabilidad de las respuestas y ser capaces de escoger el mejor mtodo (o mtodos) para cualquier problema. Deben entender la derivacin de la regresin lineal con mnimos cuadrados y ser capaces de valorar la confiabilidad del ajuste usando grficas. Deben comprender el uso del ajuste potencial. Deben saber linealizar datos para llevar a cabo transformaciones y deben entender las situaciones en donde es apropiado usar regresin polinomial. Por ltimo, deben descubrir que los mtodos referidos a la interpolacin lineal se utilizan, fundamentalmente, cuando se conoce que los datos son muy exactos y deben entonces, asimilar y dominar todos los conceptos relativos al ajuste de curvas por medio de la regresin con mnimos cuadrados. Por otro lado, la implementacin por parte de los alumnos de las tcnicas analizadas en programas simples, es de gran utilidad como herramienta de aprendizaje de dichas tcnicas. El uso del paquete MATLAB mejora a los software utilizados anteriormente, porque adems de que ahorra tiempo y esfuerzo en la resolucin de una gran variedad de problemas, que las soluciones obtenidas resultan ms fiables que las obtenidas manualmente, que es una herramienta para la enseanza de la matemtica, facilita el proceso de enseanza - aprendizaje aportando una interfaz grfica visual ms didctica y comprensible.

BIBLIOGRAFA
[1] CHAPRA, S. - CANALE, R., 1992, "Mtodos Numricos para Ingenieros", Mxico, Mc Graw-Hill. [2] GARCA MERAYO, F. - NEVOT LUNA, A., 1992, "Anlisis Numrico", Espaa, Paraninfo. [3] GERALD, C. - WHEATLEY, P., 2000, "Anlisis Numrico con Aplicaciones",.Mxico, Pearson Educacin. [4] GORDON, J., 1985, "Algoritmos Numricos", La Plata. [5] MATHEWS, J. - KURTIS, D., 2000, "Mtodos Numricos con MATLAB", Espaa, Prentice Hall. [6] NAKAMURA, S., 1992, "Mtodos Numricos Aplicados con Software", Mxico, Prentice Hall Hispanoamericana, S.A.