Documente Academic
Documente Profesional
Documente Cultură
Ajuste de curvas
Etapas de una investigacin
Exploracin de datos
Diseo de experimentos
Antecedentes Bibliogrficos
Ajuste de curvas
Ajuste de curvas
[S] : 1.2 5.2 6.3 7.2 9.4
v : 4.3 5.4 7.2 8.4 9.5
v
v = f[S]
[S]
Polinomios y a bx cx2
Datos sin mucho ruido, curvas suaves
Cuidado porque son demasiado flexibles (hiperajuste)
Nudo 1 Nudo 3
Ajuste de curvas
Ejemplo de ajustes por cubic splines
(para comparacin de curvas: reas, pendientes...)
Ajuste de curvas
Modelos tericos
En ecuaciones algebraicas En ecuaciones diferenciales
+L +L E*S
E* + S
K1 K2
M0 M1 M2
E E P
[M1] [M2]
K1 K2
[M0] [L] [M1] [L] d[ES*]
k1[S][E*] - (k - 1 kcat)[ES*]
dt
K1[L] 2K1K2[L]2
y d[P]
kcat [ES*]
2(1 K1[L] K1K2[L]2 ) dt
Ajuste de curvas
Ecuaciones de inters en Biomedicina
Vmax [A][B]
Ping Pong Bi Bi : v
K B [ A] K A [ A] [A][B]
Ajuste de curvas
Concepto de linealidad
Linealidad en las variables
Ecuacin lineal Ecuacin no lineal
y y
x x
Linealidad en los parmetros
Ecuacin lineal Ecuacin no lineal
y a bx cx 2 y Ae - k x
Ejemplos
y a bx y a bx cx 2 y Ae -kx
Ajuste de curvas
Previo: Comparacin cualitativa entre la forma
de los datos y el tipo de curva a ajustar
1) Ordenada en el origen y bx cx 2
(mal)
Y=f(x)+C y a bx cx 2
C Y=f(x) (bien)
a
(0,0)
(0,0)
(Correccin por lnea base)
ap
Vmax [S]
v ap
(bien)
KM [S] K -SI1 [S]2
(Mximos, mnimos)
Ajuste de curvas
Estimacin de los parmetros
Ecuacin lineal Datos Ecuacin no lineal Datos
2 x y [L] y
y= a+bx+cx 2
1 8.4 K1 [L] +2 K1 K2 [L]
y= 2 0.1 0.9
2 5.6 n ( 1+K1 [L] + 2 K1 K2 [L]
0.2 0.6
Encontrar los valores
3 3.4
0.5 0.4
de los parmetros ... .. . ... ...
que mejor ajustan
Optimizar los parmetros que mejor
la ecuacin a los datos
ajustan la ecuacin a los datos:
y y
x [L]
Ajuste de curvas
Criterio de ajuste
(de una ecuacin a unos datos)
Minimizar los residuales al cuadrado (Mnimos Cuadrados)
residual
y
residual
x
Ajuste de curvas
Regresin por mnimos cuadrados
Encontrar las mejores estimas de los parmetros
Objetivos
Cuantificar precisin parmetros usando lmites de confianza
Regresin lineal simple Regresin no lineal
(Ecuaciones no lineales en parmetros,
(Ecuaciones lineales en los parmetros, por ej. y =Ae-kx)
por ej. y= a+bx, polinomios en x, .)
SSQ (yi Ae-kxi ))2
SSQ (y i ( a bx i )) 2
( SSQ)
............... 0 A ?
(SSQ) A
............... 0 a .........
a ( SSQ)
............... 0 k ?
(SSQ) k
............... 0 b ..........
b
No se pueden explicitar los parmetros,
Se puede explicitar cada parmetro, solucin aproximada.
solucin nica, mtodo exacto Mtodos iterativos tipo:
Bsqueda (Random Search)
Regresin lineal mltiple Gradiente (Gauss-Newton)
y C B1x1 B2 x 2 B3 x 3
Ajuste de curvas
Clculos en regresin lineal (simple y
mltiple) usando notacin matricial
y p0 p1 x1 p 2 x 2 p 3 x 3......... pnxn u
Y X P U
Y XPR
( Y X P )( Y X P ) SSQ
(SSQ)
0 ( X) ( Y X P ) ( Y X P )T ( X ) 0
T
P
2 X ( Y X P ) 0 ( X X ) P X Y
T T T
P ( X X )1 X Y
T T
Ajuste de curvas
Regresin lineal simple
Slo una variable independie nte :
por ejemplo lnea recta y C Bx
Ajuste de curvas
Regresin lineal mltiple
Ajuste de curvas
Bondad de un ajuste en regresin lineal
(Respecto a los residuales)
Coeficient e de determinac in : R 2 1
SSQ regresin
1- (y i y i ) 2
SSQtotal i
(y y ) 2
Ajuste de curvas
Regresin no lineal: Mtodos iterativos,
mnimo global y mnimos locales
Ecuacin no lineal
y Ae - k x
Ajuste de curvas
Algoritmos iterativos en regresin no lineal
Ajuste de curvas
Bondad de un ajuste en
regresin no-lineal
Ajuste de curvas
Estadstica asociada a la regresin no lineal
Si t t( , 0.05) Si t t( , 0.05)
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Discriminacin entre modelos
F
SSQ1 SSQ2 m2 m1 se acepta modelo 2
SSQ2 n - m2 Si F F(95%)
se acepta modelo 1
Ajuste de curvas
Discriminacin por superposicin de ajustes
Ajuste de curvas
Regresin con pesos estadsticos
El criterio de mnimos cuadrados asume que:
La variable x no tiene error
El error en la respuesta es aditivo : yi = f ( p , xi ) + u i
Los errores u i y u j son independientes
Todos los errores (ui, u j , ... ) siguen una distribucin normal de media
cero y varianza constante (todas las medidas tienen la misma precisin )
i w 1 s2
i
(estas varianzas si2 se determinan
a partir de rplicas)
(weight)
Ajuste de curvas
Ajustar siempre ecuaciones directas y nunca
transformaciones lineales
v i4
wi
VAR(v i )
Conclusin: Lo ortodoxo para determinar parmetros es la
regresin no lineal con pesos estadsticos a la ecuacin directa
Ajuste de curvas
Ejemplo de regresin no lineal con SIMFIT
Con una preparacin enzimtica de dos isoenzimas se realiz el siguiente estudio:
8 puntos experimentales, en el margen de concentraciones de 0.05 a 50 mM,
espaciados logartmicamente y realizndose 5 rplicas por punto (40 datos en total).
[S] v s
Tienen las 2 isoenzimas la misma Vmax y Km?
0.050 0.0530 0.0006
0.050 0.0531 0.0006
0.050 0.0523 0.0006 Vmax (1)[S] Vmax ( 2 )[S]
v
0.050 0.0522 0.0006 K m (1) [S] K m ( 2 ) [S]
0.050 0.0520 0.0006
.. .. ..
50.0
50.0
1.73
1.86
0.06
0.06
wi 1 2
si
WSSQ (1 si2 )(vi f ( p, Si )2
50.0 1.86 0.06
50.0 1.77 0.06
50.0 1.76 0.06
Ajuste de curvas
Ajuste a 1 Funcin de Michaelis-Menten
Ajuste de curvas
Matriz de correlacin de los parmetros
1.000
0.876 1.000
yexp. yajus. yexp.- yajus.
si
Var.indep. Err.estnd. Var.dep. Teora Residuales Resids.pond.
5.000E-02 6.381E-04 5.295E-02 5.133E-02 1.618E-03 2.536E+00
5.000E-02 6.381E-04 5.309E-02 5.133E-02 1.759E-03 2.757E+00
5.000E-02 6.381E-04 5.226E-02 5.133E-02 9.279E-04 1.454E+00
5.000E-02 6.381E-04 5.219E-02 5.133E-02 8.599E-04 1.348E+00
5.000E-02 6.381E-04 5.151E-02 5.133E-02 1.809E-04 2.836E-01
Ajuste de curvas
Anlisis global de los residuales (importante)
Anlisis de Residuales
Anlisis de residuales: WSSQ = 2.428E+02 weighted sum of squares
P(Ji-cuadrado >= WSSQ) = 0.000 Rechazar al 1% significancia
R-cuadrado, cc(teora-datos)^2 = 0.982 Test c2 (p < 0.01)
Mayor err. rel. en residuales = 17.23 %
Menor err. rel. en residuales = 0.35 %
Media de err.rel. en residuales = 5.66 %
Residuales con err.rel. 10-20 % = 15.00 %
Residuales con err.rel. 20-40 % = 0.00 %
Residuales con err.rel. 40-80 % = 0.00 %
Residuales con err.rel. > 80 % = 0.00 %
Nmero residuales < 0 (m) = 21
Nmero residuales > 0 (n) = 19
Nmero de rachas observadas (r) = 7
P(rachas =< r , dados m y n) = 0.000 Rechazar al 1% significancia
Valor en cola inferior al 5% = 15
Valor en cola inferior al 1% = 13 Test rachas (p < 0.01)
P(rachas =< r , asumiendo m+n) = 0.000
P(signos =< menor n observado) = 0.875
Estadstico de Durbin-Watson = 0.250 <1.5 (correlacin valores +)
W de Shapiro-Wilks (resid.pond.) = 0.974
Nivel de significancia de W = 0.476
Test AIC de Akaike (SC Schwarz) = 2.237E+02 ( 2.234E+02)
Veredicto sobre bondad ajuste: bueno cualitativo (poco valor)
Ajuste de curvas
Hay 7 rachas (pocas para 40
residuales), eso significa un ajuste
sesgado (los residuales debieran
estar al azar y no en racimos)
Ajuste de curvas
Ajuste de curvas
Ajuste a 2 Michaelis-Menten
Iteracin WSSQ (2:2)
0 3.627E+04
1 1.045E+04
Algoritmo bsqueda al azar
7 3.393E+03
21 1.262E+03
30 8.976E+02
143 5.505E+02
Bsqueda 1 terminada (Sigma = 1.00)
185 5.462E+02
195 4.145E+02
202 3.354E+02
222 2.044E+02
Bsqueda local terminada (Sigma = 0.10, 0.20)
Ajuste de curvas
Matriz de correlacin de los parmetros
1.000
-0.834 1.000
0.990-0.869 1.000
0.930-0.593 0.882 1.000
Ajuste de curvas
Anlisis global de los residuales para 2 MM
Anlisis de Residuales
Anlisis de residuales: WSSQ = 3.442E+01 (disminuy (antes 2.43E+02))
P(Ji-cuadrado >= WSSQ) = 0.544
R-cuadrado, cc(teora-datos)^2 = 0.998
Test c2 (buen ajuste p > 0.05)
Mayor err. rel. en residuales = 6.64 %
Menor err. rel. en residuales = 0.21 %
Media de err.rel. en residuales = 1.96 % (disminuy (antes 5.66 %))
Residuales con err.rel. 10-20 % = 0.00 %
Residuales con err.rel. 20-40 % = 0.00 %
Residuales con err.rel. 40-80 % = 0.00 %
Residuales con err.rel. > 80 % = 0.00 %
Nmero residuales < 0 (m) = 21
Nmero residuales > 0 (n) = 19
Nmero de rachas observadas (r) = 18 (aument (antes 7 ))
P(rachas =< r , dados m y n) = 0.217 (test rachas (buen ajuste ( p > 0.05 ))
Valor en cola inferior al 5% = 15
Valor en cola inferior al 1% = 13
P(rachas =< r , asumiendo m+n) = 0.261
P(signos =< menor n observado) = 0.875
Estadstico de Durbin-Watson = 2.019
W de Shapiro-Wilks (resid.pond.) = 0.982
Nivel de significancia de W = 0.776
Test AIC de Akaike (SC Schwarz) = 1.495E+02 ( 1.489E+02)
Veredicto sobre bondad ajuste: increible
Ajuste de curvas
Los residuales estn ms al azar (18 rachas frente a 7 de antes).
El ajuste no est sesgado (es mejor ajuste)
Ajuste de curvas
Ajuste de curvas
Discriminacin estadstica entre los 2 modelos rivales
Resultados del test F
Ajuste de curvas
(Basado en Bardsley 2011, SIMFIT statistical package)
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Ejemplo: Curvas Dosis-Respuesta
A
y
1 Be kx
Ajuste de curvas
Ajuste a ecuaciones de 2 variables
Ecuacin:
Vmax [S]
Inhibicin competitiv a : v
[I ]
Km 1 [S]
KI
Datos:
Inhibidor : 1 1 1 1 2 2 2 2 .......
Sustrato : 2 4 6 8 2 4 6 8 ......
velocidad : 5.2 6.3 7.1 9.1 3.2 5.2 6.4 7.5 ........
Ajuste de curvas
Superficie ajustada
Vmax [S]
v
[I ]
Km 1 [S]
K I
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Regr. Lineal generalizada
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Ej: Regr. logstica binaria
p( 1 )
log a 0 a1 X 1 a 2 X 2 a1 X 3.....
1 p( 1 )
L
La aplicacin importante es estimar p(1) para un caso nuevo
del que se conocen X1, , X2, , X3, .
1
p(1) (ej: p(1) = 0.73 de sobrevivir)
1 e L
Ajuste de curvas
Anlisis de datos Ej. : DL50 por regresin logstica,
(Ajuste de curvas) probit o log-log complementario
Funcin logstica
p
log a 0 a1 X
1 p
DL50 = 4.66
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Modelos en ec. dif.
Ecuaciones diferenciales simultneas
(varias variables dependientes)
Ejemplo : Epidemia
k1 k2
Susceptibles Infectados Recuperados
S I R
dS
= k1 . S . I
dt
dI
= k1 . S . I k2 . I
dt
dR
= k2 . I
dt
Integran numricamente (Adams, Gear)
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Ej: Modelos en ec. dif.
Ejemplo : Epidemia
k1 k2
Suscept. Infect. Recup.
dS
= k1 . S . I
dt
dI
= k1 . S . I k2 . I
dt
dR
= k2 . I
dt
Ajuste de curvas
Anlisis de datos
(Ajuste de curvas) Ej: Modelos en ec. dif.
Ejemplo : Epidemia
k1 k2
Suscept. Infect. Recup.
dS
= k1 . S . I
dt
dI
= k1 . S . I k2 . I
dt
dR
= k2 . I
dt
Ajuste de curvas
Tcnicas especiales Anlisis de supervivencia
Test Mantel-Haenszel
QMH=16.79
(p<0.01)
(supervivencia
diferente)
Ajuste de curvas