Sunteți pe pagina 1din 11

QSAR

La relación cuantitativa estructura-actividad, es un método para construir modelos computacionales o


matemáticos que intenta encontrar una correlación estadísticamente significativa entre estructura y
función usando una técnica quimiométrica que en términos de diseño de fármacos, la estructura aquí se
refiere a las propiedades o descripciones de las moléculas, sus sustituyentes o campos de energía de
interacción, mientras la función corresponde a un punto final biológico / bioquímico experimental como
afinidad de unión, actividad, toxicidad o constantes de velocidad.
Este método se ha desarrollado gradualmente durante un período de más de cien años, lo que a
permitido tener diferentes tipos de QSAR donde cada uno suponen que cada molécula incluida en el
estudio se une al mismo sitio del mismo receptor diana, pero se diferencian en la manera de tratar y
representar las propiedades estructurales de las moléculas y extraer las relaciones cuantitativas entre
las propiedades y las actividades.
PORQUE USAR EL MODELADO QSAR
los modelos QSAR ofrecen predicciones útiles, pero que muchas veces fallan a pesar de las buenas
estadísticas generadas a partir del análisis de los datos. Independientemente de todos estos
problemas, QSAR se convierte en una alternativa útil por las siguientes razones:
• Los métodos de síntesis convencionales son costosos y demandan mucho tiempo
• Los ensayos biológicos también son muy costosos, a menudo requieren tiempo, sacrificio de
animales o compuestos en sus formas puras.
• Hay una gran cantidad de compuestos disponibles debido a la química combinatoria y los enfoques
HTS, pero se requieren estimaciones para priorizar la síntesis y el cribado.

Sin embargo, QSAR no puede reemplazar los ensayos experimentales, debido a que no todos los
parámetros in vivo se pueden incluir en el modelado QSAR y por ello no se tiene una molécula que funcione
de manera efectiva.
CLASIFICACIÓN DE METODOLOGÍAS QSAR
Basado en la dimensionalidad: la mayoría de las veces, los métodos QSAR se clasifican en las siguientes
clases, en función de la representación estructural o la forma en que se derivan los valores del descriptor:
 Actividad correlativa 1D-QSAR con propiedades moleculares globales como pKa, log P, etc.
 Actividad de correlación 2D-QSAR con patrones estructurales como índices de conectividad,
farmacóforos 2D, etc., sin tener en cuenta la representación en 3D de estas propiedades
 Actividad de correlación 3D-QSAR con campos de interacción no covalentes que rodean las moléculas
 4D-QSAR que incluye adicionalmente configuraciones de conjuntos de ligandos en 3D-QSAR
 5D-QSAR que representa explícitamente diferentes modelos de ajuste inducido en 4D-QSAR
 6D-QSAR incorporando además diferentes modelos de solvatación en 5D-QSAR
Métodos quimiometricos: es la aplicación de métodos matemáticos y estadísticos al análisis de datos
quimicos y obtener la mayor información para usarla en el diseño o selección de procedimientos de
medida(calibrado), experimentos óptimos o procesamiento de señales.
Según el tipo de métodos quimiométricos, a veces, los métodos QSAR también se clasifican en las
siguientes dos categorías, según el tipo de técnica de correlación empleada para establecer una
relación entre las propiedades estructurales y la actividad biológica:

 Métodos lineales que incluyen regresión lineal (LR), regresión lineal múltiple (MLR), mínimos cuadrados
parciales (PLS) y análisis / regresión del componente principal (PCA / PCR).
 Métodos no lineales que consisten en redes neuronales artificiales (ANN), k vecinos más cercanos
(kNN) y redes neuronales bayesianas.
3D-QSAR, es un término amplio que abarca todos los métodos QSAR que correlacionan las propiedades
objetivo macroscópicas con los descriptores computados basados en átomos derivados de la
representación espacial (tridimensional) de las estructuras moleculares.
CLASIFICACIÓN DE ENFOQUES 3D-QSAR
Clasificación Tecnicas

Sobre la base del modelado intermolecular, o la información utilizada para


desarrollar QSAR
3D-QSAR basado en ligandos CoMFA, CoMSIA, COMPASS, GERM,
CoMMA, SoMFA
3D-QSAR basado en receptor COMBINAR, AFMoC, HIFA, CoRIA

Sobre la base del criterio de alineación

3D-QSAR dependiente de la alineación CoMFA, CoMSIA, GERM, COMBINE,


AFMoC, HIFA, CoRIA

3DQSAR independiente de la COMPASS, CoMMA, HQSAR, WHIM,


alineación EVA / CoSA, MOLIENDA

Sobre la base de la técnica quimiométrica utilizada para correlacionar


propiedades y actividades estructurales
Lineal 3D-QSAR CoMFA, CoMSIA, AFMoC, GERM,
CoMMA, SoMFA

3D-QSAR no lineal COMPÁS, QPLS


CoMFA
GERM, los Modelos de Receptores Genéticamente Evolucionados (GERM) son una técnica para 3D-QSAR
y para construir modelos tridimensionales útiles de sitios de unión macromoleculares en ausencia de una
estructura determinada por cristalografía u homología moderada del receptor objetivo [67]. El requisito
principal para GERM es una serie de actividad de estructura para la cual se ha determinado una alineación
razonable de confórmeros realistas.

La metodología consiste en encerrar el conjunto superpuesto de moléculas en una capa de átomos


(análoga a la primera capa de átomos en el sitio activo) y asignar estos átomos con tipos de átomos
explícitos (H alifático, H polar, etc. para que coincida con los tipos de átomos que generalmente se
encuentran en las proteínas). Los átomos de carbono alifáticos se diseminan uniformemente sobre una
esfera que rodea el conjunto de entrenamiento de ligandos alineados, y sus posiciones se ajustan para
obtener la máxima interacción de van der Waals entre los átomos de carbono modelo y las moléculas del
ligando. Una vez que se han reconocido las posiciones de los carbonos, pueden estar ocupados por
cualquiera de los tipos de átomos, incluido ningún átomo. Surge un problema práctico cuando aumenta el
número de átomos de caparazón y sus tipos de átomos, ya que el número de combinaciones posibles se
eleva a un valor enorme, lo que hace imposible encontrar sistemáticamente el mejor modelo posible. Por
lo tanto, el método hace uso de los algoritmos genéticos (GA) para resolver este problema de búsqueda
altamente multidimensional. Los ligandos en el conjunto de entrenamiento se acoplan en un modelo de
sitio activo de receptor generado por AG, uno a la vez, y las energías de interacción intermolecular no
ligada (van der Waals y términos electrostáticos) se calculan utilizando un campo de fuerza de mecánica
molecular CHARMm. Finalmente, estas energías de interacción calculadas se correlacionan con las
actividades biológicas de las moléculas.

La característica afirmativa de este método es que el modelo se presenta como una visualización en 3D de
las propiedades del receptor en el espacio. La limitación de la metodología GERM es que considera solo
una conformación única de cada ligando en el conjunto de entrenamiento, así como su orientación única
en el sitio de unión. Como este método se basa en el cálculo de energías de interacción con el receptor
hipotético, está sujeto a todas las limitaciones de tales métodos, incluido el problema de alineación. Sin
embargo, si todas las moléculas del conjunto se unen de una manera que no altere demasiado el sitio de
unión; GERM podría ser un buen enfoque. El método se ha aplicado de manera rentable en una serie de
edulcorantes, correlacionando sus bioactividades con la energía intermolecular calculada [68]. La
metodología tiene un gran potencial para su aplicación en el cribado de bases de datos 3D estructurales
para encontrar nuevas pistas, o en combinación con programas de diseño de ligandos de novo. El programa
GERM está disponible por D. Eric Walters [69], Profesor Asociado, Finch University of Health Sciences,
North Chicago, EE. UU.

COMBINE, El método de Análisis de Energía de Unión Comparativa (COMBINE) fue desarrollado para
aprovechar los datos estructurales de los complejos ligando-macromolécula, en un paradigma 3D-QSAR.
La técnica se basa en la hipótesis de que la energía libre de unión se puede correlacionar con un
subconjunto de componentes de energía calculados a partir de las estructuras de receptores y ligandos en
formas unidas y no unida.
Los ligandos se dividen en fragmentos y se asigna el mismo número de fragmentos a todos los compuestos,
añadiendo fragmentos "ficticios" a los ligandos que carecen de un fragmento particular. Las energías de
interacción no ligadas (van der Waals y electrostática) se calculan entre cada residuo del receptor y cada
fragmento del ligando, usando un campo de fuerza de mecánica molecular.

Las energías también se calculan entre todos los pares de residuos / fragmentos para los complejos y para
los ligandos y receptores libres. Las interacciones electrostáticas se calculan usando una constante
dieléctrica dependiente de la distancia, y no se emplean límites de corte para las interacciones no ligadas.
Los descriptores insignificantes se eliminan de los datos usando la utilidad de selección de variables en el
programa GOLPE, y finalmente las actividades biológicas de las moléculas se correlacionan con los valores
de energía de interacción empleando la técnica PLS. Al igual que todos los demás enfoques QSAR 3D
basados en la energía de interacción, COMBINE también sufre los errores inherentes que conlleva el
cálculo de estas energías.

Además, la capacidad de predicción del método puede mejorarse mediante mejoras en varios aspectos,
como la descripción del término electrostático, la inclusión de descriptores adecuados para la solvatación
y los efectos entrópicos, y la optimización de facetas particulares de la metodología, como la elección de
definiciones de fragmentos de ligandos y los detalles del protocolo de selección de variables.
Recientemente, la metodología COMBINE se ha utilizado para construir modelos 3D-QSAR para
determinar la selectividad y especificidad de las proteínas Ras [72], predecir la afinidad de unión de los
inhibidores no peptídicos de la proteasa VIH-1 [73] e identificar residuos de aminoácidos en haloalcano
deshalogenasa LinB que modulan su especificidad de sustrato [74].

CoMMA, El Análisis de Momento Molecular Comparativo (CoMMA) es uno de los métodos QSAR 3D
independientes de alineación únicos, que implica el cálculo de descriptores de similitud molecular basados
en los momentos espaciales de la masa molecular (forma) y las distribuciones de carga hasta e incluyendo
el segundo orden, así como cantidades relacionadas [75]. Con respecto a cada estructura molecular, se
definen dos cuadros de referencia cartesianos. Un cuadro es el eje inercial principal calculado con respecto
al centro de masa. Para especies moleculares neutras, el otro marco de referencia es el eje cuadrupolar
principal calculado con respecto al "centro-de-dipolo" molecular.

Los descriptores dipolares, cuadrupolares y de desplazamiento se calculan luego con referencia a los ejes
inerciales principales traducidos de manera que su origen se superpone en el centro del dipolo. Es de
destacar que estos descriptores se obtienen después de la traducción al centro de masa, así como el centro
del dipolo para cada molécula, para mantener el sistema independiente de la alineación. Finalmente, estos
descriptores de momento molar-cular se correlacionan con las actividades biológicas de las moléculas
usando la técnica PLS. Los informes de literatura sugieren que los descriptores de CoMMA son sensibles
a las conformaciones moleculares, pero menos sensibles que los parámetros de campo de CoMFA. Los
autores proponen que los descriptores CoMMA tienen un papel potencial en el tratamiento de problemas
como el cribado a gran escala y la diversidad molecular. El método se ha utilizado para construir modelos
robustos 3D-QSAR para comprender las relaciones estructura-actividad del conjunto de datos de
esteroides de referencia [75], y para desarrollar QSAR combinatorio de compuestos de fragancias de ámbar
gris [76]. El grupo de informática de IBM proporciona una versión web del programa CoMMA [77]. Una
ligera variante de este enfoque, denominada CoMMA2, también ha sido desarrollada por el autor [78].
CoMSA, El Análisis Comparativo de Superficie Molecular (CoMSA) es un enfoque QSAR 3D no de
cuadrícula que utiliza la superficie molecular para definir las regiones de los compuestos que deben
compararse utilizando los potenciales electrostáticos medios [79, 80]. La metodología avanza sometiendo
las moléculas en el conjunto de datos a la optimización de la geometría y asignándolas con cargas atómicas
parciales. Los mapas autoorganizados de Kohonen (SOM, un tipo de red neuronal) se emplean para
transformar la superficie tridimensional de las moléculas en mapas topográficos bidimensionales,
extrayendo las señales de las coordenadas cartesianas de los puntos muestreados al azar en el van der
Waals superficie de las moléculas.

Las cargas atómicas parciales de las representaciones moleculares atómicas también se proyectan en los
mapas topográficos 2D. Los potenciales electrostáticos moleculares (MEP) se calculan en los puntos
superficiales y se utiliza un valor medio del potencial análogo a los puntos respectivos encontrados en cada
celda de la cuadrícula (de métodos similares a los de CoMFA) para explicar esta celda. Los valores de
potencial electrostático medio calculados se convierten en vectores y los vectores que expresan todas las
moléculas de la serie se superponen sobre una matriz, comparando los respectivos mapas topográficos de
las moléculas. La matriz comparativa resultante de los potenciales electrostáticos medios (transformados
en vectores) finalmente se usa para desarrollar un modelo 3D-QSAR usando la técnica PLS. La
característica distintiva de CoMSA es que, a diferencia de CoMFA y enfoques relacionados, compara las
propiedades moleculares que explican no un conjunto discreto de puntos sino los valores de propiedad
promedio (MEP) calculados para un área determinada de la superficie molecular. Recientemente, se ha
desarrollado y aplicado un modelo de CoMSA dependiente del receptor, utilizando acoplamiento molecular
multiplexado y eliminación de variable iterativa PLS (IVE-PLS), sobre compuestos de sulforafano como
activadores de la quinona reductasa [81]. Otras aplicaciones recientes de CoMSA incluyen el modelado de
los valores de pKa de los ácidos benzoicos [82] y asaronas hipolipidémicas [83], la selección de bibliotecas
combinatorias virtuales de los agentes bloqueadores del estirilquinolina VIH-1 [84] y la determinación del
modo de unión para una serie de antagonistas de la benzoxazina oxitocina utilizando el acoplamiento y
estudios 3D-QSAR [85].

AFMoC, La adaptación de Fields for Molecular Comparison (AFMoC) es un método 3D-QSAR que
involucra campos derivados de los entornos proteicos (y no de los ligandos superpuestos como en CoMFA),
por lo que también se lo conoce como un enfoque 'inverso' de CoMFA (= AFMoC) [86]. La metodología
comienza colocando una cuadrícula espaciada regularmente en el sitio de unión del receptor, seguido por
el mapeo de los potenciales de pares basados en el conocimiento entre los átomos de proteínas y las
sondas de átomos del ligando en las intersecciones de la cuadrícula, dando como resultado los campos
potenciales. En función de estos campos potenciales, los campos de interacción se generan multiplicando
las propiedades del tipo de átomo dependiente de la distancia de los ligandos reales acoplados en el sitio
activo con los valores de cuadrícula vecinos. Estos campos de interacción específica del tipo de átomo se
correlacionan luego con las afinidades de unión de las moléculas mediante la técnica PLS, que asigna
factores de ponderación individuales a cada valor de campo. Finalmente, los resultados se muestran
gráficamente utilizando mapas de contribución, y las afinidades de unión de los nuevos ligandos se
predicen aplicando la ecuación 3D-QSAR derivada. Las características distintivas de este enfoque incluyen:
 Una función de puntuación a medida se combina con un enfoque de CoMFA basado en proteínas,
superando así el requisito previo para involucrar conjuntos completos de entrenamiento de ligandos.

 El cambio gradual de los potenciales basados en el conocimiento generalmente válidos a los


potenciales de pares específicos de proteínas, refleja la cantidad y el grado de diversidad estructural
existente en los datos de entrenamiento del ligando.

 Se usan campos de interacción específica del tipo de átomo que son de naturaleza mutuamente
ortogonal y por lo tanto facilita la interpretación de los resultados de PLS.

 Además de la contribución entálpica, también se espera que la metodología incluya los efectos
entrópicos resultantes de la (des) solvatación, ya que el conocimiento estructural de complejos
determinados experimentalmente se convierte en potenciales estadísticos de pares.

Algunas de las aplicaciones prósperas de AFMoC incluyen construir modelos predictivos 3D QSAR para 1-
deoxyylulose-5 fosfato (DOXP) -reductoisomerasas inhibidores [87], 3- oxibenzamidas como inhibidores
potentes del factor Xa de la proteasa de coagulación [88], termolisina y glucógeno fosforilasa b inhibidores
[86], y para analizar las características de selectividad y afinidad de las isozimas de la anhidrasa carbónica
[89]. Recientemente, la metodología se ha modificado para tener en cuenta las conformaciones de múltiples
ligandos en un conjunto de configuraciones de proteínas. El método mejorado se ha denominado AFMoC
de consenso (AFMoCcon) y se validó con los inhibidores de la trombina [90].

CoRIA Y SUS VARIANTES, El análisis de interacción de residuos comparativo (CoRIA) es un enfoque 3D-
QSAR que utiliza los descriptores que describen los eventos termodinámicos implicados en la unión del
ligando, para explorar tanto las facetas cualitativas como las cuantitativas del proceso de reconocimiento
del receptor del ligando. La metodología inicial de CoRIA consistió simplemente en calcular las energías
de interacción no ligadas (van der Waals y Coulombic) entre el ligando y los residuos individuales del sitio
activo del receptor que participan en la interacción con el ligando [91-93]. Empleando la versión genética
de la técnica PLS (G / PLS), estas energías se correlacionaron con las actividades biológicas de las
moléculas, junto con otras variables fisicoquímicas que describen la termodinámica de la unión como,
lipofilicidad, refractividad molar, área superficial, volumen molecular, Jurs descriptores, energía de tensión,
etc.

Más adelante, para tratar los problemas del péptido QSAR, este enfoque se amplió y modificó para
desarrollar dos nuevas variantes de CoRIA: CoRIA inversa (rCoRIA) y CoRIA mixta (mCoRIA). En estas
metodologías, el péptido (ligando) se fragmenta en aminoácidos individuales y las energías de interacción
(interacciones van der Waals, Coulombic e hidrofóbicas) de cada aminoácido en el péptido con el receptor
como un todo (rCoRIA) y con el sitio activo individual Se calculan los residuos en el receptor (mCoRIA),
que junto con otros descriptores termodinámicos (como energía libre de solvatación, pérdida de entropía
al unirse, energía de deformación y área de superficie evaluable por solvente) se usan como variables
independientes que están correlacionadas con la actividad biológica Método quimiométrico G / PLS [94].

Las metodologías CoRIA aprovechan al máximo la riqueza del conocimiento contenido en los complejos
ligando-receptor y extraen información crucial sobre la naturaleza y el tipo de interacciones importantes a
nivel tanto del receptor como del ligando, que pueden emplearse directamente en el diseño de nuevos
moléculas y receptores. Los métodos tienen la capacidad de pronosticar modificaciones tanto en el ligando
como en el receptor, siempre que se disponga de estructuras de algunos complejos ligando-receptor. La
metodología se ha aplicado con éxito para estudiar las interacciones de los inhibidores con la
ciclooxigenasa-2 [91], la enzima MurF de la neumonía por Streptococcus [92], la integrasa del VIH-1 [93] y
los péptidos que se unen a la molécula HLA A del MHC de clase I. * 0201 [94]. Sin embargo, estos métodos
son difíciles de aplicar en moléculas orgánicas pequeñas, porque a diferencia de los péptidos no existe un
protocolo lógico o universalmente aceptado para fragmentar moléculas pequeñas. Además, las
metodologías pueden mejorarse aún más mediante la solvatación de complejos de proteína de ligando
completos, muestreo conformacional extensivo por dinámica molecular, inclusión de otras interacciones
importantes como enlaces de hidrógeno, etc.

OTRAS METODOLOGÍAS 3D-QSAR


Además de los formalismos antes mencionados, se han desarrollado otras metodologías 3D-QSAR.
Algunos de ellos son los siguientes:

Compass

• El análisis conformacional se lleva a cabo para determinar la conformación bioactiva probable de cada
ligando.
• se calculan las descripciones que miden la forma de la superficie o la funcionalidad polar de la pose de
cada ligando en una alineación específica en la vecindad de un punto particular en el espacio.
• se construye una red neuronal y se construyen modelos, la realineación de moléculas se lleva a cabo
continuamente para lograr el mejor ajuste al sitio de unión con mejoras en el modelo de red neuronal.
• el modelo final se desarrolla a partir de estas poses moleculares mejoradas y realineadas [95].

RSA / RSM / CoRSA (Análisis de superficie de receptor / modelado, análisis de superficie de receptor
comparativo)
• Las estructuras de las moléculas se optimizan y se superponen en su conformación bioactiva
• una superficie complementaria del receptor se genera usando campos de forma (definidos por alguna
función dependiente de la distancia) que encierra un volumen común a todas las moléculas alineadas y
que representa su forma molecular agregada
• las supuestas propiedades químicas del receptor en cada punto de superficie se computan
• Se desarrollan modelos PLS que relacionan las propiedades de la superficie con las actividades
moleculares [96, 97]

VFA (análisis de campo de Voronoi)


• Primero se lleva a cabo un análisis conformacional, minimización y superposición de todas las moléculas.
• el volumen ocupado por un conjunto superpuesto de moléculas se divide en subespacios denominados
poliedros de Voronoi, cada uno de los cuales incluye un punto de referencia (un átomo) con ciertas
coordenadas, tal como se explica en los siguientes pasos.
• primero se selecciona una molécula plantilla (la más simple) y todos los átomos de la molécula plantilla
se asignan como puntos de referencia iniciales.
• luego, la molécula más grande en el conjunto de datos se superpone a la plantilla en términos del número
de átomos y se designan nuevos puntos de referencia si este punto es mayor a 1 Å de distancia de los
puntos de referencia identificados en el paso anterior.
• los dos pasos anteriores se repiten con la superposición de otras moléculas en orden decreciente de su
tamaño, definiendo cada vez átomos aislados como nuevos puntos de referencia según los criterios
indicados anteriormente, hasta que todos los compuestos se superponen.
• Se construye un paralelepípedo con seis planos tangenciales divididos en un retículo 3D con un
espaciamiento de 0.3 Å, que rodea el volumen de unión del conjunto superpuesto de moléculas. Esto le da
al Voronoi poliedro.
• los índices de energía potencial y electrostática en cada punto de la red cristalina se calculan de acuerdo
con el modelo de 'potencial de esfera dura' y la ley de Coulomb respectivamente.
• El algoritmo PLS se aplica para correlacionar variables latentes estéricas y electrostáticas independientes
con el índice de actividad.

PARM (Modelo de Receptor Pseudo Atómico)


• Se seleccionan quince tipos de tipos de pseudoaprobaciones posiblemente encontrados en una proteína.
• las moléculas se superponen y se genera una cuadrícula tridimensional alrededor de su superficie común.
• los tipos de átomos predefinidos y la carga formal en estos puntos de la cuadrícula se asignan utilizando
un algoritmo genético; esto se basa en la carga del átomo del ligando más cercano al punto de la cuadrícula.
• se genera una población inicial de individuos o modelos de receptores basados en GA.
• van der Waals y las energías de interacción electrostática entre cada ligando y el modelo de receptor se
calculan y se correlacionan con sus actividades moleculares utilizando una técnica de regresión lineal.

SOM (Análisis de campo molecular autoorganizado)


 En primer lugar, la actividad media del conjunto de entrenamiento se resta de la actividad de cada
molécula para obtener sus valores medios de actividad centrada
 una rejilla tridimensional alrededor de las moléculas con valores en los puntos de la grilla que indican
la forma o el potencial electrostático que se genera
 la forma o el valor del potencial electrostático en cada punto de la cuadrícula para cada molécula se
multiplica por su actividad media centrada
 los valores de cuadrícula para cada molécula se suman para proporcionar las cuadrículas maestras
para cada propiedad la llamada propiedad SOMFA, i las descripciones de los valores de la cuadrícula
maestra se calculan y se correlacionan con las actividades moleculares log-transformadas.

FLUFF-BALL
• Se lleva a cabo una superposición semiautomática de las moléculas basada en un nuevo procedimiento
de ajuste de campo llamado Campo de Fuerza Unificada de Ligando Flexible (FLUFF); este es un campo
de fuerza MMFF94 que se personaliza para impartir flexibilidad al ligando para maximizar la adaptación /
similitud entre los volúmenes del campo estérico y electrostático del ligando y la plantilla
• el sistema de coordenadas interno está unido a la molécula plantilla colocando los vértices de la cuadrícula
local en los centros atómicos de la plantilla, utilizando el enfoque del ligando adaptativo sin límites (BALL),
lo que hace que la red del sistema sea independiente
• se evalúa la similitud entre ligandos y plantilla, y los descriptores estéricos y electrostáticos computados
se correlacionan con las actividades biológicas usando la técnica PLS.
• Las moléculas se superponen primero y se calculan sus distancias interatómicas.
• luego se extraen las coordenadas de la representación molecular (en lugar de los puntos reticulares como
en CoMFA) al eliminar continuamente los átomos que están más cerca unos de otros, y al reemplazarlos
con pseudoátomos (creados a partir de su promedio ponderado), hasta que las distancias entre todos los
átomos / pseudoátomos son mayores que el valor umbral de 0.75 Å.
• las energías de interacción (propiedades estéricas, electrostáticas e hidrofóbicas) se calculan luego para
cada molécula en estos puntos mediante diferentes funciones de evaluación y finalmente estas se
correlacionan con sus actividades moleculares utilizando PLS.

CoMPTIA (Análisis de interacción de molécula / pseudo receptor comparativo)


• La geometría de las moléculas se optimiza, seguida de su superposición basada en una molécula plantilla
común
• el espacio resultante abarcado por el conjunto de moléculas superpuestas se divide en cuadrículas con
un número suficiente de puntos reticulares para acomodar todos los átomos de la sonda
• nueve tipos diferentes de átomos híbridos / sondas se distribuyen en cada punto de la red usando un
algoritmo genético,
• las interacciones estéricas, electrostáticas e hidrofóbicas entre las diferentes sondas y cada molécula en
el conjunto se computan y luego se correlacionan con las actividades biológicas usando PLS.

PRINCIPIOS DE SETUBAL / OCDE


Estos principios fueron acordados por los países miembros de la OCDE (Organización de Cooperación y
Desarrollo Económicos) en la 37ª Reunión Conjunta del Comité de Productos Químicos y el Grupo de
Trabajo sobre Sustancias Químicas, Plaguicidas y Biotecnología en noviembre de 2004 en Setubal,
Portugal [123]. De acuerdo con estos principios, un modelo QSAR debe asociarse con la siguiente
información para que sea aplicable a efectos regulatorios:
• un punto final o intento definido biológico / bioquímico / farmaco toxicológico que sirve para predecir.
• un algoritmo inequívoco y fácilmente aplicable para predecir el punto final.
• un dominio claramente definido de su aplicabilidad.
• medidas apropiadas de bondad de ajuste, solidez y predictividad evaluadas mediante validación interna
y externa.
• una clara base mecanística, si es posible aparente.

RECOMENDACIONES DE TOPLISS & COSTELLO Y UNGER & HANSCH


Un modelo QSAR funcional debe cumplir con las siguientes características generales propuestas por
Topliss y Costello [124] y Unger & Hansch [125], para la derivación adecuada de ecuaciones
extrathermodynamic:
• Deben estar presentes suficientes ejemplos en el conjunto de capacitación para cubrir el rango de
propiedades requeridas para ser pronosticadas por el modelo. En general, esto incluye varias órdenes de
log de magnitud del punto final que se predice.
• Se debe seleccionar una amplia gama de descriptores diferentes, significativos y esencialmente
independientes / no correlacionados, biofísicamente relacionados con la propiedad que se predice. Todos
los parámetros "lógicos" deben ser podados y validados por un método estadístico apropiado, como
regresión gradual, valor F, validación cruzada, aleatorización en Y, etc. Idealmente, mientras se usa MLR,
los descriptores seleccionados deberían ser mucho menos numerosos que el número de compuestos en
el conjunto de entrenamiento (al menos 5 - 10 veces).
• En el caso de modelos múltiples, uno debe seguir el principio de parsimonia (Navaja de Occam), que
establece que si todas las cosas son (aproximadamente) iguales, preferiblemente se debe seleccionar el
modelo más simple.
• Para un conjunto de datos de tamaño intermedio, uno debe tener al menos 5 - 6 puntos de datos por
variable (o por componente) para eludir las correlaciones de azar.
• Para evadir las correlaciones fortuitas, es importante tener un modelo cualitativo que sea consistente con
la química físico-orgánica y biomédica conocida del proceso bajo consideración.
• El modelo debe ser respaldado por una serie de parámetros estadísticos para probar su predictividad
interna. Se debe usar un conjunto de prueba separado para validar la predicción externa del modelo.

OTRAS SUGERENCIAS IMPORTANTES

El método estadístico debe elegirse de tal manera que proporcione una clara correlación entre los
descriptores y la actividad biológica. Esto se puede asegurar con pruebas adicionales como aleatorización
de datos de actividad, arranque de flejes y validación cruzada.

• Dado que la predicción es el objetivo principal de QSAR, un modelo debe evaluarse por su poder predictivo
tanto internamente (mediante validación cruzada) como externamente (utilizando un conjunto de prueba
separado). Las pruebas externas se vuelven más significativas a la luz de la "paradoja de Kubinyi" que
establece que la alta predictividad interna a menudo puede dar como resultado una baja predicción externa
y viceversa. Esto probablemente se deba al hecho de que el error global de la predicción se combina
cuando los errores inherentes en el modelo se combinan con errores experimentales en los datos de
compuestos externos.
• El modelo QSAR debe ser explicativo e interpretable. Debería ayudar a comprender el modo de acción
para los compuestos activos que se originan a partir de diferentes conjuntos de datos. Siempre que haya
datos estructurales disponibles, los resultados deben validarse con la información del receptor.
• Los descriptores seleccionados para el desarrollo del modelo deben ser farmacológica o mecánicamente
relevantes para el punto final biológico que se está examinando.
• En la medida de lo posible, los descriptores que son simples y fáciles de interpretar deben elegirse para
una mejor comprensión del sistema modelado.
• QSAR debe aplicarse solo a compuestos puros. Su aplicación en mezclas debe ser evitada.
• El QSAR no se debe aplicar fuera de su dominio de validez, es decir, fuera del espacio de parámetros
cubierto por el conjunto de entrenamiento.

OBSERVACIONES FINALES
A pesar de todos los escollos y advertencias, la comunidad contemporánea de descubrimiento de fármacos
ha comprendido que QSAR, basado en principios de estadística bien establecidos, es intrínsecamente una
herramienta de química medicinal valiosa y viable cuyo dominio de aplicación va desde explicar la
estructura-actividad relaciones cuantitativa y retrospectivamente, para dotar a la guía sintética que conduce
a hipótesis lógicas y experimentalmente comprobables. La creciente información de la biología estructural
presentará valiosos comentarios a las suposiciones que forman la base de los métodos 3D-QSAR. Antes
de aplicar los modelos predictivos a las situaciones de la vida real, uno debe mirar los tecnicismos de las
metodologías QSAR subyacentes, con el fin de eludir su uso inapropiado y la interpretación errónea. Más
específicamente, los problemas asociados con la alineación-dependencia y la sensibilidad conformacional
deben ser tomados en consideración. En este sentido, enfoques como COMPASS, CoMMA, PLS de 4 vías
etc. son útiles. De forma similar, siempre que haya información disponible sobre el receptor objetivo, debe
utilizarse para construir los modelos o para validar los enfoques desarrollados únicamente sobre la base
de datos de ligandos. En otras palabras, los modelos basados en receptores como COMBINE, AFMoC,
CoRIA, etc. son más esclarecedores y extrapolativos que los métodos convencionales basados en ligandos
como CoMFA, CoMSIA, etc. Además, cuando se modela la relación inherente entre los descriptores y el
punto final biológico, no se espera que sea de naturaleza lineal (p. ej., en el caso de las propiedades
ADMET), se debe preferir un método quimiométrico no lineal como redes neuronales, vecinos de cercanías,
etc. Finalmente, dado que la confiabilidad de los modelos QSAR depende de su significación estadística y
la capacidad de predecir con precisión la actividad de los compuestos no incluidos en el conjunto de
capacitación, los modelos deben validarse exhaustivamente tanto interna como externamente mediante
rigurosas técnicas de validación cruzada. Además, los resultados de QSAR deberían aceptarse como una
hipótesis funcional que debe ser respaldada por análisis estadísticos pertinentes y justificada por una mayor
síntesis y pruebas biológicas para su aprobación o desaprobación. Una comprensión exhaustiva y una
práctica libre de errores de tales estrategias en QSARmodeling deberían beneficiar a los químicos
medicinales para priorizar sus esfuerzos experimentales y amplificar considerablemente las tasas de éxito
experimentales. Para terminar con un mensaje positivo y motivador obsérvese que los modelos QSAR, si
se usan impecablemente dentro de sus dominios de aplicación y sin extrapolaciones injustificables,
continuarán impactando en la investigación de descubrimiento de fármacos in silico.