Investigadores del Instituto Tecnológico de Massachusetts (MIT, por sus siglas en inglés) con ayuda del aprendizaje automático han logrado identificar nuevos fármacos potenciales en contra de algunas enfermedades.
Los científicos han incorporado una nueva característica en este tipo de algoritmos de aprendizaje automático, mejorando su capacidad predictiva.
Haciendo uso de esta mejora, la cual permite a los modelos informáticos tener en cuenta la incertidumbre en el análisis de datos, el equipo del MIT identificó varios compuestos prometedores dirigidos a una proteína especifica de la bacteria responsable de la la tuberculosis.
Este método ha sido recientemente usado en el área de la biología, también ha mostrado su utilidad para el diseño de proteínas, entre otros, comenta Bonnie Berger, profesora de matemáticas y jefa del grupo de computación y biología en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL).
Aclarando un poco mejor, el aprendizaje automático es un tipo de modelado informático donde un algoritmo aprende a hacer predicciones basadas en datos anteriormente obtenidos.
Actualmente, los biólogos han comenzado a utilizar el aprendizaje automático para buscar en enormes bases de datos de compuestos farmacológicos opciones potenciales de moléculas que interactúen con objetivos específicos.
Desafortunadamente, la limitante del aprendizaje automático es que, si bien los algoritmos funcionan bien con datos similares a los analizados en su entrenamiento, no son muy buenos evaluando datos de moléculas diferentes a las anteriormente vistas.
Para superar eso, los investigadores usaron una técnica llamada proceso gaussiano, donde se asigna valores de incertidumbre a los datos en los que se entrenan los algoritmos.
De esa manera, cuando los modelos analizan los datos de entrenamiento, también toman en cuenta la confiabilidad de las predicciones. Por ejemplo, si los datos ingresados al modelo predicen la fuerza con la que una molécula en particular se une a una proteína objetivo, el modelo usa esa información para hacer predicciones de interacciones proteína-objetivo nunca antes vistas.
También el modelo estima la certeza de sus propias predicciones. Al analizar nuevos datos, las predicciones del modelo pueden tener menor certeza para moléculas que son muy diferentes de los datos con los que el sistema fue entrenado. A partir de ello, los investigadores pueden hacer uso de la información generada en ayudarlos a seleccionar las moléculas a probar experimentalmente.
Otra ventaja del aprendizaje automático es el uso de una pequeña cantidad de datos por parte del algoritmo para su entrenamiento. En este estudio, el equipo del MIT entrenó el modelo con un conjunto de datos de 72 moléculas pequeñas y sus interacciones con más de 400 proteínas llamadas quinasas. Después, pudieron usar este algoritmo en el análisis de 11,000 moléculas pequeñas, tomadas de la base de datos ZINC (una base de datos de síntesis química orgánica).
Teniendo este enfoque, se pudo identificar moléculas con afinidades de unión muy fuertes en las proteínas quinasas introducidas en el modelo. Estos incluyeron tres quinasas humanas, así como una quinasa encontrada en Mycobacterium tuberculosis. Esa quinasa cuyo nombre es PknB, es fundamental en la supervivencia de la bacteria, pero no está dirigida por ningún antibiótico de primera línea para la tuberculosis.
Posterior a ello, los investigadores probaron experimentalmente algunos de los resultados más prometedores y encontraron que las predicciones del modelo eran muy precisas. Las moléculas de mayor certeza, (alrededor del 90 por ciento) demostraron ser verdaderos aciertos, mucho más alto que la tasa de aciertos (30 al 40 por ciento) de los modelos de aprendizaje automático existentes.
Con estos datos, los investigadores tomaron algunos de los inhibidores de PknB más prometedores contra cultivos de Mycobacterium tuberculosis y encontraron que inhibían el crecimiento bacteriano.
Los inhibidores también funcionaron en células inmunes humanas infectadas con la bacteria.De esta manera, los científicos del MIT han utilizado la herramienta de aprendizaje automático para identificar nuevos fármacos potenciales en contra de algunas enfermedades.
Contenido relacionado:
La tuberculosis causa cuatro mil muertes por día en el planeta
AFG