"Identification of Plants miRNAs from deep RNA seq data using a multilayer perceptron."
Artículo
Versión publicada
Universidad Autónoma Agraria Antonio Narro
Saltillo, Coahuila, México.
"La degradación de transcritos mediada por
micro-RNAs (miRNAs) es una capa de regu
lación génica a un nivel post-transcripcional
que desempeña funciones importantes en
plantas. Algunos rasgos fenotípicos que son
de interés para la industria alimenticia están
fuertemente regulados por este mecanismo
molecular. En México, plantas de la familia
Fabaceae representan una de las principales
fuentes de alimentación. En consecuencia,
es importante estudiar esta capa de regula
ción para mejorar los cultivos y la producción
de semillas, sin embargo, uno de los tópicos
más difíciles es la identificación de los loci
miRNAs. Los criterios básicos no son eviden
cia suficiente para la identificación correcta.
Recientemente, inteligencias artificiales (IA)
basada en redes convolucionales (CNN) han
mostrado un excelente poder predictivo en
la identificación de los loci miRNAs, sin em
bargo, algunas de estas CNN profundas son
complejas y difíciles de entrenar y ejecutar. Se
ha propuesto un modelo basado en la arqui
tectura de perceptrón multicapa (MLP) para la
identificación de loci de miRNAs, sin embargo,
su rendimiento es limitado debido a las altas
capacidades de cálculo necesarias para pro
cesar las secuencias. En este artículo mostra
mos como las IA basadas en modelos simples
(MLP) son una opción más ágil y fácil de en
trenar, Esto, debido en parte, a el uso de fre
cuencias de k-meros para extraer información
de las secuencias de nucleótidos y de la re
presentación de la estructura. En este artícu
lo evaluamos diferentes características de los
modelos MLP como, funciones de activación,
y capas “dropout”. Los modelos más adecua
dos mostraron una sensibilidad del 84-90% y
una especificidad del 98-100% cuando fueron
sometidos a prueba con los datos de evalua
ción. Adicionalmente, evaluamos los modelos
con secuencias de transcritos ensambladas y
obtuvimos valores de sensibilidad del 80-85%
y especificidad del 90-95%."
Estudiantes
Investigadores