Abstract:
La importancia del desarrollo de pipelines bioinformáticos de metagenómica radica en que permiten analizar de manera eficiente y precisa grandes cantidades de datos de secuenciación. Estos
datos se generan a partir de muestras ambientales, como suelo, agua, o aire, que contienen una gran
diversidad de microorganismos. Estos pipelines se encargan de procesar estos datos para identificar y
caracterizar los microorganismos presentes en la muestra. Esto permite realizar un estudio detallado
de la diversidad microbiana de un ecosistema, así como identificar microorganismos potencialmente
patógenos o beneficiosos. En el presente trabajo se aborda el caso de aplicación del desarrollo de un
pipeline bioinformático para el análisis de microbioma intestinal de pacientes con esquizofrenia. Las
muestras fueron obtenidas de la base de datos pública de https://www.ebi.ac.uk bajo los códigos
de acceso de PRJEB41217 y PRJEB41786. Estos contienen las muestras secuenciadas de pacientes
diagnosticados con esquizofrenia y pacientes ’sanos’ de Dinamarca.
Con el pipeline se lleva a cabo un proceso de automatización en donde se realiza las acciones de:
control de calidad, filtrado de lecturas dentro de las secuencias, remoción de ADN del hospedero
de las muestras (en este caso el humano), clasificación taxonómica de las muestras y la creación de
archivos en formato BIOM que puedan ser procesados por la librería phyloseq de R. Dado la alta
carga computacional del pipeline se hizo usó de una máquina virtual de Digital Ocean que lleve a cabo
la la ejecución de la automatización desarrollada para 53 secuencias provenientes del microbioma
intestinal de pacientes diagnosticados con esquizofrenia y 53 de pacientes sanos. Finalmente, usando
R Shiny, shinydashboard y phyloseq como librerías principales para la creación de un dashboard, se
lleva a cabo tanto el análisis de alfa y beta diversidad como también de abundancias absolutas y
relativas. Añadiendo que se toma en cuenta que la visualización creada es interactiva con el usuario.
Esto significa que este puede realizar diferentes filtrados de datos o indicar con que métodos trabajar
para la generación de las gráficas para analizar.
El pipeline fue exitoso en la clasificación del microbioma intestinal de las muestras utilizadas.
Con este se encontró que en términos de alfa y beta diversidad no hay una diferencia significativa
entre el conjunto de muestras de pacientes con esquizofrenia y los pacientes control. Sin embargo, al
analizar las abundancias relativas por género de las muestras se encontró que hay una abundancia
relativa alta de los genéros Flavonifractor, Dysosmobacter, Escheria y Lactobacillus en las muestras
de pacientes con esquizofrenia. (LA)