Aplicación de algoritmos de aprendizaje automático, con énfasis en aprendizaje supervisado, para la identi�cación y categorización de segmentos de interés en señales bioeléctricas para el estudio de la epilepsia - Fase V Javier Alejandro Pérez Marín UNIVERSIDAD DEL VALLE DE GUATEMALA Facultad de Ingeniería Aplicación de algoritmos de aprendizaje automático, con énfasis en aprendizaje supervisado, para la identi�cación y categorización de segmentos de interés en señales bioeléctricas para el estudio de la epilepsia - Fase V Trabajo de graduación presentado por Javier Alejandro Pérez Marín para optar al grado académico de Licenciado en Ingeniería Mecatrónica Guatemala, 2024 UNIVERSIDAD DEL VALLE DE GUATEMALA Facultad de Ingeniería Aplicación de algoritmos de aprendizaje automático, con énfasis en aprendizaje supervisado, para la identi�cación y categorización de segmentos de interés en señales bioeléctricas para el estudio de la epilepsia - Fase V Trabajo de graduación presentado por Javier Alejandro Pérez Marín para optar al grado académico de Licenciado en Ingeniería Mecatrónica Guatemala, 2024 Vo.Bo.: (f) M. Sc. Carlos Esquit Tribunal Examinador: (f) M.Sc. Carlos Esquit (f) M. Sc. Miguel Enrique Zea Arenales (f) Ing. Kurt Emmanuel Kellner Fecha de aprobación: Guatemala, 13 de febrero de 2025. Prefacio A mis padres, Oscar y Karol, por creer en mis sueños, apoyarme y ser parte de ellos. Por su esfuerzo incansable, por siempre buscar lo mejor para nosotros, por siempre pensar en los 4 y por enseñarme que la unión familiar y el amor incondicional son la base de todo logro. Su ejemplo me ha mostrado que, aun en medio de las adversidades, la fe en Dios y el compromiso se transforman en fuerza para seguir adelante. En cada paso de mi camino, he llevado su sabiduría y su entrega, recordándome que cada sacri�cio y cada pequeño triunfo han cimentado en mí los valores que hoy me de�nen. A Dani, mi hermana, siempre has sido una parte fundamental en mi vida. Siempre quiero estar para la súper diseñadora y hermana que eres, acompañándote en cada paso y celebrando cada uno de tus logros. Tu cariño, tus risas y tus constantes ánimos han iluminado mi camino. Eres una persona increíblemente capaz y te animo a seguir esforzándote, con�ada en que lograrás todo lo que te propongas. Gracias por estar siempre presente y por aportar esa alegría que tanto me ha impulsado a avanzar. Esta tesis no solo representa el cierre de mi carrera universitaria, sino también la oportu- nidad de decirles que, hoy, somos ingenieros y lo hemos logrado, a pesar de la incertidumbre que nos acompañó al inicio y con una inmensa alegría y gratitud al llegar a este �n. Este trabajo es un tributo a sus enseñanzas, a sus sacri�cios, a esos abrazos que siempre estu- vieron ahí para reconfortarme y a la luz que han encendido en mí, impulsándome a nunca dejar de soñar. A mi familia, en especial a mis abuelitos, tíos, tías y primos, gracias por su aliento, cariño y apoyo, que hicieron de estos 5 años una experiencia aún mejor. Sus palabras de ánimo y su constante presencia me motivaron a superar cada desafío y a celebrar cada logro. Este éxito es también de ustedes, que con su cariño y ejemplo dejan una huella imborrable en mi camino. A mi novia, por tu apoyo constante, compañía, cariño y tus palabras de aliento que me han acompañado a lo largo de estos cinco años. Tu compañía ha sido una parte invaluable de este camino, aportando fuerza en los momentos difíciles y haciendo más signi�cativos los logros alcanzados. Porque no se trata solo del viaje, sino de la compañía que enriquece cada paso del camino. iii A todos mis amigos y amigas de la UVG, en especial a Cerón, Gerardo y Alba. Sin duda, repetiría estos 5 años las veces que me lo pidieran, si ustedes estuvieran allí. Gracias por cada curso y �sufrimiento� compartido, gracias por cada risa y consejo, gracias por estar. Sigan soñando en grande, porque son ingenieros capaces, y quiero estar allí para aplaudir cuando logren sus metas y para abrazarlos en los momentos en que las cosas no salgan como esperaban, pero siempre con la frente en alto y con ganas de seguir adelante. A mi asesor, Dr. Luis Alberto Rivera, con toda mi admiración y agradecimiento, un verdadero ejemplo de persona y docente. Su constante acompañamiento, gran conocimiento y la con�anza que ha depositado en mí me han motivado a lo largo de este trabajo y me han dejado un aprendizaje invaluable para el futuro en el ámbito de la investigación. Gracias por con�ar en mí y siempre impulsarme a dar lo mejor de mí. Dios le siga bendiciendo. A todos mis docentes y mentores de la universidad, les extiendo mi más sincero agrade- cimiento por su dedicación, compromiso y el incansable afán de compartir su conocimiento. Cada clase, cada consejo y cada reto me han enriquecido, impulsándome a crecer y aprender. De manera especial, quiero agradecer a M.Sc. Miguel Zea, cuyo gran apoyo y orientación en este trabajo fueron de mucha ayuda. Gracias a todos y todas por iluminar la trayectoria de sus estudiantes y ser una fuente de inspiración. Finalmente, más no menos importante, agradezco a Dios por ser mi luz y guía en cada paso de este camino. Agradezco a las personas que apoyan el programa de becas de la UVG, cuyo compromiso y generosidad han hecho posible que este sueño se materialice. También extiendo mi gratitud a todas aquellas personas que, sin ser nombradas, tienen un lugar muy especial en mi corazón. Gracias por su fe, su amor y por creer en mí. Que cada día cuente para hacer realidad nuestros sueños iv Índice Prefacio iv Lista de �guras ix Lista de cuadros x Resumen xi Abstract xii 1. Introducción 1 2. Antecedentes 2 2.1. Contexto general de la epilepsia . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.2. Estado del arte en el uso del aprendizaje automático para la epilepsia . . . . . 3 2.3. Evolución línea de investigación en Universidad del Valle de Guatemala . . . 4 3. Justi�cación 7 4. Objetivos 8 4.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4.2. Objetivos especí�cos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 5. Alcance 9 6. Marco teórico 10 6.1. Cerebro humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 6.1.1. Actividad eléctrica del cerebro . . . . . . . . . . . . . . . . . . . . . . 11 6.1.2. Ritmos normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 6.2. Epilepsia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.2.1. Anomalías epileptiformes . . . . . . . . . . . . . . . . . . . . . . . . . 14 6.2.2. Fases de una crisis epiléptica . . . . . . . . . . . . . . . . . . . . . . . 16 6.2.3. Tipos de crisis epilépticas . . . . . . . . . . . . . . . . . . . . . . . . . 16 6.3. Análisis de señales EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 v 6.3.1. Montajes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 6.3.2. Análisis en el dominio de la frecuencia . . . . . . . . . . . . . . . . . . 19 6.3.3. Análisis en el dominio del tiempo . . . . . . . . . . . . . . . . . . . . . 19 6.4. Algoritmos de aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . 20 6.4.1. Aprendizaje supervisado . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.4.2. Aprendizaje no supervisado . . . . . . . . . . . . . . . . . . . . . . . . 22 6.4.3. Aprendizaje reforzado . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 6.5. Aprendizaje profundo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 6.5.1. Entrenamiento de redes neuronales profundas . . . . . . . . . . . . . . 24 6.5.2. Tipos de redes neuronales profundas . . . . . . . . . . . . . . . . . . . 26 7. Obtención y recolección de datos 29 7.1. Propuesta de recolección de datos estandarizada . . . . . . . . . . . . . . . . . 29 7.2. Centros especializados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 7.3. Bases de datos médicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 7.3.1. Siena Scalp EEG Database . . . . . . . . . . . . . . . . . . . . . . . . 32 7.3.2. CHB-MIT Scalp EEG Database . . . . . . . . . . . . . . . . . . . . . . 33 7.3.3. The Temple University Hospital EEG Data Corpus (TUH) . . . . . . . 33 7.3.4. Otras bases de datos disponibles . . . . . . . . . . . . . . . . . . . . . 35 7.3.5. Selección base de datos de TUH . . . . . . . . . . . . . . . . . . . . . . 35 8. Procesamiento de estudios 36 8.1. Selección de estudios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 8.1.1. Descripción del conjunto de datos . . . . . . . . . . . . . . . . . . . . . 36 8.1.2. Descarga de estudios de base de datos . . . . . . . . . . . . . . . . . . 38 8.2. De�nición de parámetros de HUMANA . . . . . . . . . . . . . . . . . . . . . . 38 8.3. Migración de estudios a MATLAB . . . . . . . . . . . . . . . . . . . . . . . . 39 8.3.1. Selección de tipo de referencia . . . . . . . . . . . . . . . . . . . . . . . 39 8.3.2. Lectura en memoria de estudios . . . . . . . . . . . . . . . . . . . . . . 39 8.3.3. Lectura optimizada de estudios . . . . . . . . . . . . . . . . . . . . . . 41 9. Redes neuronales profundas: justi�cación y métodos generales 43 9.1. Justi�cación del enfoque de redes neuronales profundas . . . . . . . . . . . . . 43 9.2. Implementación y validación de red LSTM . . . . . . . . . . . . . . . . . . . . 44 9.2.1. Estructura de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 9.2.2. Opciones de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . 45 9.2.3. Proceso de entrenamiento y resultados . . . . . . . . . . . . . . . . . . 45 9.3. Implementación y validación de red TCN . . . . . . . . . . . . . . . . . . . . 47 9.3.1. Estructura de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 9.3.2. Opciones de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . 49 9.3.3. Proceso de entrenamiento y resultados . . . . . . . . . . . . . . . . . . 49 10.Implementación de redes EEGnet 51 10.1. Implementación de redes LSTM EEGnet . . . . . . . . . . . . . . . . . . . . . 51 10.1.1. Estructuras trabajadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 10.1.2. Resumen resultados LSTM EEGnet . . . . . . . . . . . . . . . . . . . 53 10.2. Implementación de redes TCN EEGnet . . . . . . . . . . . . . . . . . . . . . . 54 10.2.1. Estructuras y resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 54 vi 10.3. Discusión redes EEGnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 11.Herramienta Epileptic EEG Analysis Toolbox 58 11.1. Migración a MATLAB 2024 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 11.1.1. Evaluación de dependencias para la migración . . . . . . . . . . . . . . 58 11.1.2. Manejo de herramienta como proyecto y cambios necesarios . . . . . . 59 11.2. Mejoras y nuevas implementaciones en herramienta . . . . . . . . . . . . . . . 60 11.2.1. Implementación de Widget Toolbox . . . . . . . . . . . . . . . . . . . . 60 11.2.2. Protocolo cierre de ventana principal . . . . . . . . . . . . . . . . . . . 61 11.2.3. Actualización a función openedf . . . . . . . . . . . . . . . . . . . . . 61 11.2.4. Implementación de montajes de EEG en herramienta . . . . . . . . . . 62 12.Conclusiones 66 13.Recomendaciones 68 14.Bibliografía 69 15.Anexos 73 15.1. Documentación general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 15.2. Repositorio GitHub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 15.3. Listado de etiquetas disponibles en conjunto de datos TUH SEIZ . . . . . . . 74 16.Glosario 75 vii Lista de �guras 1. Última iteración de herramienta - Anotaciones . . . . . . . . . . . . . . . . . . 6 2. Lóbulos del cerebro y su ubicación . . . . . . . . . . . . . . . . . . . . . . . . 11 3. A) Vista lateral IS 10-20 y B) Vista superior IS 10-20 . . . . . . . . . . . . . 12 4. Ejemplos de actividad base en EGG con su espectro de frecuencia . . . . . . . 13 5. Ejemplos de EEG reales de anomalías epileptiformes . . . . . . . . . . . . . . 15 6. Clasi�cación de crisis epilépticas ILAE 2017 . . . . . . . . . . . . . . . . . . . 17 7. Ejemplos de tipos de montajes . . . . . . . . . . . . . . . . . . . . . . . . . . 18 8. Tipos de aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . . . . 20 9. Aprendizaje profundo y sus áreas . . . . . . . . . . . . . . . . . . . . . . . . . 23 10. Perceptrón multicapa básico generalizado . . . . . . . . . . . . . . . . . . . . 23 11. Efecto del momentum en SGD . . . . . . . . . . . . . . . . . . . . . . . . . . 25 12. Red neuronal recurrente (RNN) simpli�cada . . . . . . . . . . . . . . . . . . . 27 13. CNN simpli�cada para imágenes RGB clasi�cación multiclase . . . . . . . . . 28 14. Interés en el aprendizaje profundo . . . . . . . . . . . . . . . . . . . . . . . . 28 15. Equipo disponible para recolección de datos . . . . . . . . . . . . . . . . . . . 30 16. Montaje bipolar de doble banana . . . . . . . . . . . . . . . . . . . . . . . . . 37 17. Distribución estudios con referencia ar y le en SEIZ TUH . . . . . . . . . . . 40 18. Flujo de trabajo con datastore . . . . . . . . . . . . . . . . . . . . . . . . . . 41 19. Flujo de trabajo aprendizaje de máquina tradicional y profundo . . . . . . . . 44 20. Arquitectura de red LSTM utilizada en el experimento . . . . . . . . . . . . . 45 21. Progreso del entrenamiento de la red LSTM . . . . . . . . . . . . . . . . . . . 46 22. Matriz de confusión de la red LSTM . . . . . . . . . . . . . . . . . . . . . . . 47 23. Arquitectura de red TCN utilizada en el experimento . . . . . . . . . . . . . . 48 24. Progreso del entrenamiento de la red TCN . . . . . . . . . . . . . . . . . . . . 50 25. Matriz de confusión de la red TCN . . . . . . . . . . . . . . . . . . . . . . . . 50 26. Estructura de red BiLSTM EEGnet . . . . . . . . . . . . . . . . . . . . . . . 52 27. Estructura de red LSTM EEGnet profunda . . . . . . . . . . . . . . . . . . . 52 28. Estructura de red LSTM EEGnet con modwt . . . . . . . . . . . . . . . . . . . 52 29. Estructura de red LSTM EEGnet con cwt . . . . . . . . . . . . . . . . . . . . 52 viii 30. Arquitectura de red TCN utilizada en el experimento . . . . . . . . . . . . . . 55 31. Ejemplos de entrenamiento y matriz de confusión para las redes entrenadas . 57 32. Análsis archivos de proyectos tras cambios en migración . . . . . . . . . . . . 60 33. Modi�caciones campo para ingresar contraseña . . . . . . . . . . . . . . . . . 60 34. Error al cerrar ventanas secundarias . . . . . . . . . . . . . . . . . . . . . . . 61 35. Alerta al cerrar ventana principal . . . . . . . . . . . . . . . . . . . . . . . . . 61 36. Modi�caciones ventana de análisis . . . . . . . . . . . . . . . . . . . . . . . . 63 37. Nueva ventana de anotaciones por montaje . . . . . . . . . . . . . . . . . . . 63 38. Selección automática de canales estándar . . . . . . . . . . . . . . . . . . . . . 63 39. Montaje bipolar doble banana generado automáticamente con su cursor . . . 64 40. Ventana generada al identi�carse eventos de convulsión . . . . . . . . . . . . . 64 41. Montaje aislado de evento de convulsión generado . . . . . . . . . . . . . . . . 65 42. Ventana generada al no identi�carse eventos de convulsión . . . . . . . . . . . 65 ix Lista de cuadros 1. Trabajos relacionados al estudio de la epilepsia mediante ML . . . . . . . . . 3 2. Ejemplos de arquitecturas en modelos de DL para EEG . . . . . . . . . . . . 4 3. Electrodos disponibles en casco . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4. Ejemplo de etiquetado en estudios EEG . . . . . . . . . . . . . . . . . . . . . 37 5. Ejemplo de etiquetado en estudios EEG . . . . . . . . . . . . . . . . . . . . . 37 6. Especi�caciones ordenador utilizado . . . . . . . . . . . . . . . . . . . . . . . 41 7. Resumen resultados con LSTM EEGnet . . . . . . . . . . . . . . . . . . . . . 53 8. Resumen resultados con TCN EEGnet . . . . . . . . . . . . . . . . . . . . . . 56 9. Listado de etiquetas disponibles en base de datos TUH SEIZ . . . . . . . . . . 74 x Resumen El presente trabajo se enfocó en la implementación y evaluación de algoritmos de apren- dizaje automático con énfasis en aprendizaje supervisado para el análisis de señales EEG de pacientes con epilepsia, como parte de la línea de investigación desarrollada en conjunto con HUMANA en la Universidad del Valle de Guatemala. Los objetivos principales incluyeron la exploración de redes neuronales profundas (LSTM y TCN) para preservar la secuencia- lidad de las señales y la detección de segmentos de interés, así como la actualización de la herramienta Epileptic EEG Analysis Toolbox. Para ello, se emplearon estudios de la base de datos de The Temple University Hospi- tal (TUH), ampliando signi�cativamente la diversidad y cantidad de señales analizadas. Se evaluaron múltiples con�guraciones de redes neuronales, logrando una precisión consistente superior al 81% en la clasi�cación de eventos de convulsión y no convulsión. Las redes TCN destacaron por su e�ciencia en tiempo de entrenamiento y su capacidad para capturar de- pendencias temporales mediante convoluciones causales y dilatadas, mientras que las redes LSTM ofrecieron un rendimiento competitivo, aunque con mayores demandas computacio- nales. Asimismo, se implementaron mejoras en la herramienta Epileptic EEG Analysis Toolbox, incorporando nuevas funcionalidades como montajes automatizados, generación de anota- ciones basadas en redes neuronales y optimización del código para garantizar un mejor desempeño. Estas actualizaciones permiten una interacción más intuitiva para los médicos y sientan las bases para futuras exploraciones de algoritmos de aprendizaje profundo. Este trabajo representa un avance signi�cativo en el análisis de señales EEG mediante aprendizaje profundo, estableciendo un marco de referencia para la integración de estas técnicas como herramientas clínicas y proporcionando recomendaciones para superar las limitaciones computacionales identi�cadas. xi Abstract The present study focused on the implementation and evaluation of machine learning algorithms, with an emphasis on supervised learning, for the analysis of EEG signals from epilepsy patients. This work is part of the research line developed in collaboration with HUMANA at Universidad del Valle de Guatemala. The primary objectives included the exploration of deep neural networks (LSTM and TCN) to preserve the sequential nature of the signals and detect segments of interest, as well as the enhancement of the Epileptic EEG Analysis Toolbox. To achieve these goals, data from The Temple University Hospital (TUH) database were utilized, signi�cantly increasing the diversity and volume of analyzed signals. Multiple neural network con�gurations were evaluated, achieving consistent accuracy rates exceeding 81% in the classi�cation of seizure and non-seizure events. TCN networks demonstrated superior e�ciency in training time and the ability to capture temporal dependencies through causal and dilated convolutions, whereas LSTM networks delivered competitive performance albeit with higher computational demands. Furthermore, improvements to the Epileptic EEG Analysis Toolbox were implemented, including new functionalities such as automated montages, annotation generation based on neural networks, and code optimization to ensure enhanced performance. These updates pro- vide a more intuitive interface for clinicians and lay the groundwork for future explorations of deep learning algorithms. This study represents a signi�cant advancement in EEG signal analysis using deep lear- ning, establishing a reference framework for integrating these techniques into clinical tools and o�ering recommendations to address the identi�ed computational limitations. xii CAPÍTULO 1 Introducción La epilepsia es una enfermedad neurológica que afecta a millones de personas en todo el mundo. Aunque los avances en la investigación han permitido que muchos pacientes mejoren su calidad de vida con tratamientos adecuados, el diagnóstico y tratamiento de esta afección siguen siendo un desafío. Los electroencefalogramas (EEG) son una herramienta fundamental para la evaluación de pacientes con epilepsia, pero el análisis de estos estudios es un proceso manual que requiere tiempo y experiencia por parte de los médicos especialistas. Esto resalta la necesidad de desarrollar herramientas automatizadas que faciliten y optimicen el análisis de señales bioeléctricas, como los EEG. En este contexto, la aplicación de algoritmos de aprendizaje automático se ha conver- tido en una estrategia prometedora para la identi�cación y categorización de segmentos de interés en señales bioeléctricas. Este trabajo de graduación, enfocado en técnicas de apren- dizaje supervisado, tuvo como objetivo avanzar en el desarrollo de una herramienta capaz de procesar y analizar EEG de manera e�ciente. Esto se logró mediante la implementación de algoritmos de aprendizaje automático para la identi�cación de patrones asociados con episodios epilépticos. Este trabajo se desarrolló como la quinta fase de la línea de investiga- ción en la Universidad del Valle de Guatemala, en la que se ha trabajado previamente en la creación y optimización de la herramienta Epileptic EEG Analysis Toolbox. El objetivo principal de esta investigación fue identi�car y categorizar segmentos de inte- rés en señales bioeléctricas, esto mediante algoritmos de aprendizaje automático supervisado. Para alcanzar este objetivo, se plantearon varios objetivos especí�cos, como la obtención de nuevas señales bioeléctricas, la investigación de características de las señales y algoritmos, la optimización del proceso de detección de segmentos de interés y la actualización de la herramienta de software existente. 1 CAPÍTULO 2 Antecedentes 2.1. Contexto general de la epilepsia La epilepsia es una enfermedad neurológica prevalente en todo el mundo, afectando a más de cincuenta millones de personas para el año 2019 [1]. Gracias a los avances en la investigación de esta afección, se han logrado resultados prometedores. Para el año en mención, aproximadamente una cuarta parte de los casos de epilepsia eran prevenibles, y al menos el 70% de los pacientes estudiados podían reanudar sus actividades diarias con el tratamiento adecuado. Este padecimiento es considerado un problema de salud pública, no solo por su rele- vancia médica, sino también por su profundo impacto social. A lo largo de la historia, esta enfermedad ha sido una causa de discriminación y estigmatización, afectando el bienestar social y psicológico de quienes la padecen, además de conllevar altos costos económicos [2]. Estas di�cultades resaltan la importancia de contar con métodos de diagnóstico e�caces y accesibles, que contribuyan a una mejor comprensión y manejo de la epilepsia. Sin embargo, uno de los grandes desafíos para un diagnóstico adecuado de esta en- fermedad es la interpretación de los electroencefalogramas (EEG), estudios esenciales que registran la actividad eléctrica cerebral. Actualmente, este proceso sigue siendo en gran me- dida manual y depende de la experiencia del especialista, lo que implica una considerable inversión de tiempo y recursos. Esto ha impulsado la exploración de tecnologías avanzadas, como el aprendizaje automático, que ofrecen soluciones para mejorar la detección y análisis de patrones en el EEG, y así transformar el diagnóstico de la epilepsia. 2 2.2. Estado del arte en el uso del aprendizaje automático para la epilepsia Siddiqui señala que, la detección de convulsiones y obtención de conocimiento relacio- nado con el cerebro es una tarea compleja [3]. Sin embargo, en las últimas tres décadas, con la ayuda del aprendizaje automático (machine learning, ML), se ha logrado automatizar y mejorar la precisión de estos procesos. Permitiendo a investigadores obtener resultados importantes en la segmentación clasi�cada de EEG, siendo esto novedoso pues como ante- riormente se discutía, el análisis de estos es actualmente un proceso manual que depende en gran medida de la pericia de los médicos, quienes en ocasiones deben de analizar hasta 72 horas de un estudio [4]. Como se observa en el Cuadro 1, se han tenido distintos acercamientos mediante di- ferentes algoritmos (clasi�cadores), como distintas maneras de representar los EEG (ca- racterísticas) obteniéndose resultados prometedores que en su mayoría superan el 80% de rendimiento. Esto ha motivado a múltiples investigadores a seguir explorando este campo. Con el aumento de bases de datos extensas de EEG, el campo ha expandido su enfoque hacia el aprendizaje profundo (Deep Learning, DL). Clasi�cador(es) Característica(s) Rendimiento (%) SVM Vector 96 Random forest Time and frequency 93.8 ANN Line length 99.6 Burst detection algo Line length 84.27, 84,85.7 Normalization Line length 52 ELM and BPNN SE 95.6 SVM and ELM AE and SE 95.58 SVM DWT 94.8 GMM Spectral, hybrid, temporal 87.58 Random forest PCA, STF, Moving Max 97.12, 99.29, 0.77/h Random forest and k-NN Spectral power 80.87, 47.45, 2.5/h, 56.23 Boosting Stockwell 94.26, 96.34 SVM, MLP, KNN, Naïve bayes Energy 98.75 Random forest Entropy and DWT 98.45 SVM Time�Frequency 90.62, 99.32 Random forest Time-domain 96.94 SVM, LDA, QDA, LC, PC, DT, KNN, UDC, PARZEN Time�frequency 84, 85 SVM DWT 86.83 SVM and neural network DWT and CWT 99.1 ELM Time�frequency 97.73, 0.37/h SVM DWT 99.38 LS-SVM FFT and DWT 100 SVM and Naïve bayes Entropy, RMS, variance, energy 96.55, 95.63, 95.7 LS-SVM 8 types of Entropies 100, 99.4, 99.5 ANN Spectral power 86 KNN and GHE - 100 Random forest DWT 99.74, 0.21/h Random forest STFT, mean, energy and std dev 96.7 Random forest, SVM, KNN, and Adaboost 28 statistical and time�frequency features 97.6, 94.4, 96.1, 92.9, 98.8, 0.96 ANN, KNN, SVM, and Random forest Mean, std dev, power, skewness, kurtosis, absolute mean 100 SVM Energy 99.5 SVM and Random forest 10-time and frequency 0.98 LS-SVM DCT, SVD, IMF, DCT-DWT 91.36 SysFor and Forest CERN 9 statistical features 100 Random forest L1-penalized robust regression (L1PRR) 100 SVM, NB, KNN, random forest, logistic model Trees (LMT) 15-features 97.40, 97.40,97.50 Random forest IMF 98.4,98.6,96.4 ANN Time�frequency 100 Decision forest�Random forest, Boosting 9 statistical features 96.67,74.36, 84.06 Cuadro 1. Trabajos relacionados al estudio de la epilepsia mediante ML Nota. Obtenido de [3]. 3 El aprendizaje profundo, una rama del aprendizaje automático, ha demostrado un gran potencial en áreas relacionadas, como el análisis de electrocardiogramas y el procesamiento de imágenes médicas [5]. Una de sus principales ventajas, es la capacidad de extraer pa- trones complejos directamente de los datos sin procesar, lo que permite obtener resultados más precisos y construir modelos que se adaptan mejor a la naturaleza de los datos. En el contexto de los EEG, esto signi�ca que los modelos pueden aprender por su cuenta ca- racterísticas relevantes para la detección de convulsiones, sin requerir que el investigador seleccione manualmente dichas características. Como se muestra en el Cuadro 2, estos mo- delos han alcanzado hasta un 89% de precisión en tareas de clasi�cación de EEG, lo que subraya su efectividad en el reconocimiento de patrones complejos. Arquitectura Precisión (%) SAE 3 capas ocultas, 1 capa densa 54 Híbrida 1 capa convolucional, 1 capa RNN, 2 capas densas 73 Híbrida 2 capas convolucionales, 1 capa RNN, 1 capa densa 75 CNN 5 capas convolucionales, 1 capa densa 81 MLPNN 4 capas ocultas 82 RNN 2 capas LSTM, 1 capa densa 87 CNN 2 capas convolucionales, 2 capas densas 87 CNN 2 capas convolucionales, 1 capa densa 88 DBN (3 capas RBM's), 1 capa densa 89 Cuadro 2. Ejemplos de arquitecturas en modelos de DL para EEG Nota. Obtenido de [5]. 2.3. Evolución línea de investigación en Universidad del Valle de Guatemala La línea de investigación sobre el uso de algoritmos de aprendizaje automático en el aná- lisis de EEG para la detección de crisis epilépticas en UVG comenzó en 2020, impulsada por el trabajo de María Angulo y Luis Rivera en colaboración con el Centro de Epilepsia y Neu- rocirugía Funcional (HUMANA) [6]. Desde entonces, esta iniciativa ha buscado desarrollar una herramienta innovadora que facilite el análisis automatizado de señales EEG, optimi- zando el diagnóstico de la epilepsia mediante el uso de técnicas avanzadas de aprendizaje automático. En el trabajo realizado por Angulo se propuso desarrollar y aplicar algoritmos de aprendi- zaje automático a EEG de pacientes con epilepsia. Esto mediante una interfaz implementada en MATLAB, demostrando la factibilidad de caracterizar segmentos de EEG mediante el uso de redes neuronales arti�ciales (ANN, por sus siglas en inglés) y máquinas de vectores de soporte (SVM, por sus siglas en inglés) con una precisión superior al 95%. Al vez, María Pineda [7] implementó una base de datos con phpMyAdmin y MySQL para almacenar los estudios de los pacientes. Ambas resaltaron la importancia de ampliar el conjunto de seña- les disponibles para explorar otras técnicas de caracterización y algoritmos de aprendizaje automático no supervisado para la mejora de la herramienta. En el año 2021, José David Vela retomó la línea de investigación con el objetivo de im- 4 plementar el reconocimiento y anotación de episodios ictales (fase activa de una convulsión) en EEG [8]. Para lo cual, implementó una SVM de tiempo continuo con kernel gaussiano logrando una exactitud de 96.7% ± 3.81%. Esta mejora incluyó la implementación de una sección para el entrenamiento de un algoritmo de aprendizaje automático especí�co, para su posterior utilización en la clasi�cación de las señales con la nueva categoría implemen- tada. Destacó el uso de características mediante transformadas Wavelet para la reducción de tiempo computacional y extendió nuevamente la necesidad de contar con más datos por parte de HUMANA para la validación de la herramienta. Posteriormente, en el año 2022, Camila Lemus retomó la recomendación de [6] para im- plementar algoritmos de aprendizaje automático no supervisado [9]. En primera instancia, se centró en validar la herramienta existente utilizando bases de datos de EEG y electro- cardiograma (ECG), rea�rmando la precisión de las ANN para la segmentación (99.6% ± 0.61%) y la e�ciencia de la extracción de vectores de características en términos de tiem- po computacional. Introdujo el uso del algoritmo de agrupamiento (clustering) k-means de aprendizaje no supervisado, demostrando ser e�ciente en términos de tiempo computacional pero no logrando una precisión superior al 85.51%. Se enfatizó nuevamente la necesidad de contar con más datos para el entrenamiento de modelos de aprendizaje, tanto supervisados como no supervisados, y de explorar la combinación de características junto con algoritmos e�cientes en tiempo computacional. Entre los años 2020 y 2022, se tuvieron avances signi�cativos en la herramienta y explora- ción de algoritmos de aprendizaje automático. Por ende, resulta crucial comprender el estado actual de la herramienta hasta el año pasado, considerando las contribuciones de Cristhofer Patzán y Diego Méndez, quienes validaron y optimizaron la herramienta buscando que esta quede formalmente funcional al lograrse un entrenamiento adecuado de los algoritmos. La última revisión por Patzán [10] se enfocó en aplicar algoritmos de aprendizaje au- tomático a una muestra más amplia de señales bioeléctricas, como EEG y electromiografía (EMG), con el �n de mejorar la detección de segmentos relevantes en el estudio de la epi- lepsia. Validó el rendimiento de estos algoritmos mediante análisis estadístico y actualizó la interfaz de la herramienta para abordar tiempos computacionales de�cientes. Resaltó la importancia de una muestra equitativa de datos para evitar sesgos en los algoritmos de clasi�cación. Además, determinó que los algoritmos que emplean transformadas wavelets tiempo-frecuencia ofrecen mejores resultados tanto en clasi�cación como tiempo computacio- nal. Como resultado, la última versión de la herramienta ha sido optimizada en términos de tiempo computacional y algoritmos de detección de segmentos de interés en señales. Se sugiere explorar el algoritmo Chamaleon y continuar la recopilación de datos de HUMANA para el entrenamiento de los algoritmos. El algoritmo Chamaleon, como indica Shehadeh [11], es un algoritmo que se basa en el comportamiento de los camaleones cuando buscan a su presa y por ello su nombre comple- to es Chameleon Swarm Algorithm (CSA). Este busca resolver problemas de optimización numérica global con bajo costo computacional, lo cual es posible pues se emplea una pobla- ción de agentes (camaleones) distribuidos para recorrer el plano del problema y conforme se acerca alguno de estos a un dato �presa�, este permanece cerca de la región del plano para agrupar de manera óptima por cercanía. Por lo que, la exploración de este algoritmo puede resultar adecuada para la segmentación de las señales bioeléctricas por su estabilidad, bajos tiempos computacionales y adaptabilidad a distintos problemas de agrupamiento. 5 Méndez [12] se enfocó en validar y migrar la herramienta para su implementación en HU- MANA. De�nió los requerimientos mínimos de hardware y validó el funcionamiento de esta en distintos ordenadores. En conjunto con las mejoras de [10], implementó algoritmos más e�cientes para el control de la base de datos y el despliegue de resultados en la herramienta. Estas acciones en conjunto, permitieron la validación de la herramienta para su migración segura y funcional a HUMANA. Se recomendó la exploración de algoritmos que permitan reducir aún más tiempos computacionales y proporcionar más información al usuario, a la vez que se sugiere evaluar posibles mejoras basándose en el programa BWAnalysis. El programa BWAnalysis es de los programas más avanzados disponibles para el análisis de EEG. Este permite segmentar las señales en ventanas de tiempo de�nido por el usuario, obtener características básicas (i.e., amplitud, frecuencia, etc.) y complejas (i.e. FFT, espec- tro de frecuencias, etc.) de las señales, sincronización del video del estudio con las señales y trazado de los segmentos de interés para la elaboración de informes [13]. Por lo que, re- sulta importante tener en cuenta la funcionalidad y características de este programa, pues la herramienta que se desarrolla dentro de esta línea de investigación busca optimizar los procesos ya familiarizados con los doctores. La última actualización de la herramienta Epileptic EEG Analysis Toolbox para el estu- dio de la epilepsia mostró avances signi�cativos haciéndola más intuitiva y optimizada para un menor consumo de recursos computacionales (ver Figura 1). Esto se logró mediante la validación y mejora de los algoritmos de aprendizaje automático, junto con las optimiza- ciones en la interfaz, tanto para el despliegue de resultados como para el uso de recursos. Esta iteración acerca la herramienta a su implementación formal en HUMANA, aunque to- davía existen limitaciones por abordar antes de su adopción de�nitiva. Se requiere un mayor equilibrio en los datos, con una proporción equitativa entre pacientes sanos y con epilepsia, para un entrenamiento e�caz de los algoritmos. También es importante explorar algoritmos de aprendizaje automático innovadores, optimizar aún más los tiempos computacionales y mejorar el despliegue de resultados. Por último, validar la herramienta en un entorno médico real es crucial para comprobar su e�cacia en la práctica. Figura 1. Última iteración de herramienta - Anotaciones Nota. Obtenida de: [10]. 6 CAPÍTULO 3 Justi�cación Según datos de HUMANA [4], alrededor de 325,000 personas en Guatemala padecen epilepsia, y aproximadamente el 30% de estos casos son de difícil control. El impacto de la epilepsia va más allá de la salud, afectando la vida social y profesional de quienes la padecen. Se han reportado casos de niños expulsados de escuelas tras sufrir un ataque epiléptico y trabajadores despedidos por la misma razón [2]. Además, el de�ciente acceso a la salud en el país implica que no hay su�cientes herramientas para facilitar el diagnóstico de la epilepsia, lo que obliga a los pacientes a afrontar altos costos para obtener tratamientos adecuados (e.g., EEG ∼ US$100 [14]). Ante este escenario, es fundamental la investigación sobre la epilepsia y el desarrollo de herramientas en el país, tanto para su estudio como para su tratamiento, con el �n de mejorar la calidad de vida de quienes la padecen y reducir el estigma asociado a la enfermedad. El trabajo reciente en la herramienta Epileptic EEG Analysis Toolbox ha demostrado avances signi�cativos en términos de mejora de algoritmos de aprendizaje automático, opti- mización de tiempos computacionales y actualización de la interfaz de usuario. Sin embargo, estas deben ser continuadas para lograr una implementación efectiva de la herramienta. Para avanzar en esta línea de investigación, se requiere una muestra de datos mayor y equitativa para el entrenamiento de los algoritmos de aprendizaje automático, asegurando una representación equilibrada entre pacientes sanos y aquellos con epilepsia. Por ello, parte de este trabajo de graduación consistió en la recolección de más datos de HUMANA, bases de datos médicas e investigación de otros centros especializados en el estudio de la epilepsia. Este enfoque permitió reunir un conjunto de datos más amplio y diverso, lo cual fue fundamental para entrenar y validar los algoritmos de aprendizaje automático de manera efectiva. Además, este trabajo buscó optimizar los procesos de análisis y detección de eventos en las señales EEG mediante la implementación de aprendizaje profundo con las redes LSTM y TCN, adaptadas para clasi�car eventos de convulsión y no convulsión. Estas mejoras, junto con la actualización de la herramienta Epileptic EEG Analysis Toolbox, buscan no sólo avanzar en el análisis automatizado de señales EEG, sino también facilitar su adopción en entornos médicos, contribuyendo a un diagnóstico más accesible y e�ciente. 7 CAPÍTULO 4 Objetivos 4.1. Objetivo general Identi�car y categorizar segmentos de interés en señales bioeléctricas para el estudio de la epilepsia, mediante la implementación de algoritmos de aprendizaje automático, con énfasis en técnicas de aprendizaje supervisado. 4.2. Objetivos especí�cos Obtener señales bioeléctricas adicionales a las de fases anteriores, de pacientes con epilepsia en centros de estudios especializados como HUMANA. Investigar y evaluar características de las señales bioeléctricas, así como algoritmos de aprendizaje automático, con un enfoque en técnicas de aprendizaje supervisado, para mejorar el rendimiento de los clasi�cadores en la identi�cación y categorización de dichas señales. Optimizar el proceso de detección de segmentos de interés en las señales y la generación automática de anotaciones relevantes, según los parámetros de HUMANA. Realizar análisis estadísticos para evaluar el rendimiento de los algoritmos y determinar las características más efectivas para describir las señales bioeléctricas. Actualizar la herramienta de software para el estudio de la epilepsia desarrollada en fases anteriores, incorporando las mejoras en los algoritmos de clasi�cación y detección de segmentos de interés en las señales bioeléctricas. 8 CAPÍTULO 5 Alcance El presente trabajo de graduación abarcó la mejora y optimización de la herramienta Epileptic EEG Analysis Toolbox para el análisis de señales EEG en el contexto del estudio de la epilepsia. Esto incluyó la recolección y procesamiento de señales EEG provenientes de múltiples fuentes, con un énfasis particular en la base de datos de The Temple University Hospital (TUH), trabajada bajo los estándares establecidos por HUMANA. El enfoque principal se centró en la implementación de algoritmos de aprendizaje profun- do, representando una desviación signi�cativa de las metodologías tradicionales utilizadas en fases anteriores. Las redes neuronales profundas, especí�camente las arquitecturas LSTM y TCN, se entrenaron directamente con señales EEG crudas, eliminando la necesidad de procesos manuales de extracción de características. Este enfoque permitió explorar nuevas posibilidades para la detección y clasi�cación de eventos de convulsión y no convulsión, demostrando la viabilidad de estas técnicas en el análisis de señales EEG. Asimismo, se realizaron actualizaciones en la herramienta enfocadas en mejorar su fun- cionalidad y usabilidad para los médicos. Entre las mejoras destacan la incorporación de elementos grá�cos que facilitan la interacción, la visualización de señales mediante monta- jes automatizados, y la generación de anotaciones basadas en redes neuronales. Además, se migró la herramienta a las últimas recomendaciones de MATLAB en su versión 2024B, garantizando su compatibilidad y continuidad futura. El alcance de este trabajo no incluyó la implementación de un sistema completamente integrado en entornos clínicos reales, pero avanzó signi�cativamente en la preparación de la herramienta para futuras aplicaciones. Aunque se lograron avances importantes en la clasi�cación de eventos epilépticos y en la optimización mediante aprendizaje profundo, los recursos computacionales representaron una de las principales limitantes para alcanzar mayores niveles de precisión en los modelos. 9 CAPÍTULO 6 Marco teórico 6.1. Cerebro humano El cerebro humano es el órgano rector y más complejo del cuerpo humano, permitiendo la realización de movimientos motores y el procesamiento del entorno para la adquisición de aprendizajes o la respuesta a estímulos [15]. Se compone de dos hemisferios, derecho e izquierdo, que trabajan en conjunto en procesos como la memoria, el cálculo y el procesa- miento sensorial. Sin embargo, cada hemisferio también desempeña funciones especí�cas: Hemisferio izquierdo: en general, se ocupa del aprendizaje y procesamiento de infor- mación. � Pensamiento numérico, verbal y simbólico. � Expresión hablada y escrita. � Lectura. Hemisferio derecho: � Imaginación y creatividad, inclusive habilidades musicales. � Control de las emociones y sentimientos. � Pensamiento intuitivo. � Funciones espaciales. Además, el cerebro humano está dividido en diferentes regiones llamadas lóbulos (ver Figura 2), cada uno de los cuales desempeña funciones especí�cas. Estos lóbulos incluyen el frontal, parietal, temporal y occipital, cada uno de los cuales tiene características y funciones distintas. A continuación, se explorará en detalle la función de cada lóbulo [15]. 10 Figura 2. Lóbulos del cerebro y su ubicación Nota. Obtenida de [15]. Lóbulo frontal: responsable del control motor, la plani�cación, la toma de decisiones y la personalidad. Lóbulo parietal: se encarga del procesamiento sensorial, la percepción espacial y la integración de información. Lóbulo temporal: relacionado con la audición, la memoria y el procesamiento del len- guaje. Lóbulo occipital: principalmente asociado con la visión y el procesamiento visual. 6.1.1. Actividad eléctrica del cerebro En 1929, Hans Berger acuñó por primera vez el término �electroencefalograma (EEG)� para referirse al registro de la actividad eléctrica del cerebro captada a través de electrodos colocados en el cuero cabelludo [16]. Estas señales eléctricas son generadas por las células pi- ramidales de la corteza cerebral, conocidas como neuronas, las cuales actúan como diminutos dipolos eléctricos con polaridad dependiente de su estado (inhibitorio o excitatorio). Dado el interés en comprender el funcionamiento del cerebro, los EEG se han vuelto indispensables para la evaluación de pacientes con trastornos del sistema nervioso, como epilepsias y convulsiones. Para estandarizar el procedimiento y facilitar la comparación de resultados entre diferentes pacientes, se ha desarrollado un sistema de colocación de elec- trodos conocido como el estándar IS 10-20 (ver Figura 3). Este estándar, ampliamente utilizado en la práctica clínica, de�ne la ubicación de los electrodos en relación con puntos anatómicos especí�cos en el cuero cabelludo, lo que permite una interpretación más precisa de los registros de EEG [17]. 11 Figura 3. A) Vista lateral IS 10-20 y B) Vista superior IS 10-20 Nota. F = Frontal, C = Central, P = Parietal, T = Temporal, O = Occipital, A = Auricular, Z = plano sagital, Impares = hemisferio izquierdo y Pares = hemisferio derecho. Obtenida de [18]. 6.1.2. Ritmos normales Debido a la estandarización, se ha podido determinar artefactos �siológicos en los EEG (como el ruido debido al latido del corazón, la respiración y el movimiento muscular) y, en especial, se han identi�cado los ritmos normales en un EEG (ver Figura 4) [2]. Estos, también conocidos como actividad base, se clasi�can de la siguiente manera: Delta (δ): señal en el rango de frecuencias de 0.5 a 4 Hz y una amplitud alta entre 100 a 200 µV [17]. Es dominante durante el sueño profundo (etapas 3 y 4) y debe de prestarse atención a la región en que se identi�que pues movimientos musculares pueden producir este tipo de ritmo. En un adulto no debe de presentarse este ritmo estando despierto, en niños es aceptable ya que re�eja madurez de la corteza cerebral. Theta (θ): señal en el rango de frecuencias de 4 a 8 Hz y una amplitud >30 µV [17]. Este es predominante cuando el sujeto se encuentra dormido, en especial si presenta sueño con movimiento ocular rápido (MOR). Es identi�cable en la región de los lóbulos temporales, se puede clasi�car como θ baja (4 a 6 Hz), asociada con vigilia disminuida con somnolencia alta, y theta alta (6 a 8 Hz), relacionada con la memoria de trabajo activa. En adultos, este ritmo no debe de presentarse estando despierto, en niños es aceptable la presencia hasta la adolescencia. Alpha (α): señal en el rango de frecuencias de 8 a 13 Hz y una amplitud baja entre 30 a 50 µV (mayor en el hemisferio derecho) [17]. Este es dominante durante la relajación en estado de vigilia con los ojos cerrados y es atenuado al abrir los ojos o por esfuerzo mental. Indica la activación cortical y se observa en las regiones occipitales y frontales, pudiéndose propagar a la región parietal y temporal posterior. 12 Beta (β): señal en el rango de frecuencias de 13 a 30 Hz y una amplitud >30 µV [17]. Este es dominante en un estado de vigilia con los ojos abiertos y es notorio en actividad mental. Se localiza principalmente en la región frontal (fronto-central) y puede verse afectada por sedantes o drogas hipnóticas. Gamma (γ): señal en el rango de frecuencias de 30 a 50 Hz [17]. Es predominante durante la actividad mental superior, como la interpretación de objetos para formar una imagen coherente. Indica la percepción y la conciencia del individuo, y no está presente en sujetos sedados. Figura 4. Ejemplos de actividad base en EGG con su espectro de frecuencia Nota. Obtenida de [19]. 6.2. Epilepsia La epilepsia, una condición crónica con múltiples causas, se mani�esta comúnmente a través de crisis recurrentes, desencadenadas por descargas excesivas de las neuronas cerebra- les, que pueden presentarse con síntomas físicos o conductuales (manifestaciones clínicas) o ser identi�cadas mediante estudios (paraclínicas) [2]. Esta enfermedad neurológica es al- tamente prevalente a nivel mundial, afectando a más de cincuenta millones de personas para el año 2019 y, a nivel Guatemala, alrededor de 325,000 personas la padecen, siendo aproximadamente el 30% de estos casos de difícil control [1][4]. 13 Según indica [20], el término �epilepsia� no se re�ere a una sola condición, sino a múl- tiples patologías que pueden manifestarse con crisis epilépticas. Estos síndromes epilépticos se clasi�can según el grupo etario del paciente, que incluye neonatal-lactante, preescolar y escolar, así como epilepsias generalizadas idiopáticas y de edad variable. Hasta el año 2022, se habían identi�cado 41 patologías epilépticas distintas, cada una con sus propias características epileptiformes durante las diferentes fases de una crisis epiléptica. Entonces, las epilepsias conllevan una predisposición a experimentar crisis epilépticas recurrentes, y se diagnostican cuando una persona ha experimentado dos o más de estas crisis. Estas crisis pueden manifestarse con una variedad de síntomas, desde sensaciones subjetivas extrañas o difíciles de describir hasta fenómenos auditivos, visuales, motores o sensaciones de hormigueo. Dichos síntomas pueden aparecer de forma aislada y autolimitada, lo que signi�ca que pueden presentarse de manera independiente y limitarse a un período breve de tiempo sin progresar a una crisis completa. Además, las crisis pueden presentarse con sacudidas de una (o más) extremidad o de la mitad de la cara sin que haya pérdida de la conciencia, o con una pérdida brusca de la misma, seguida de caída al suelo y contracciones musculares seguidas de sacudidas rítmicas [2]. 6.2.1. Anomalías epileptiformes Las descargas eléctricas características de las crisis epilépticas siguen patrones identi�- cables por su frecuencias y evolución en el espacio-tiempo [19]. Por lo que, es importante de�nir cómo estas se cuanti�can e identi�can por su forma. Para la cuanti�cación de las descargas eléctricas se emplea el siguiente criterio, según su aparición: Abundantes: ≥ 1/10 s Frecuentes: < 1/10 s a ≥ 1/min Ocasionales: < 1/min a ≥ 1/h Raras: < 1/h Mientras que, para la clasi�cación por su forma, se sigue el glosario de la IFCN 2017 (ver Figura 5) [19]. En este se establecen las siguientes formas y sus características: Onda aguda (Spike): onda transitoria con pico puntiagudo, es distinguible de la ac- tividad de fondo y con una duración de 20 a 70 ms. La amplitud es variable, pero típicamente es de 50 µV. Esta puede ser monofásica o multifásica, con un componente negativo dominante. Polipunta (Polyspike complex ): secuencia de dos o más ondas agudas. Punta-onda (Sharp Wave): transitorio epiléptico claramente distinguible de la activi- dad de fondo, con pico puntiagudo y una duración de 70 a 200 ms. Por lo general, tiene una amplitud variable (100-200 µV) y un componente negativo dominante. 14 Onda aguda - onda lenta (Spike and Slow Wave complex ): patrón epiléptico claramente distinguible de la actividad de fondo. Este puede ser único o múltiple, consiste en una onda aguda y una onda lenta asociada. Polipunta - onda lenta (Polyspikes and slow wave complex ): patrón epiléptico que consiste en dos o más ondas agudas asociadas con una o más ondas lentas. Punta-onda - onda lenta (Sharp and slow wave complex ): patrón epiléptico claramente distinguible de la actividad de fondo. Este puede ser único o múltiple, consiste en una punta-onda y una onda lenta asociada. Figura 5. Ejemplos de EEG reales de anomalías epileptiformes Nota. a) Onda aguda. b) Polipunta. c) Punta-onda. d) Onda aguda - onda lenta. e) Polipunta - onda lenta. f) Punta-onda - onda lenta. Obtenida de [19]. 15 6.2.2. Fases de una crisis epiléptica Una crisis epiléptica se caracteriza por una serie de fases distintas, cada una con sus propias características y síntomas. Comprender estas fases es crucial tanto para quienes padecen epilepsia como para el estudio del paciente, ya que puede ayudar a reconocer los signos de una crisis [2]. Las fases de una crisis epiléptica son: Fase aura: es la primera etapa de una crisis epiléptica, también conocida como fase preictal. Ocurre justo antes de la fase ictal y puede durar desde unos segundos hasta una hora. Durante esta fase, el paciente puede experimentar síntomas como fatiga, cambios visuales, sensación de desconexión de la realidad y alucinaciones sensoriales. Los movimientos involuntarios breves, como los espasmos musculares, pueden ocurrir. Esta fase es causada por una alteración en la actividad cerebral que comienza poco antes de la fase más notable de la crisis, siendo esto notorio en el EEG al tenerse anomalías epileptiformes mezcladas con los ritmos normales [2]. Fase ictal: es la fase más evidente de una crisis epiléptica. Durante esta fase, puede experimentar alteraciones en la conciencia, movimientos involuntarios o ambos. Los movimientos involuntarios pueden implicar todo el cuerpo o una parte del mismo. La fase ictal generalmente dura desde unos segundos hasta unos minutos y puede ser convulsiva o no convulsiva. Estos síntomas se corresponden con los patrones vistos en el electroencefalograma (EEG) durante esta fase, que muestran una actividad eléctrica errática con anomalías epileptiformes continuas [2]. Fase postictal: ocurre después de la fase ictal de una crisis. Durante esta etapa, puede experimentar una variedad de síntomas, como fatiga extrema, confusión y parálisis temporal de una extremidad. La duración y la intensidad de los síntomas postictales pueden variar. Estos síntomas pueden correlacionarse con los cambios en el EEG du- rante la fase ictal y pueden durar desde varias horas hasta días, siendo notorias ciertas anomalías epileptiformes ocasionales mezcladas con los ritmos normales [2]. 6.2.3. Tipos de crisis epilépticas Las crisis epilépticas se clasi�can según su origen, presencia de síntomas motores y afec- tación de la consciencia. Por ello, en el año 2017, la Liga Internacional Contra La Epilepsia (ILAE, por sus siglas en inglés) publica su última revisión para la clasi�cación operacional de los tipos de crisis [21]. En la cual establecieron (ver Figura 6 para conocer sus subdivisiones): Crisis focales: estas comienzan en una región especí�ca del cerebro y pueden perma- necer focalizadas o propagarse para afectar otras áreas (bilateral Tónico-Clónica). Su clasi�cación depende de síntomas motores y alteraciones a la conciencia, dependiendo de la ubicación y extensión de la actividad epiléptica. Crisis generalizadas: estas involucran ambos hemisferios cerebrales simultáneamente desde el inicio y su clasi�cación depende únicamente de síntomas motores, pues gene- ralmente estas presentan conciencia alterada. 16 Crisis de inicio desconocido: en este tipo de crisis, no se puede determinar si la actividad epiléptica comienza focal o generalizada debido a la falta de información sobre el inicio del evento. Su clasi�cación se basa en síntomas motores, pero es importante determinar la naturaleza de la crisis para una adecuada clasi�cación Figura 6. Clasi�cación de crisis epilépticas ILAE 2017 Nota. Obtenida de [21]. 6.3. Análisis de señales EEG El análisis de los distintos canales de un EEG es fundamental para obtener información relevante de cada momento registrado durante el estudio. Para lograrlo, es crucial contar con una visualización adecuada de los valores, que puede lograrse mediante los montajes. Posteriormente, al explorar diversas técnicas de análisis disponibles, podemos identi�car segmentos de interés para detectar crisis epilépticas. Esta detección permite a los médicos no solo de�nir el tipo de epilepsia, sino también el síndrome asociado a la epilepsia en cuestión. 17 6.3.1. Montajes Los montajes se re�eren al registro grá�co de varios canales en una secuencia establecida, siendo los de 16 canales los más comunes, aunque también se utilizan montajes de 8 o hasta 32 canales, estos últimos principalmente en investigaciones médicas debido a su costo [2]. Entre los montajes disponibles se encuentran la referencia común (activa o inactiva), la referencia común promedio, la derivación de fuente y la derivación bipolar. Destacan especialmente dos tipos de montajes: el montaje de referencia común, también conocido como montaje monopolar, y el montaje bipolar [19]. El montaje monopolar, o de referencia común, utiliza un electrodo de referencia para los canales de interés (ver Figura 7a). Generalmente, este electrodo de referencia se coloca en el oído del hemisferio que se está analizando. Esto permite una comparación relativa entre la actividad eléctrica de diferentes áreas del cerebro. Sin embargo, puede introducir artefactos (ruido) debido a la actividad eléctrica muscular o a interferencias externas, lo que puede di�cultar la interpretación precisa de los datos. Por otro lado, el montaje bipolar utiliza dos electrodos adyacentes para cada canal de registro, lo que permite una medición más directa de la diferencia de potencial entre dos áreas especí�cas del cerebro (ver Figura 7b). Esto reduce la sensibilidad a artefactos comunes en el montaje monopolar y puede proporcionar una mayor resolución espacial. Sin embargo, el montaje bipolar puede requerir una mayor cantidad de electrodos y puede ser más difícil de interpretar para algunos tipos de análisis. (a) Montaje monopolar. (b) Montaje bipolar. Figura 7. Ejemplos de tipos de montajes Nota. R - referencia, A - electrodo activo (active), G - tierra (ground). Obtenida de [22]. 18 6.3.2. Análisis en el dominio de la frecuencia El análisis de señales en el dominio de la frecuencia, o análisis espectral, es una técnica ampliamente utilizada en diversos campos cientí�cos y es la base de muchos procesos comu- nes como la resonancia magnética. Esta técnica implica una transformación del EEG desde el dominio del tiempo (muestras en el tiempo) al dominio de la frecuencia (muestras para cada frecuencia). La mayor ventaja de esta técnica es resumir la información contenida en grandes tiempos a unos pocos valores. Sin embargo, al ser un análisis estadístico, el resulta- do será una información promedio sobre la estructura de la señal del EEG y no evidenciará patrones de señal muy cortos o señales de baja potencia [19]. Para llevar a cabo este tipo de análisis, resulta necesario obtener el espectro de frecuencias de uno o más canales (ver Figura 4). Con este espectro, es posible resumir características interesantes del dominio de frecuencia, tales como la potencia absoluta y relativa en las diferentes bandas, la frecuencia de potencia máxima, la frecuencia mediana, la frecuencia de borde espectral y la frecuencia dominante principal. Estas características pueden utilizarse por sí solas o en combinación entre sí para de�nir nuevas variables, a menudo llamadas índices. Una ventaja de estos índices es que representan características complejas de la señal de una manera comprensible y son menos sensibles al ruido que contamina los electrodos [19]. 6.3.3. Análisis en el dominio del tiempo El análisis de señales en el dominio del tiempo implica realizar mediciones y/o cálculos directamente sobre la señal original del EEG, sin ninguna transformación como en el caso del análisis espectral. Existen varios parámetros de los EEG en el dominio del tiempo, y en este contexto se menciona uno de los parámetros que es más utilizado: Cruces por cero: este parámetro se de�ne como el número de veces que la señal de EEG cruza la línea base. Sin embargo, es importante tener en cuenta que este parámetro no siempre representa el ritmo de la señal del EEG, ya que a menudo el ritmo de interés está enmascarado por el ritmo normal [19]. En cuanto a la visualización de la evolución de los datos en el tiempo, existen varias técnicas, entre las que se incluyen los histogramas y tendencias, así como el análisis de wavelet. Los histogramas y tendencias son métodos simples y e�cientes para mostrar la evolución temporal de un parámetro de interés (e.g., amplitud), mientras que el análisis de wavelet ofrece una representación tiempo-frecuencia más detallada, aunque a menudo pierde la visión general global que proporcionan los histogramas y tendencias [19]. Además de estos parámetros, otros aspectos relevantes del análisis en el dominio del tiempo incluyen las estadísticas básicas: valor medio, la mediana, la varianza, la desviación estándar, la asimetría y la curtosis de la señal de EEG [19]. 19 6.4. Algoritmos de aprendizaje automático El aprendizaje automático (ML) es un campo interdisciplinario de la inteligencia arti�cial (IA) que busca desarrollar algoritmos que permitan a las computadoras aprender y mejorar automáticamente a partir de la experiencia. A diferencia de los métodos tradicionales de pro- gramación, donde se especi�can todas las reglas, el aprendizaje automático permite que los sistemas informáticos descubran patrones en los datos para realizar tareas especí�cas. Este enfoque es especialmente útil en situaciones donde los datos son complejos o cambian con el tiempo, ya que los algoritmos pueden adaptarse y mejorar continuamente su rendimiento en función de la retroalimentación recibida [23]. Por lo anterior, los algoritmos de aprendizaje automático han emergido como herra- mientas poderosas en el análisis de EEG, especialmente cuando se combinan con técnicas de análisis en dominio de la frecuencia y tiempo. En el análisis de EEG en el dominio de la frecuencia, estos algoritmos pueden identi�car patrones complejos y características relevan- tes en las señales EEG, lo que permite una mejor comprensión de las diferentes frecuencias presentes y su relación con los estados mentales [3]. Por otro lado, en el análisis en el dominio del tiempo, los algoritmos de aprendizaje au- tomático pueden extraer características temporales de las señales EEG, como la duración de los eventos, la amplitud de los picos, y la frecuencia (cantidad) de aparición de ciertos patro- nes. Estas características temporales son cruciales para la detección de eventos especí�cos, como las convulsiones epilépticas [3]. Para llevar a cabo estas tareas en el análisis de EEG, se utilizan diversos algoritmos de aprendizaje automático, cada uno diseñado para abordar diferentes aspectos de la señales [3]. Estos algoritmos se clasi�can en tres categorías principales: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado (ver Figura 8). Figura 8. Tipos de aprendizaje automático Nota. Obtenida de [24]. 20 6.4.1. Aprendizaje supervisado En este tipo de aprendizaje, el algoritmo recibe un conjunto de datos etiquetados que incluyen entradas y sus salidas deseadas. Su objetivo es aprender una función que mapee las entradas a las salidas correctas. Básicamente, como se detalla en la Ecuación (1), este tipo de algoritmos desarrollan una función (f) que permita realizar inferencias de la salida (y) debido a su entrada (x) esto mediante el aprendizaje de parámetros (ϕ) [25]. y = f [x, ϕ] (1) Estos algoritmos son capaces de realizar tareas de regresión y de clasi�cación, donde la principal diferencia recae en que la salida (y) es continua (e.g., 10.5) para las tareas de regresión y discreta para las de clasi�cación (e.g., �bueno�). Según el tipo de tarea que se desea realizar, así se debe de seleccionar el algoritmo. Algunos algoritmos de aprendizaje supervisado son: De clasi�cación � Máquinas de vectores de soporte (SVM): utiliza un hiperplano que separa los da- tos de cada una de las clases. Cuando los datos no presentan un comportamiento lineal, permiten la utilización de kernels (funciones no lineales) para transformar los datos a un espacio de mayor dimensión y así presenten un comportamiento lineal [24]. � Árboles de decisión: tal como su nombre lo indica, estos replican la estructura de un árbol, donde los datos ingresan por el tronco y luego pasan a ser clasi�cados por las condiciones de cada rama que lleva a cada categoría. Estos pueden llegar a tener tantas rami�caciones como categorías que se busque clasi�car [24]. � Redes neuronales: estas se inspiran en el funcionamiento de las neuronas del cerebro humano, las cuales cuentan con una unidad básica llamada perceptrón que cumple con la Ecuación (1). Cada unidad básica, se interconecta con el resto que se tengan y es así que forman la red neuronal. Luego, cada unidad básica y conexión entre ellas contiene sus parámetros, los cuales mediante un entrenamiento se ajustan para lograr la clasi�cación en cada una de las categorías (salidas de la red) [25]. De regresión [24] � Regresión lineal: ajuste estadístico mediante una función lineal de la siguiente forma y = ϕ0 + ϕ1x. � Regresión no lineal: ajuste estadístico mediante una función no lineal de la forma y = ϕ0 + ϕ1x+ ϕ2x 2 + · · ·+ ϕnx n. � Máquinas de vectores de soporte (SVM): funcionan de la misma manera que las de clasi�cación, con la diferencia que ahora el hiperplano busca ajustarse al comportamiento de los datos. 21 6.4.2. Aprendizaje no supervisado En este tipo de aprendizaje, el algoritmo recibe un conjunto de datos sin etiquetar y debe encontrar patrones o estructuras interesantes en los datos [3]. No se le proporciona ninguna retroalimentación correcta o incorrecta. Algunos ejemplos de algoritmos de aprendizaje no supervisado incluyen: K-Means clustering Análisis de componentes principales (PCA) Algoritmos de agrupamiento jerárquico Mapas autoorganizados (SOM) 6.4.3. Aprendizaje reforzado En este tipo de aprendizaje, el algoritmo aprende a través de la interacción con un entorno. Recibe retroalimentación en forma de recompensas o penalizaciones en función de las acciones que toma. El objetivo es aprender una política que maximice la recompensa acumulada a lo largo del tiempo [3]. Algunos algoritmos de aprendizaje reforzado son, los siguientes: Q-Learning Aprendizaje profundo Q Política de gradiente suave (PG) Actor-Critic 6.5. Aprendizaje profundo En los últimos años, el campo del aprendizaje automático ha experimentado un notable auge, impulsado por avances en el procesamiento de grandes volúmenes de datos, capacidades computacionales y el desarrollo de nuevas técnicas (aprendizaje profundo/Deep Learning). Esto ha permitido un progreso signi�cativo en diversas áreas, donde la capacidad de estos algoritmos para adaptarse y mejorar con el tiempo ha resultado particularmente útil [25]. El aprendizaje profundo es una evolución del aprendizaje automático que integra las tres áreas principales de este campo (supervisado, no supervisado y por refuerzo) en un solo enfoque (ver Figura 9). Esto se logra mediante la implementación de redes neuronales profundas, que se adaptan según la funcionalidad buscada (i.e., clasi�cación o regresión) y el tipo de datos disponibles (e.g., imágenes, señales o texto). 22 Figura 9. Aprendizaje profundo y sus áreas Nota. Obtenida de [25]. El concepto de red neuronal profunda se basa en la de�nición dada anteriormente en la sección de aprendizaje supervisado (6.4.1), y en el teorema de aproximación universal. El cual, establece que cualquier función continua es aproximable por una red neuronal de una capa (perceptrón multicapa, MLP), siempre y cuando esta tenga las su�cientes neuronas en su capa oculta para representar la función (ver Figura 10). x1 Entradas x2 x3 ... xn h1 Capa oculta h2 ... hn y1 ... Salidas yn Figura 10. Perceptrón multicapa básico generalizado Entonces, una red neuronal profunda es la interconexión lineal de dos o más capas ocultas con sus neuronas de entrada y salida. Esta interconexión de capas ocultas, permite que este tipo de redes neuronales interpreten de mejor manera los datos, por lo que han ganado popularidad pues son capaces de aprender de los datos (aprender de la experiencia) sin la necesidad de proporcionarle características representativas de estos. A la vez que, se han optimizado sus algoritmos de entrenamiento para procesar grandes cantidades de datos, así llegando a superar capacidades humanas (e.g., predicción de enfermedades) y proporcionando nuevas herramientas (e.g., editores de fotos con IA). 23 6.5.1. Entrenamiento de redes neuronales profundas El entrenamiento de una red neuronal profunda se puede visualizar desde la perspectiva de un problema de optimización numérica, donde se busca minimizar la función de pérdida de la red ajustando sus parámetros (ϕ, Ecuación (1)). A pesar de esta perspectiva simple, este problema de optimización puede llegar a involucrar de cientos a millones de parámetros, por consiguiente, plantea retos signi�cativos para los enfoques de resolución tradicionales. Función de pérdida La función de pérdida o de costo mide la discrepancia entre las predicciones del modelo (f [xi, ϕ]) y el valor o clase real (yi). Esta función actúa como una guía para el entrenamiento del modelo, ajustando los parámetros de la red de manera que las predicciones sean lo más precisas posible [25]. La elección de la función de pérdida es crucial, ya que debe adaptarse al tipo de proble- ma1: en particular, si el modelo realiza una tarea de clasi�cación binaria o de clasi�cación multiclase. En el caso de clasi�cación binaria, donde solo hay dos posibles clases (e.g., ic- tal/no ictal), se suelen utilizar funciones de pérdida como la entropía cruzada binaria, que mide la probabilidad de que el modelo clasi�que correctamente en cada caso [25]. Por otro lado, en problemas de clasi�cación multiclase, donde existen múltiples clases posibles (e.g., clasi�car diferentes tipos de crisis epilépticas), se utiliza una versión gene- ralizada de la entropía cruzada. Esta función considera todas las clases posibles en cada predicción y evalúa la probabilidad asignada a la clase correcta [25]. Es importante distinguir entre estos tipos de problemas porque la función de pérdida debe re�ejar la estructura del conjunto de clases. De esta manera, la función de pérdida no solo mide el error, sino que también guía al modelo para lograr una clasi�cación precisa según el tipo de problema. Algoritmos de optimización Como se expuso anteriormente, los métodos tradicionales para resolver este problema de optimización pueden tornarse ine�cientes en redes profundas debido a la gran cantidad de parámetros. Por ello, se han desarrollado algoritmos de optimización especí�cos que permiten ajustar los parámetros de la red de manera más efectiva. Entre los más utilizados se encuentran el descenso de gradiente estocástico (SGD) con momentum y adam, mediante los cuales se ha alcanzado el estado del arte en múltiples modelos. 1Se omite problema de regresión, pues no se presenta un caso de este tipo en este trabajo. Consulte: medium.com/analytics-vidhya/a-comprehensive-guide-to-loss-functions-part-1-regression-�8b847675d6 24 https://medium.com/analytics-vidhya/a-comprehensive-guide-to-loss-functions-part-1-regression-ff8b847675d6 Descenso de gradiente estocástico con momentum (SGDM): el descenso de gra- diente estocástico (SGD) es un método de optimización que ajusta los parámetros de la red en función de un pequeño subconjunto de datos (minibatch) en cada paso (iteración), en lugar de utilizar el conjunto completo. Aunque esto acelera el entrenamiento, puede generar oscilaciones en el proceso de convergencia, di�cultando la llegada a un mínimo global [25]. Para reducir estas oscilaciones, se incorpora el concepto de momentum o momento, que añade una fracción del gradiente de la iteración anterior al cálculo actual. La actualización del parámetro en SGDM se de�ne como: θℓ+1 = θℓ − α∇E(θℓ) + γ(θℓ − θℓ−1), (2) donde: α es la tasa de aprendizaje, que controla la magnitud del ajuste en cada paso. ∇E(θℓ) es el gradiente de la función de pérdida respecto a los parámetros de la red en el paso (θℓ). γ es el valor de momentum, que determina cuánto del gradiente de la iteración previa in�uirá en la actualización actual. El parámetro de momentum ayuda a suavizar el trayecto de optimización, permitiendo que el modelo progrese más rápido en direcciones donde el gradiente se mantiene consistente y se reducen las oscilaciones (ver Figura 11). Figura 11. Efecto del momentum en SGD Nota. a) SGD sin momentum, b) SGD con momentum. Obtenida de [25]. 25 Adam (adaptive moment estimation): adam es una mejora sobre SGD que incorpora tanto momentum como una adaptación automática de la tasa de aprendizaje para cada parámetro. Utiliza momentos de primer y segundo orden del gradiente, es decir, el promedio y la varianza acumulados, respectivamente, para ajustar dinámicamente la función de pérdida [26]. Adam realiza la siguiente secuencia en cada iteración: 1. Cálculo del promedio acumulado del gradiente: mℓ = β1mℓ−1 + (1− β1)∇E(θℓ), donde: mℓ es el promedio acumulado de los gradientes de los parámetros. β1 es el factor de decaimiento que controla cuánto in�uye el gradiente actual en el promedio. 2. Cálculo del promedio acumulado del cuadrado del gradiente: vℓ = β2vℓ−1 + (1− β2)[∇E(θℓ)]2, donde: vℓ es el promedio acumulado del cuadrado de los gradientes de los parámetros. β2 es el factor de decaimiento que controla cuánto in�uye el gradiente actual en el promedio. Finalmente, la actualización de los parámetros en adam se de�ne como: θℓ+1 = θℓ − α ·mℓ√ vℓ + ϵ , (3) donde: ϵ es un pequeño valor constante para evitar divisiones por cero. Adam es especialmente útil en redes profundas, ya que adapta automáticamente la mag- nitud del ajuste para cada parámetro según la variación de su gradiente, permitiendo una convergencia más estable y rápida en muchos casos [25]. 6.5.2. Tipos de redes neuronales profundas En el campo del aprendizaje profundo, existen múltiples arquitecturas de redes neuro- nales diseñadas para abordar problemas especí�cos. Dos tipos de redes son particularmente relevantes en el análisis de señales temporales y secuenciales, como los electroencefalogra- mas (EEG): las redes neuronales recurrentes (RNN) y las redes neuronales convolucionales (CNN). 26 Redes neuronales recurrentes Las redes neuronales recurrentes (RNN, por sus siglas en inglés) están diseñadas para procesar datos secuenciales, lo cual las hace ideales para tareas en las que el orden de los datos y la dependencia temporal son importantes, como el análisis de EEG, la predicción de series temporales y el procesamiento de lenguaje natural. En una RNN, las conexiones entre las neuronas forman un ciclo que permite que la información persista a lo largo de las capas (ver Figura 12), creando una especie de �memoria� de corto plazo. Esta �memoria� permite que las RNN capten relaciones dependientes en el tiempo, facilitando el reconocimiento de patrones que evolucionan a lo largo de una secuencia [27]. Las RNN, sin embargo, presentan ciertos desafíos, como el desvanecimiento del gradiente, que limita su capacidad para capturar dependencias de largo plazo en secuencias largas. Este problema ha llevado al desarrollo de variantes de RNN que buscan mejorar la retención de información y mitigar esta di�cultad, como lo son las LSTM, GRU, entre otras. x1 x2 x3 Entradas h1 h2 h3 h4 Capa oculta y1 y2 Salidas Figura 12. Red neuronal recurrente (RNN) simpli�cada Redes neuronales convolucionales Las redes neuronales convolucionales (CNN) son ampliamente utilizadas en el proce- samiento de imágenes (ver Figura 13), pero también se han adaptado para analizar datos secuenciales y temporales, como los EEG. Las CNN aplican �ltros (o convoluciones) que extraen características locales de los datos, lo que permite detectar patrones repetitivos y estructuras en diferentes segmentos de la secuencia [25]. En el contexto de señales EEG, las CNN pueden capturar patrones especí�cos en intervalos de tiempo �jos, lo cual resulta útil para identi�car eventos de interés dentro de la señal. Una de las ventajas de las CNN es su capacidad para realizar estos análisis de manera paralela y e�ciente, aprovechando la naturaleza estructurada de las convoluciones. Además, al no depender de conexiones cíclicas, como en las RNN, las CNN pueden procesar secuencias más largas con menos problemas de gradientes desvanecidos y tiempo de inferencia. 27 Imagen RGB, x Convoluciones Capa oculta, hn Salidas, y Figura 13. CNN simpli�cada para imágenes RGB clasi�cación multiclase Otros tipos de redes neuronales Además de las RNN y CNN, existen otras arquitecturas de redes neuronales profundas, como las redes generativas antagónicas (GAN), los transformadores (transformers) y los au- toencoders [25]. Las GAN han revolucionado el campo de la generación de datos sintéticos, siendo útiles en aplicaciones como la generación de imágenes realistas. Por su parte, los transformadores han mostrado gran e�cacia en el procesamiento de secuencias largas, como en tareas de modelado de lenguaje natural. Finalmente, los autoencoders se utilizan frecuen- temente para la reducción de dimensionalidad y la extracción de características relevantes en datos complejos. Es importante mencionar que este campo está en constante evolución, con mejoras fre- cuentes a arquitecturas existentes y la introducción de nuevas variantes. Desde el año 2012, el interés en este enfoque ha experimentado un crecimiento notable, como se muestra en la Figura 14. Aunque no se profundiza en estas arquitecturas adicionales, representan di- recciones prometedoras para futuras investigaciones en el análisis de patrones en grandes conjuntos de datos. 2004 2006 2008 2010 2012 2014 2016 2018 2020 2022 2024 Año 0 10 20 30 40 50 60 70 80 90 100 In te ré s ( % ) Figura 14. Interés en el aprendizaje profundo Nota. Obtenida de [28]. 28 CAPÍTULO 7 Obtención y recolección de datos En este capítulo se describe el proceso de recolección de electroencefalogramas para este trabajo de graduación. Se incluyen las bases de datos investigadas, los centros especializados en epilepsia considerados para colaboración, y otras alternativas evaluadas. Este proceso representa un avance signi�cativo tanto para este proyecto de graduación como para la línea de investigación. 7.1. Propuesta de recolección de datos estandarizada Teniendo en cuenta el equipo disponible en la UVG para la recolección de señales bio- eléctricas, se evaluó como primer alternativa la implementación de un proceso de recolección estandarizado. Para ello, se inició con la evaluación de los equipos BIOPAC modelos MP36 y MP41, los cuales son interfaces certi�cadas ISO 9001:2015 para la adquisición de señales de bioeléctricas para �nes de investigación (ver Figura 15a). Se determinó que el modelo MP36 era apto para la recolección de electroencefalogramas, ya que es compatible con el casco de electrodos de la empresa Electro-Cap disponible en UVG (ver Figura 15b). Este casco cumple con el estándar 10/20, es compatible con los montajes monopolar y bipolar, dispone los canales que se presentan en el Cuadro 3 y se ajusta a pacientes mayores de 5 años de edad. 29 (a) Pruebas con BIOPAC MP41 (b) Casco de electrodos en UVG Figura 15. Equipo disponible para recolección de datos Nota. Figura 15b obtenida de [29]. Conector blanco Conector rojo Color de cable Fp1 Fp2 Café F3 F4 Rojo C3 C4 Naranja P3 P4 Amarillo 01 02 Verde F7 F8 Azul T3 T4 Violeta T5 T6 Gris Gnd Cz Blanco Fz Pz Negro Cuadro 3. Electrodos disponibles en casco Nota. Obtenido de [29]. 30 Dado que este proceso de recolección requeriría la participación de personas ajenas a la investigación, se procedió a elaborar un consentimiento informado con la siguiente estructura: Sobre la investigación: contexto del estudio, proporcionando el nombre, lugar, fecha y encargados de la investigación. Propósito y objetivo del estudio. Procedimiento para sesiones de medición: detalles sobre la realización del electroence- falograma básico y el trato que recibirá. Uso y con�dencialidad de los datos: limitaciones del uso de la información recopilada, destinada únicamente para �nes académicos y cientí�cos. Consideraciones asociadas a la participación: indicación de que el estudio no presenta riesgos para la salud del paciente, más allá de una posible irritación en la piel por la colocación de los electrodos. Bene�cios asociados a la participación: información sobre la contribución del partici- pante al desarrollo de la herramienta Epileptic EEG Analysis Toolbox. Condiciones de participación voluntaria. Declaración de consentimiento de participación. Declaración del encargado de la investigación. Firma de participante e información de investigadores. El documento completo de consentimiento informado se encuentra en la documentación de este trabajo de graduación en la carpeta �Documentos/Consentimiento Informado� (ver Anexos 15.1). La elaboración de este documento tenía como objetivo informar y solicitar la autorización de los pacientes para su participación en la investigación. Sin embargo, tras evaluar la seguridad de realizar mediciones a pacientes con y sin epilepsia, se determinó que existía un riesgo signi�cativo al hacerlo sin supervisión médica especializada. Este proceso requeriría el apoyo y/o capacitación de personal médico para monitorear y manejar posibles complicaciones durante las sesiones de medición, lo cual excedía los alcances de esta inves- tigación. Por lo tanto, se optó por realizar una investigación exhaustiva de bases de datos médicas disponibles y de centros especializados en epilepsia, como HUMANA, para obtener los datos necesarios de manera segura y con�able. 31 7.2. Centros especializados Con el objetivo de expandir las posibilidades de obtención de datos, se investigaron centros especializados en neurología y epilepsia que podrían ser considerados en fases futuras del proyecto. Estos centros, ubicados en diversos países, cuentan con la experiencia clínica y los recursos necesarios para proporcionar estudios electroencefalográ�cos valiosos. Sin embargo, no se establecieron colaboraciones formales con estos centros en esta fase del proyecto, ya que se contó con la disponibilidad de bases de datos accesibles y adecuadas para el desarrollo de los algoritmos de aprendizaje automático, como se detalla en la siguiente sección. Algunos de los centros identi�cados incluyen: Instituto Nacional de Neurología y Neurocirugía de México �Manuel Velasco Suárez�. Centro Aura de México. Consejo Nacional de Investigaciones Cientí�cas y Técnicas - Hospital El Cruce - Uni- versidad Nacional Arturo Jauretche (Argentina). La información completa sobre estos centros, incluyendo datos de contacto y detalles adi- cionales, queda documentada y disponible como un recurso para futuras fases en la carpeta �Documentos/Información Centros� (ver Anexos 15.1). 7.3. Bases de datos médicas Como indica Obeid [30], aunque cada año se realizan cientos a miles de electroencefa- logramas en todo el mundo, las bases de datos disponibles para el desarrollo de algoritmos especializados en su análisis son limitadas. Ante esta limitación que afectó las fases anterio- res de esta línea de investigación, se llevó a cabo una búsqueda exhaustiva de bases de datos estandarizadas. Esta búsqueda tuvo como objetivo obtener un conjunto de datos más robusto y diverso, en concordancia con el primer objetivo especí�co de este trabajo. Para la selección de bases de datos disponibles, se priorizó que estas fueran de libre acceso y que contuvieran anotaciones de utilidad para el desarrollo de algoritmos de aprendizaje supervisado. 7.3.1. Siena Scalp EEG Database Esta base de datos consiste en registros de 14 pacientes monitoreados mediante la técnica de EEG con video (Video-EEG) en la Unidad de Neurología de la Universidad de Siena. Los pacientes tienen un rango de edad entre 20 y 71 años, de los cuales 9 son hombres y 5 son mujeres. Cada EEG fue recolectado a una frecuencia de muestreo de 512 Hz bajo el estándar 10/20 [31]. 32 En cuanto a las etiquetas que contiene cada señal en forma de región de interés, es importante resaltar que esta base de datos contiene 6 tipos de etiqueta para identi�car diferentes tipos de crisis, según la clasi�cación de la ILAE (ver Figura 6): IAS: crisis de conciencia alterada de inicio focal. WIAS: crisis de conciencia preservada de inicio focal. FBTC: crisis focal a bilateral tónica - clónica. T: crisis en lóbulo temporal 1. R: crisis en lóbulo derecho 1. L: crisis en lóbulo izquierdo 1. Esta base de datos es valiosa, ya que permite profundizar en el desarrollo de algoritmos de clasi�cación multiclase y algoritmos de procesamiento de video. Acceso directo a la base de datos: doi.org/10.13026/5d4a-j060 7.3.2. CHB-MIT Scalp EEG Database Esta base de datos contiene 664 registros de EEG de 22 pacientes pediátricos del Chil- dren's Hospital Boston, monitoreados durante varios días sin estar bajo medicación anticon- vulsiva. Los pacientes tienen un rango de edad entre 1.5 y 22 años, de los cuales 17 son mujeres y 5 son hombres. Cada estudio fue recolectado a una frecuencia de 256 Hz con una resolución de 16 bits. Los registros incluyen al menos 23 canales que cumplen con el están- dar 10/20 y contienen etiquetas de tipo región de interés para los estudios que presentan convulsiones [32]. Esta base de datos es de gran importancia, ya que es una de las pocas que proporciona estudios de pacientes pediátricos. Esto ha permitido a los investigadores profundizar en aplicaciones adaptadas a la madurez del cerebro humano, como se menciona en la Sección 6.1.2. Acceso directo a la base de datos: doi.org/10.13026/C2K01R 7.3.3. The Temple University Hospital EEG Data Corpus (TUH) Esta es la base de datos más grande disponible públicamente, cuenta con los registros completos para cada estudio y se estima que contiene más de 60,000 EEG recolectados en el Temple University Hospital Philadelphia desde el año 2002 [30]. Esta base de datos, además de proporcionar una gran cantidad de estudios, también proporcionan herramientas de software para su análisis, e inclusive algunas han sido adoptadas por empresas como MATLAB con la función edfread(). 1Indica el lóbulo de ocurrencia de la crisis, complementa las primeras 3 etiquetas. 33 https://doi.org/10.13026/5d4a-j060 https://doi.org/10.13026/C2K01R Cuenta con un repositorio (corpus) principal que se divide en 6 repositorios secundarios, cada uno con un enfoque especí�co: TUH EEG Corpus (TUEG: v2.0.1): repositorio principal, contiene 69,625 EDF (EEG) de los cuales el 95% se encuentran bajo el estándar 10/20 y la frecuencia de muestreo está en el rango de 250 a 1024 Hz. No se encuentra etiquetado. � TUH Abnormal EEG Corpus (TUAB: v3.0.1): contiene 2,993 EDF clasi�cados como normales o anormales. Donde según su clasi�cación, se encuentran separa- dos por carpetas y su objetivo es el entrenamiento de algoritmos tipo secuencia a etiqueta. � TUH EEG Artifact Corpus (TUAR: v3.0.1): contiene 310 EDF anotados para la detección de artefactos relacionados con el movimiento ocular, masticación, escalofríos, movimiento muscular y ruido debido a electrodos. Su objetivo es el entrenamiento de algoritmos que identi�quen y/o eliminen este tipo de artefactos. � TUH EEG Epilepsy Corpus (TUEP: v2.0.1): contiene 100 EDF correspondientes a pacientes con epilepsia y 100 EDF correspondientes a pacientes sin epilepsia. El objetivo es el entrenamiento de algoritmos que puedan determinar si un paciente padece o no de epilepsia. � TUH EEG Events Corpus (TUEV: v2.0.1): contiene 518 EDF anotados para la identi�cación de las onda aguda - onda lenta, descargas periódicas epileptiformes generalizadas o lateralizadas, movimientos oculares, artefactos y ruido de fondo (ver Sección 6.2.1). Su objetivo es servir para entrenar algoritmos que asocien la forma de las ondas, que son de interés médico en el diagnóstico de la epilepsia. � TUH EEG Seizure Corpus (TUSZ: v2.0.3): incluye 7,361 EDF anotados manual- mente para la detección de períodos de convulsión (fase ictal) y todas las anota- ciones de los subconjuntos ya mencionados. Cada estudio contiene dos archivos de etiquetas: uno que indica el fragmento de tiempo y el canal donde se da una crisis o artefacto, y otro que señala únicamente el período de tiempo donde existe convulsión aplicable para todos los canales. El objetivo de este repositorio, es el entrenamiento de algoritmos tipo secuencia a secuencia, capaces de reconocer períodos de convulsión en un estudio en general o por canales. � TUH EEG Slowing Corpus (TUSL: v2.0.1): contiene 300 EDF anotados para la detección de comportamientos lentos, de fondo complejo o de convulsión. Las etiquetas proporcionadas por estudio aplican para todos los canales y conforman un conjunto equilibrado de clases (100 estudios por clase). Este subconjunto ha sido de utilidad para evaluar algoritmos de clasi�cación existentes, para evaluar la respuesta ante sucesos poco comunes dentro de un EEG. Con lo expuesto, esta base de datos es un recurso de gran valor para esta línea de inves- tigación, debido a su gran volumen de datos, la variedad de anotaciones y las herramientas de software que proporciona. Para gestionar el acceso a esta base de datos y explorar sus repositorios, consulte: isip.piconepress.com/projects/nedc/html/tuh_eeg/. 34 https://isip.piconepress.com/projects/nedc/html/tuh_eeg/ 7.3.4. Otras bases de datos disponibles El avance en esta línea de investigación depende en gran medida de la cantidad de electroencefalogramas disponibles para el entrenamiento y la validación de algoritmos de aprendizaje automático. Como señala Obeid [30]: �grandes cantidades de EEG permitirán alcanzar el estado del arte en algoritmos de aprendizaje automático para descubrir nuevos diagnósticos y validar prácticas clínicas�. A continuación, se presenta un listado de otras bases de datos que pueden ser exploradas para su posible utilidad: The Bonn EEG Time Series: doi.org/10.34810/data490. EEG/FMRI Naturalistic Viewing Dataset : doi.org/10.1101/2022.11.23.517540. Simultaneous EEG-fMRI Dataset : doi.org/10.17632/crhybxpdy6.2 Epileptic EEG Dataset : doi.org/10.17632/5pc2j46cbc.1 EEG Dataset of Epileptic Seizure Patients: dx.doi.org/10.21227/hd6x-jr97 Dataset of neonatal EEG recordings with seizures annotations: zenodo.org/records/4940267 AES Seizure Prediction Challenge database: kaggle.com/c/seizure-prediction/data OpenNEURO Epilepsy Datasets: doi.org/10.1038/s41597-019-0104-8 7.3.5. Selección base de datos de TUH Tras evaluar la implementación de un proceso de recolección estandarizado, explorar las bases de datos disponibles y considerar la posible colaboración con centros especializados en epilepsia, se decidió gestionar el acceso a la base de datos The Temple University Hospital (TUH). Esta decisión se basó en la necesidad de contar con un conjunto de datos amplio y detallado, algo que esta base de datos ofrece gracias a su gran cantidad de estudios y anotaciones. En los siguientes capítulos, se evidencia el gran valor de la base de datos para esta línea de investigación. 35 https://doi.org/10.34810/data490 https://doi.org/10.1101/2022.11.23.517540 https://doi.org/10.17632/crhybxpdy6.2 https://doi.org/10.17632/5pc2j46cbc.1 https://dx.doi.org/10.21227/hd6x-jr97 https://zenodo.org/records/4940267 https://www.kaggle.com/c/seizure-prediction/data https://doi.org/10.1038/s41597-019-0104-8 CAPÍTULO 8 Procesamiento de estudios Este capítulo describe los estudios utilizados y las técnicas aplicadas para su procesa- miento. Asimismo, se aborda el tercer objetivo especí�co de este trabajo, con un enfoque particular en la de�nición de los parámetros establecidos por HUMANA para el procesa- miento de los estudios. Para una mejor comprensión de este estudio, consultar Prototipo_Data_TUH.m en el repositorio de esta fase de investigación (ver Anexo 15.2). 8.1. Selección de estudios Como se menciona en la Sección 7.3.3, la base de datos de TUH ofrece distintos reposi- torios para diversas funcionalidades. Teniendo en cuenta el trabajo de las fases anteriores, se priorizó la clasi�cación de periodos ictales o de convulsión, por lo que se seleccionó el subconjunto �TUH EEG Seizure Corpus� (SEIZ TUH) [33]. 8.1.1. Descripción del conjunto de datos Este conjunto de estudios se encuentra dividido en dos carpetas principales: DOCS: proporciona los listados de los electrodos disponibles según el tipo de montaje utilizado y un cuadro que resume todas las posibles etiquetas que se pueden encontrar en los estudios. � Montajes disponibles: todos los estudios son compatibles con el montaje TCP bi- polar de doble banana (ver Figura 16). Es importante tener en cuenta que algunos 36 estudios fueron registrados con referencia promedio (ar) y otros con referencia de oídos (le) (ver Sección 8.2). Figura 16. Montaje bipolar de doble banana Nota. Obtenida de [34]. � Etiquetas disponibles: cada estudio cuenta con dos archivos. El archivo con ex- tensión �.csv� incluye etiquetas basadas en eventos, es decir, marca el tiempo de inicio y �n, así como la etiqueta correspondiente, cuando ocurre algún suceso de importancia en los canales. En cambio, el archivo con extensión �.csv_bi� registra eventos de interés en cualquiera de los canales, anotando el tiempo de inicio y �n junto con una etiqueta aplicable a todos los canales. Tal como se observa en el Cuadro 4 junto con las etiquetas que se presentan en Anexos 15.3. Etiquetas �.csv� Etiquetas �.csv_bi� Canal inicio �n etiqueta Canal inicio �n etiqueta FP1-F7 0 1.0255 bckg TERM 0 1.0255 bckg FP1-F7 1.0255 10.0255 cpsz TERM 1.0255 10.0255 seiz Cuadro 4. Ejemplo de etiquetado en estudios EEG edf: esta carpeta está organizada en los conjuntos de entrenamiento, validación y eva- luación. Cada conjunto contiene una cantidad signi�cativa de estudios EEG etique- tados, como se detalla en el Cuadro 5. En este cuadro, se resumen las características principales de cada conjunto, incluyendo la cantidad de estudios, rango de duración, el rango de frecuencia de muestreo y el porcentaje de estudios con eventos convulsivos. Entrenamiento Validación Evaluación Cantidad de estudios 3,163 1,539 806 Duración 5 s - 11.5 h 1 s - 1 h 16 s - 1 h Rango frecuencia de muestreo 250 - 1,000 Hz (común 256 Hz) Estudios con convulsión 450 (14.23%) 248 (16.11%) 195 (24.19%) Cuadro 5. Ejemplo de etiquetado en estudios EEG 37 8.1.2. Descarga de estudios de base de datos Para realizar la descarga de los estudios desde la base de datos, es fundamental haber gestionado previamente el acceso a esta, como se detalla en la Sección 7.3.3. La base de datos se encuentra alojada en un servidor Apache, y [30] recomienda utilizar la herramienta rsync para este procedimiento debido a su capacidad para mantener sincronizadas las copias locales con las actualizaciones del servidor. El método preferido para descargar los estudios es el siguiente: Para usuarios de Linux y MacOS: rsync está disponible de manera nativa en estas plataformas dentro de su terminal y es ideal para realizar las descargas. Para usuarios de Windows: se recomienda instalar MobaXterm, que incluye soporte para rsync, permitiendo realizar las descargas de manera similar a Linux y MacOS. Además, es necesario contar con: Las credenciales de acceso al servidor proporcionadas por TUH. La ruta especí�ca dentro del servidor donde se encuentran los estudios a descargar. Espacio de almacenamiento su�ciente en el equipo local para las descargas. En la documentación de esta línea de investigación, en la carpeta �Documentos/Manuales� (ver Anexos 15.1), se proporciona una guía detallada para con�gurar rsync, instalar MobaX- term en sistemas Windows y ejecutar los comandos necesarios para descargar y mantener sincronizada la base de datos con el servidor de TUH. 8.2. De�nición de parámetros de HUMANA Una vez descargados los estudios y antes de proceder con su procesamiento para la implementación de los algoritmos, se de�nieron los parámetros utilizados por HUMANA para el análisis de los estudios electroencefalográ�cos. Este paso fue realizado en concordancia con el tercer objetivo especí�co de este trabajo, asegurando que el procesamiento de los datos cumpla con los estándares y criterios establecidos por este centro. Basándose en los estudios proporcionados por HUMANA y de su libro titulado �Epilep- sias, Enfoque Multidisciplinario� [2], se identi�caron los siguientes parámetros clave: Distribución estandarizada de electrodos 10-20: como primer criterio, se estableció que los estudios debían cumplir con esta distribución de electrodos (ver Sección 6.1.1). Montaje bipolar para el análisis: HUMANA no realiza un análisis canal por canal, sino que organiza los estudios como un montaje bipolar. Este enfoque les permite comparar directamente la actividad entre canales y entre hemisferios del cerebro, facilitando la identi�cación de patrones relevantes para el diagnóstico. 38 8.3. Migración de estudios a MATLAB La primera tarea para iniciar la exploración de algoritmos con los nuevos datos consistió en desarrollar un proceso de lectura e�ciente para manejar la gran cantidad de archivos dis- ponibles. Este proceso no solo debía optimizar la carga de datos, sino también garantizar que los estudios cumplieran con los parámetros establecidos por HUMANA y fueran adaptados para su posterior procesamiento mediante algoritmos de aprendizaje automático. 8.3.1. Selección de tipo de referencia El punto de partida para esta tarea fue de�nir con qué tipo de referencia se iba a trabajar, ya que, como se expuso anteriormente, el conjunto de datos SEIZ TUH contiene estudios con referencia promedio (ar) y referencia de oídos (le). Si bien ambas referencias tienen sus ventajas particulares, trabajar con ambas mezcladas no era una opción viable, ya que ello podría introducir inconsistencias en los datos y di�cultar la interpretación mediante los algoritmos de aprendizaje automático [35]. La referencia promedio (ar) presenta ventajas signi�cativas en estudios electroencefa- lográ�cos. Distribuye el potencial de referencia entre todos los electrodos, lo cual reduce posibles sesgos asociados a una única ubicación y minimiza la in�uencia de ruidos locales en los puntos de referencia [35]. Esto es especialmente relevante para estudios con algoritmos de aprendizaje automático, ya que asegura una mayor homogeneidad en las señales procesadas. Por otro lado, la referencia de oídos (le) es más común en con�guraciones clínicas, y su simplicidad puede ser adecuada para aplicaciones rápidas. Sin embargo, su dependencia de una ubicación �ja puede hacerla más susceptible a interferencias externas y artefactos, especialmente si los electrodos de referencia no están correctamente posicionados [35]. Dado que el objetivo principal de este trabajo era maximizar la calidad y consistencia de los datos para el entrenamiento de los modelos, se optó por utilizar exclusivamente los estudios con referencia promedio (ar). Esta decisión no solo garantiza una mayor uniformidad en los datos, sino que también se alinea con los hallazgos de [35], donde se destaca que la referencia promedio tiende a ser más adecuada para análisis automatizados debido a su robustez frente al ruido y los artefactos. Además, esta elección no perjudica la cantidad de estudios a utilizar, ya que el conjunto contiene una mayor proporción de estudios con referencia ar en comparación con le (ver Figura 17). 8.3.2. Lectura en memoria de estudios En una primera iteración, se consideró la posibilidad de realizar una lectura conjunta de todos los estudios en memoria. Esto implicaba leer y procesar más de 5,000 estudios con referencia ar de manera simultánea. Para implementar este enfoque, se siguió el Algoritmo 1, que emplea la función dir para delimitar los archivos a leer. Posteriormente, mediante un ciclo for, se realiza el proceso de lectura utilizando las funciones edfinfo y edfread. Para el procesamiento de etiquetas asociadas, se emplearon funciones especí�cas para la lectura de tablas. 39 Figura 17. Distribución estudios con referencia ar y le en SEIZ TUH Entrada: Rutas de acceso a los estudios obtenidas con dir. Salida: Estudios procesados en montaje bipolar junto a su vector de etiquetas. 1 para cada estudio hacer 2 inicio 3 De�nir chnl_list ← lista de canales de inte