Aplicación de algoritmos de aprendizaje automático,

con énfasis en aprendizaje supervisado, para

la identi�cación y categorización de segmentos

de interés en señales bioeléctricas para el estudio

de la epilepsia - Fase V

Javier Alejandro Pérez Marín


UNIVERSIDAD DEL VALLE DE GUATEMALA

Facultad de Ingeniería

Aplicación de algoritmos de aprendizaje automático, con

énfasis en aprendizaje supervisado, para la identi�cación y

categorización de segmentos de interés en señales bioeléctricas

para el estudio de la epilepsia - Fase V

Trabajo de graduación presentado por Javier Alejandro Pérez Marín

para optar al grado académico de Licenciado en Ingeniería Mecatrónica

Guatemala,

2024


UNIVERSIDAD DEL VALLE DE GUATEMALA

Facultad de Ingeniería

Aplicación de algoritmos de aprendizaje automático, con

énfasis en aprendizaje supervisado, para la identi�cación y

categorización de segmentos de interés en señales bioeléctricas

para el estudio de la epilepsia - Fase V

Trabajo de graduación presentado por Javier Alejandro Pérez Marín

para optar al grado académico de Licenciado en Ingeniería Mecatrónica

Guatemala,

2024


Vo.Bo.: 

(f)   

M. Sc. Carlos Esquit 

Tribunal Examinador: 

(f)   

M.Sc. Carlos Esquit 

(f)   

M. Sc. Miguel Enrique Zea Arenales 

(f)   

Ing. Kurt Emmanuel Kellner 

Fecha de aprobación: Guatemala, 13 de febrero de 2025. 


Prefacio

A mis padres, Oscar y Karol, por creer en mis sueños, apoyarme y ser parte de ellos.
Por su esfuerzo incansable, por siempre buscar lo mejor para nosotros, por siempre pensar
en los 4 y por enseñarme que la unión familiar y el amor incondicional son la base de todo
logro. Su ejemplo me ha mostrado que, aun en medio de las adversidades, la fe en Dios y el
compromiso se transforman en fuerza para seguir adelante. En cada paso de mi camino, he
llevado su sabiduría y su entrega, recordándome que cada sacri�cio y cada pequeño triunfo
han cimentado en mí los valores que hoy me de�nen.

A Dani, mi hermana, siempre has sido una parte fundamental en mi vida. Siempre
quiero estar para la súper diseñadora y hermana que eres, acompañándote en cada paso y
celebrando cada uno de tus logros. Tu cariño, tus risas y tus constantes ánimos han iluminado
mi camino. Eres una persona increíblemente capaz y te animo a seguir esforzándote, con�ada
en que lograrás todo lo que te propongas. Gracias por estar siempre presente y por aportar
esa alegría que tanto me ha impulsado a avanzar.

Esta tesis no solo representa el cierre de mi carrera universitaria, sino también la oportu-
nidad de decirles que, hoy, somos ingenieros y lo hemos logrado, a pesar de la incertidumbre
que nos acompañó al inicio y con una inmensa alegría y gratitud al llegar a este �n. Este
trabajo es un tributo a sus enseñanzas, a sus sacri�cios, a esos abrazos que siempre estu-
vieron ahí para reconfortarme y a la luz que han encendido en mí, impulsándome a nunca
dejar de soñar.

A mi familia, en especial a mis abuelitos, tíos, tías y primos, gracias por su aliento, cariño
y apoyo, que hicieron de estos 5 años una experiencia aún mejor. Sus palabras de ánimo y
su constante presencia me motivaron a superar cada desafío y a celebrar cada logro. Este
éxito es también de ustedes, que con su cariño y ejemplo dejan una huella imborrable en mi
camino.

A mi novia, por tu apoyo constante, compañía, cariño y tus palabras de aliento que me
han acompañado a lo largo de estos cinco años. Tu compañía ha sido una parte invaluable
de este camino, aportando fuerza en los momentos difíciles y haciendo más signi�cativos los
logros alcanzados. Porque no se trata solo del viaje, sino de la compañía que enriquece cada
paso del camino.

iii


A todos mis amigos y amigas de la UVG, en especial a Cerón, Gerardo y Alba. Sin duda,
repetiría estos 5 años las veces que me lo pidieran, si ustedes estuvieran allí. Gracias por
cada curso y �sufrimiento� compartido, gracias por cada risa y consejo, gracias por estar.
Sigan soñando en grande, porque son ingenieros capaces, y quiero estar allí para aplaudir
cuando logren sus metas y para abrazarlos en los momentos en que las cosas no salgan como
esperaban, pero siempre con la frente en alto y con ganas de seguir adelante.

A mi asesor, Dr. Luis Alberto Rivera, con toda mi admiración y agradecimiento, un
verdadero ejemplo de persona y docente. Su constante acompañamiento, gran conocimiento
y la con�anza que ha depositado en mí me han motivado a lo largo de este trabajo y me han
dejado un aprendizaje invaluable para el futuro en el ámbito de la investigación. Gracias por
con�ar en mí y siempre impulsarme a dar lo mejor de mí. Dios le siga bendiciendo.

A todos mis docentes y mentores de la universidad, les extiendo mi más sincero agrade-
cimiento por su dedicación, compromiso y el incansable afán de compartir su conocimiento.
Cada clase, cada consejo y cada reto me han enriquecido, impulsándome a crecer y aprender.
De manera especial, quiero agradecer a M.Sc. Miguel Zea, cuyo gran apoyo y orientación en
este trabajo fueron de mucha ayuda. Gracias a todos y todas por iluminar la trayectoria de
sus estudiantes y ser una fuente de inspiración.

Finalmente, más no menos importante, agradezco a Dios por ser mi luz y guía en cada
paso de este camino. Agradezco a las personas que apoyan el programa de becas de la UVG,
cuyo compromiso y generosidad han hecho posible que este sueño se materialice. También
extiendo mi gratitud a todas aquellas personas que, sin ser nombradas, tienen un lugar muy
especial en mi corazón. Gracias por su fe, su amor y por creer en mí.

Que cada día cuente para hacer realidad nuestros sueños

iv


Índice

Prefacio iv

Lista de �guras ix

Lista de cuadros x

Resumen xi

Abstract xii

1. Introducción 1

2. Antecedentes 2
2.1. Contexto general de la epilepsia . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Estado del arte en el uso del aprendizaje automático para la epilepsia . . . . . 3
2.3. Evolución línea de investigación en Universidad del Valle de Guatemala . . . 4

3. Justi�cación 7

4. Objetivos 8
4.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2. Objetivos especí�cos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

5. Alcance 9

6. Marco teórico 10
6.1. Cerebro humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

6.1.1. Actividad eléctrica del cerebro . . . . . . . . . . . . . . . . . . . . . . 11
6.1.2. Ritmos normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

6.2. Epilepsia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6.2.1. Anomalías epileptiformes . . . . . . . . . . . . . . . . . . . . . . . . . 14
6.2.2. Fases de una crisis epiléptica . . . . . . . . . . . . . . . . . . . . . . . 16
6.2.3. Tipos de crisis epilépticas . . . . . . . . . . . . . . . . . . . . . . . . . 16

6.3. Análisis de señales EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

v


6.3.1. Montajes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.3.2. Análisis en el dominio de la frecuencia . . . . . . . . . . . . . . . . . . 19
6.3.3. Análisis en el dominio del tiempo . . . . . . . . . . . . . . . . . . . . . 19

6.4. Algoritmos de aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . 20
6.4.1. Aprendizaje supervisado . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.4.2. Aprendizaje no supervisado . . . . . . . . . . . . . . . . . . . . . . . . 22
6.4.3. Aprendizaje reforzado . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

6.5. Aprendizaje profundo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
6.5.1. Entrenamiento de redes neuronales profundas . . . . . . . . . . . . . . 24
6.5.2. Tipos de redes neuronales profundas . . . . . . . . . . . . . . . . . . . 26

7. Obtención y recolección de datos 29
7.1. Propuesta de recolección de datos estandarizada . . . . . . . . . . . . . . . . . 29
7.2. Centros especializados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7.3. Bases de datos médicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

7.3.1. Siena Scalp EEG Database . . . . . . . . . . . . . . . . . . . . . . . . 32
7.3.2. CHB-MIT Scalp EEG Database . . . . . . . . . . . . . . . . . . . . . . 33
7.3.3. The Temple University Hospital EEG Data Corpus (TUH) . . . . . . . 33
7.3.4. Otras bases de datos disponibles . . . . . . . . . . . . . . . . . . . . . 35
7.3.5. Selección base de datos de TUH . . . . . . . . . . . . . . . . . . . . . . 35

8. Procesamiento de estudios 36
8.1. Selección de estudios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

8.1.1. Descripción del conjunto de datos . . . . . . . . . . . . . . . . . . . . . 36
8.1.2. Descarga de estudios de base de datos . . . . . . . . . . . . . . . . . . 38

8.2. De�nición de parámetros de HUMANA . . . . . . . . . . . . . . . . . . . . . . 38
8.3. Migración de estudios a MATLAB . . . . . . . . . . . . . . . . . . . . . . . . 39

8.3.1. Selección de tipo de referencia . . . . . . . . . . . . . . . . . . . . . . . 39
8.3.2. Lectura en memoria de estudios . . . . . . . . . . . . . . . . . . . . . . 39
8.3.3. Lectura optimizada de estudios . . . . . . . . . . . . . . . . . . . . . . 41

9. Redes neuronales profundas: justi�cación y métodos generales 43
9.1. Justi�cación del enfoque de redes neuronales profundas . . . . . . . . . . . . . 43
9.2. Implementación y validación de red LSTM . . . . . . . . . . . . . . . . . . . . 44

9.2.1. Estructura de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
9.2.2. Opciones de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . 45
9.2.3. Proceso de entrenamiento y resultados . . . . . . . . . . . . . . . . . . 45

9.3. Implementación y validación de red TCN . . . . . . . . . . . . . . . . . . . . 47
9.3.1. Estructura de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
9.3.2. Opciones de entrenamiento . . . . . . . . . . . . . . . . . . . . . . . . 49
9.3.3. Proceso de entrenamiento y resultados . . . . . . . . . . . . . . . . . . 49

10.Implementación de redes EEGnet 51
10.1. Implementación de redes LSTM EEGnet . . . . . . . . . . . . . . . . . . . . . 51

10.1.1. Estructuras trabajadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
10.1.2. Resumen resultados LSTM EEGnet . . . . . . . . . . . . . . . . . . . 53

10.2. Implementación de redes TCN EEGnet . . . . . . . . . . . . . . . . . . . . . . 54
10.2.1. Estructuras y resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 54

vi


10.3. Discusión redes EEGnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

11.Herramienta Epileptic EEG Analysis Toolbox 58
11.1. Migración a MATLAB 2024 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

11.1.1. Evaluación de dependencias para la migración . . . . . . . . . . . . . . 58
11.1.2. Manejo de herramienta como proyecto y cambios necesarios . . . . . . 59

11.2. Mejoras y nuevas implementaciones en herramienta . . . . . . . . . . . . . . . 60
11.2.1. Implementación de Widget Toolbox . . . . . . . . . . . . . . . . . . . . 60
11.2.2. Protocolo cierre de ventana principal . . . . . . . . . . . . . . . . . . . 61
11.2.3. Actualización a función openedf . . . . . . . . . . . . . . . . . . . . . 61
11.2.4. Implementación de montajes de EEG en herramienta . . . . . . . . . . 62

12.Conclusiones 66

13.Recomendaciones 68

14.Bibliografía 69

15.Anexos 73
15.1. Documentación general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
15.2. Repositorio GitHub . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
15.3. Listado de etiquetas disponibles en conjunto de datos TUH SEIZ . . . . . . . 74

16.Glosario 75

vii


Lista de �guras

1. Última iteración de herramienta - Anotaciones . . . . . . . . . . . . . . . . . . 6

2. Lóbulos del cerebro y su ubicación . . . . . . . . . . . . . . . . . . . . . . . . 11
3. A) Vista lateral IS 10-20 y B) Vista superior IS 10-20 . . . . . . . . . . . . . 12
4. Ejemplos de actividad base en EGG con su espectro de frecuencia . . . . . . . 13
5. Ejemplos de EEG reales de anomalías epileptiformes . . . . . . . . . . . . . . 15
6. Clasi�cación de crisis epilépticas ILAE 2017 . . . . . . . . . . . . . . . . . . . 17
7. Ejemplos de tipos de montajes . . . . . . . . . . . . . . . . . . . . . . . . . . 18
8. Tipos de aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . . . . 20
9. Aprendizaje profundo y sus áreas . . . . . . . . . . . . . . . . . . . . . . . . . 23
10. Perceptrón multicapa básico generalizado . . . . . . . . . . . . . . . . . . . . 23
11. Efecto del momentum en SGD . . . . . . . . . . . . . . . . . . . . . . . . . . 25
12. Red neuronal recurrente (RNN) simpli�cada . . . . . . . . . . . . . . . . . . . 27
13. CNN simpli�cada para imágenes RGB clasi�cación multiclase . . . . . . . . . 28
14. Interés en el aprendizaje profundo . . . . . . . . . . . . . . . . . . . . . . . . 28

15. Equipo disponible para recolección de datos . . . . . . . . . . . . . . . . . . . 30

16. Montaje bipolar de doble banana . . . . . . . . . . . . . . . . . . . . . . . . . 37
17. Distribución estudios con referencia ar y le en SEIZ TUH . . . . . . . . . . . 40
18. Flujo de trabajo con datastore . . . . . . . . . . . . . . . . . . . . . . . . . . 41

19. Flujo de trabajo aprendizaje de máquina tradicional y profundo . . . . . . . . 44
20. Arquitectura de red LSTM utilizada en el experimento . . . . . . . . . . . . . 45
21. Progreso del entrenamiento de la red LSTM . . . . . . . . . . . . . . . . . . . 46
22. Matriz de confusión de la red LSTM . . . . . . . . . . . . . . . . . . . . . . . 47
23. Arquitectura de red TCN utilizada en el experimento . . . . . . . . . . . . . . 48
24. Progreso del entrenamiento de la red TCN . . . . . . . . . . . . . . . . . . . . 50
25. Matriz de confusión de la red TCN . . . . . . . . . . . . . . . . . . . . . . . . 50

26. Estructura de red BiLSTM EEGnet . . . . . . . . . . . . . . . . . . . . . . . 52
27. Estructura de red LSTM EEGnet profunda . . . . . . . . . . . . . . . . . . . 52
28. Estructura de red LSTM EEGnet con modwt . . . . . . . . . . . . . . . . . . . 52
29. Estructura de red LSTM EEGnet con cwt . . . . . . . . . . . . . . . . . . . . 52

viii


30. Arquitectura de red TCN utilizada en el experimento . . . . . . . . . . . . . . 55
31. Ejemplos de entrenamiento y matriz de confusión para las redes entrenadas . 57

32. Análsis archivos de proyectos tras cambios en migración . . . . . . . . . . . . 60
33. Modi�caciones campo para ingresar contraseña . . . . . . . . . . . . . . . . . 60
34. Error al cerrar ventanas secundarias . . . . . . . . . . . . . . . . . . . . . . . 61
35. Alerta al cerrar ventana principal . . . . . . . . . . . . . . . . . . . . . . . . . 61
36. Modi�caciones ventana de análisis . . . . . . . . . . . . . . . . . . . . . . . . 63
37. Nueva ventana de anotaciones por montaje . . . . . . . . . . . . . . . . . . . 63
38. Selección automática de canales estándar . . . . . . . . . . . . . . . . . . . . . 63
39. Montaje bipolar doble banana generado automáticamente con su cursor . . . 64
40. Ventana generada al identi�carse eventos de convulsión . . . . . . . . . . . . . 64
41. Montaje aislado de evento de convulsión generado . . . . . . . . . . . . . . . . 65
42. Ventana generada al no identi�carse eventos de convulsión . . . . . . . . . . . 65

ix


Lista de cuadros

1. Trabajos relacionados al estudio de la epilepsia mediante ML . . . . . . . . . 3
2. Ejemplos de arquitecturas en modelos de DL para EEG . . . . . . . . . . . . 4

3. Electrodos disponibles en casco . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4. Ejemplo de etiquetado en estudios EEG . . . . . . . . . . . . . . . . . . . . . 37
5. Ejemplo de etiquetado en estudios EEG . . . . . . . . . . . . . . . . . . . . . 37
6. Especi�caciones ordenador utilizado . . . . . . . . . . . . . . . . . . . . . . . 41

7. Resumen resultados con LSTM EEGnet . . . . . . . . . . . . . . . . . . . . . 53
8. Resumen resultados con TCN EEGnet . . . . . . . . . . . . . . . . . . . . . . 56

9. Listado de etiquetas disponibles en base de datos TUH SEIZ . . . . . . . . . . 74

x


Resumen

El presente trabajo se enfocó en la implementación y evaluación de algoritmos de apren-
dizaje automático con énfasis en aprendizaje supervisado para el análisis de señales EEG de
pacientes con epilepsia, como parte de la línea de investigación desarrollada en conjunto con
HUMANA en la Universidad del Valle de Guatemala. Los objetivos principales incluyeron
la exploración de redes neuronales profundas (LSTM y TCN) para preservar la secuencia-
lidad de las señales y la detección de segmentos de interés, así como la actualización de la
herramienta Epileptic EEG Analysis Toolbox.

Para ello, se emplearon estudios de la base de datos de The Temple University Hospi-
tal (TUH), ampliando signi�cativamente la diversidad y cantidad de señales analizadas. Se
evaluaron múltiples con�guraciones de redes neuronales, logrando una precisión consistente
superior al 81% en la clasi�cación de eventos de convulsión y no convulsión. Las redes TCN
destacaron por su e�ciencia en tiempo de entrenamiento y su capacidad para capturar de-
pendencias temporales mediante convoluciones causales y dilatadas, mientras que las redes
LSTM ofrecieron un rendimiento competitivo, aunque con mayores demandas computacio-
nales.

Asimismo, se implementaron mejoras en la herramienta Epileptic EEG Analysis Toolbox,
incorporando nuevas funcionalidades como montajes automatizados, generación de anota-
ciones basadas en redes neuronales y optimización del código para garantizar un mejor
desempeño. Estas actualizaciones permiten una interacción más intuitiva para los médicos
y sientan las bases para futuras exploraciones de algoritmos de aprendizaje profundo.

Este trabajo representa un avance signi�cativo en el análisis de señales EEG mediante
aprendizaje profundo, estableciendo un marco de referencia para la integración de estas
técnicas como herramientas clínicas y proporcionando recomendaciones para superar las
limitaciones computacionales identi�cadas.

xi


Abstract

The present study focused on the implementation and evaluation of machine learning
algorithms, with an emphasis on supervised learning, for the analysis of EEG signals from
epilepsy patients. This work is part of the research line developed in collaboration with
HUMANA at Universidad del Valle de Guatemala. The primary objectives included the
exploration of deep neural networks (LSTM and TCN) to preserve the sequential nature of
the signals and detect segments of interest, as well as the enhancement of the Epileptic EEG
Analysis Toolbox.

To achieve these goals, data from The Temple University Hospital (TUH) database were
utilized, signi�cantly increasing the diversity and volume of analyzed signals. Multiple neural
network con�gurations were evaluated, achieving consistent accuracy rates exceeding 81%
in the classi�cation of seizure and non-seizure events. TCN networks demonstrated superior
e�ciency in training time and the ability to capture temporal dependencies through causal
and dilated convolutions, whereas LSTM networks delivered competitive performance albeit
with higher computational demands.

Furthermore, improvements to the Epileptic EEG Analysis Toolbox were implemented,
including new functionalities such as automated montages, annotation generation based on
neural networks, and code optimization to ensure enhanced performance. These updates pro-
vide a more intuitive interface for clinicians and lay the groundwork for future explorations
of deep learning algorithms.

This study represents a signi�cant advancement in EEG signal analysis using deep lear-
ning, establishing a reference framework for integrating these techniques into clinical tools
and o�ering recommendations to address the identi�ed computational limitations.

xii


CAPÍTULO 1

Introducción

La epilepsia es una enfermedad neurológica que afecta a millones de personas en todo el
mundo. Aunque los avances en la investigación han permitido que muchos pacientes mejoren
su calidad de vida con tratamientos adecuados, el diagnóstico y tratamiento de esta afección
siguen siendo un desafío. Los electroencefalogramas (EEG) son una herramienta fundamental
para la evaluación de pacientes con epilepsia, pero el análisis de estos estudios es un proceso
manual que requiere tiempo y experiencia por parte de los médicos especialistas. Esto resalta
la necesidad de desarrollar herramientas automatizadas que faciliten y optimicen el análisis
de señales bioeléctricas, como los EEG.

En este contexto, la aplicación de algoritmos de aprendizaje automático se ha conver-
tido en una estrategia prometedora para la identi�cación y categorización de segmentos de
interés en señales bioeléctricas. Este trabajo de graduación, enfocado en técnicas de apren-
dizaje supervisado, tuvo como objetivo avanzar en el desarrollo de una herramienta capaz
de procesar y analizar EEG de manera e�ciente. Esto se logró mediante la implementación
de algoritmos de aprendizaje automático para la identi�cación de patrones asociados con
episodios epilépticos. Este trabajo se desarrolló como la quinta fase de la línea de investiga-
ción en la Universidad del Valle de Guatemala, en la que se ha trabajado previamente en la
creación y optimización de la herramienta Epileptic EEG Analysis Toolbox.

El objetivo principal de esta investigación fue identi�car y categorizar segmentos de inte-
rés en señales bioeléctricas, esto mediante algoritmos de aprendizaje automático supervisado.
Para alcanzar este objetivo, se plantearon varios objetivos especí�cos, como la obtención de
nuevas señales bioeléctricas, la investigación de características de las señales y algoritmos,
la optimización del proceso de detección de segmentos de interés y la actualización de la
herramienta de software existente.

1


CAPÍTULO 2

Antecedentes

2.1. Contexto general de la epilepsia

La epilepsia es una enfermedad neurológica prevalente en todo el mundo, afectando
a más de cincuenta millones de personas para el año 2019 [1]. Gracias a los avances en
la investigación de esta afección, se han logrado resultados prometedores. Para el año en
mención, aproximadamente una cuarta parte de los casos de epilepsia eran prevenibles, y
al menos el 70% de los pacientes estudiados podían reanudar sus actividades diarias con el
tratamiento adecuado.

Este padecimiento es considerado un problema de salud pública, no solo por su rele-
vancia médica, sino también por su profundo impacto social. A lo largo de la historia, esta
enfermedad ha sido una causa de discriminación y estigmatización, afectando el bienestar
social y psicológico de quienes la padecen, además de conllevar altos costos económicos [2].
Estas di�cultades resaltan la importancia de contar con métodos de diagnóstico e�caces y
accesibles, que contribuyan a una mejor comprensión y manejo de la epilepsia.

Sin embargo, uno de los grandes desafíos para un diagnóstico adecuado de esta en-
fermedad es la interpretación de los electroencefalogramas (EEG), estudios esenciales que
registran la actividad eléctrica cerebral. Actualmente, este proceso sigue siendo en gran me-
dida manual y depende de la experiencia del especialista, lo que implica una considerable
inversión de tiempo y recursos. Esto ha impulsado la exploración de tecnologías avanzadas,
como el aprendizaje automático, que ofrecen soluciones para mejorar la detección y análisis
de patrones en el EEG, y así transformar el diagnóstico de la epilepsia.

2


2.2. Estado del arte en el uso del aprendizaje automático para

la epilepsia

Siddiqui señala que, la detección de convulsiones y obtención de conocimiento relacio-
nado con el cerebro es una tarea compleja [3]. Sin embargo, en las últimas tres décadas,
con la ayuda del aprendizaje automático (machine learning, ML), se ha logrado automatizar
y mejorar la precisión de estos procesos. Permitiendo a investigadores obtener resultados
importantes en la segmentación clasi�cada de EEG, siendo esto novedoso pues como ante-
riormente se discutía, el análisis de estos es actualmente un proceso manual que depende en
gran medida de la pericia de los médicos, quienes en ocasiones deben de analizar hasta 72
horas de un estudio [4].

Como se observa en el Cuadro 1, se han tenido distintos acercamientos mediante di-
ferentes algoritmos (clasi�cadores), como distintas maneras de representar los EEG (ca-
racterísticas) obteniéndose resultados prometedores que en su mayoría superan el 80% de
rendimiento. Esto ha motivado a múltiples investigadores a seguir explorando este campo.
Con el aumento de bases de datos extensas de EEG, el campo ha expandido su enfoque
hacia el aprendizaje profundo (Deep Learning, DL).

Clasi�cador(es) Característica(s) Rendimiento (%)
SVM Vector 96
Random forest Time and frequency 93.8
ANN Line length 99.6
Burst detection algo Line length 84.27, 84,85.7
Normalization Line length 52
ELM and BPNN SE 95.6
SVM and ELM AE and SE 95.58
SVM DWT 94.8
GMM Spectral, hybrid, temporal 87.58
Random forest PCA, STF, Moving Max 97.12, 99.29, 0.77/h
Random forest and k-NN Spectral power 80.87, 47.45, 2.5/h, 56.23
Boosting Stockwell 94.26, 96.34
SVM, MLP, KNN, Naïve bayes Energy 98.75
Random forest Entropy and DWT 98.45
SVM Time�Frequency 90.62, 99.32
Random forest Time-domain 96.94
SVM, LDA, QDA, LC, PC, DT, KNN, UDC, PARZEN Time�frequency 84, 85
SVM DWT 86.83
SVM and neural network DWT and CWT 99.1
ELM Time�frequency 97.73, 0.37/h
SVM DWT 99.38
LS-SVM FFT and DWT 100
SVM and Naïve bayes Entropy, RMS, variance, energy 96.55, 95.63, 95.7
LS-SVM 8 types of Entropies 100, 99.4, 99.5
ANN Spectral power 86
KNN and GHE - 100
Random forest DWT 99.74, 0.21/h
Random forest STFT, mean, energy and std dev 96.7
Random forest, SVM, KNN, and Adaboost 28 statistical and time�frequency features 97.6, 94.4, 96.1, 92.9, 98.8, 0.96
ANN, KNN, SVM, and Random forest Mean, std dev, power, skewness, kurtosis, absolute mean 100
SVM Energy 99.5
SVM and Random forest 10-time and frequency 0.98
LS-SVM DCT, SVD, IMF, DCT-DWT 91.36
SysFor and Forest CERN 9 statistical features 100
Random forest L1-penalized robust regression (L1PRR) 100
SVM, NB, KNN, random forest, logistic model Trees (LMT) 15-features 97.40, 97.40,97.50
Random forest IMF 98.4,98.6,96.4
ANN Time�frequency 100
Decision forest�Random forest, Boosting 9 statistical features 96.67,74.36, 84.06

Cuadro 1. Trabajos relacionados al estudio de la epilepsia mediante ML
Nota. Obtenido de [3].

3


El aprendizaje profundo, una rama del aprendizaje automático, ha demostrado un gran
potencial en áreas relacionadas, como el análisis de electrocardiogramas y el procesamiento
de imágenes médicas [5]. Una de sus principales ventajas, es la capacidad de extraer pa-
trones complejos directamente de los datos sin procesar, lo que permite obtener resultados
más precisos y construir modelos que se adaptan mejor a la naturaleza de los datos. En
el contexto de los EEG, esto signi�ca que los modelos pueden aprender por su cuenta ca-
racterísticas relevantes para la detección de convulsiones, sin requerir que el investigador
seleccione manualmente dichas características. Como se muestra en el Cuadro 2, estos mo-
delos han alcanzado hasta un 89% de precisión en tareas de clasi�cación de EEG, lo que
subraya su efectividad en el reconocimiento de patrones complejos.

Arquitectura Precisión (%)
SAE 3 capas ocultas, 1 capa densa 54
Híbrida 1 capa convolucional, 1 capa RNN, 2 capas densas 73
Híbrida 2 capas convolucionales, 1 capa RNN, 1 capa densa 75
CNN 5 capas convolucionales, 1 capa densa 81
MLPNN 4 capas ocultas 82
RNN 2 capas LSTM, 1 capa densa 87
CNN 2 capas convolucionales, 2 capas densas 87
CNN 2 capas convolucionales, 1 capa densa 88
DBN (3 capas RBM's), 1 capa densa 89

Cuadro 2. Ejemplos de arquitecturas en modelos de DL para EEG
Nota. Obtenido de [5].

2.3. Evolución línea de investigación en Universidad del Valle

de Guatemala

La línea de investigación sobre el uso de algoritmos de aprendizaje automático en el aná-
lisis de EEG para la detección de crisis epilépticas en UVG comenzó en 2020, impulsada por
el trabajo de María Angulo y Luis Rivera en colaboración con el Centro de Epilepsia y Neu-
rocirugía Funcional (HUMANA) [6]. Desde entonces, esta iniciativa ha buscado desarrollar
una herramienta innovadora que facilite el análisis automatizado de señales EEG, optimi-
zando el diagnóstico de la epilepsia mediante el uso de técnicas avanzadas de aprendizaje
automático.

En el trabajo realizado por Angulo se propuso desarrollar y aplicar algoritmos de aprendi-
zaje automático a EEG de pacientes con epilepsia. Esto mediante una interfaz implementada
en MATLAB, demostrando la factibilidad de caracterizar segmentos de EEG mediante el
uso de redes neuronales arti�ciales (ANN, por sus siglas en inglés) y máquinas de vectores
de soporte (SVM, por sus siglas en inglés) con una precisión superior al 95%. Al vez, María
Pineda [7] implementó una base de datos con phpMyAdmin y MySQL para almacenar los
estudios de los pacientes. Ambas resaltaron la importancia de ampliar el conjunto de seña-
les disponibles para explorar otras técnicas de caracterización y algoritmos de aprendizaje
automático no supervisado para la mejora de la herramienta.

En el año 2021, José David Vela retomó la línea de investigación con el objetivo de im-

4


plementar el reconocimiento y anotación de episodios ictales (fase activa de una convulsión)
en EEG [8]. Para lo cual, implementó una SVM de tiempo continuo con kernel gaussiano
logrando una exactitud de 96.7% ± 3.81%. Esta mejora incluyó la implementación de una
sección para el entrenamiento de un algoritmo de aprendizaje automático especí�co, para
su posterior utilización en la clasi�cación de las señales con la nueva categoría implemen-
tada. Destacó el uso de características mediante transformadas Wavelet para la reducción
de tiempo computacional y extendió nuevamente la necesidad de contar con más datos por
parte de HUMANA para la validación de la herramienta.

Posteriormente, en el año 2022, Camila Lemus retomó la recomendación de [6] para im-
plementar algoritmos de aprendizaje automático no supervisado [9]. En primera instancia,
se centró en validar la herramienta existente utilizando bases de datos de EEG y electro-
cardiograma (ECG), rea�rmando la precisión de las ANN para la segmentación (99.6% ±

0.61%) y la e�ciencia de la extracción de vectores de características en términos de tiem-
po computacional. Introdujo el uso del algoritmo de agrupamiento (clustering) k-means de
aprendizaje no supervisado, demostrando ser e�ciente en términos de tiempo computacional
pero no logrando una precisión superior al 85.51%. Se enfatizó nuevamente la necesidad de
contar con más datos para el entrenamiento de modelos de aprendizaje, tanto supervisados
como no supervisados, y de explorar la combinación de características junto con algoritmos
e�cientes en tiempo computacional.

Entre los años 2020 y 2022, se tuvieron avances signi�cativos en la herramienta y explora-
ción de algoritmos de aprendizaje automático. Por ende, resulta crucial comprender el estado
actual de la herramienta hasta el año pasado, considerando las contribuciones de Cristhofer
Patzán y Diego Méndez, quienes validaron y optimizaron la herramienta buscando que esta
quede formalmente funcional al lograrse un entrenamiento adecuado de los algoritmos.

La última revisión por Patzán [10] se enfocó en aplicar algoritmos de aprendizaje au-
tomático a una muestra más amplia de señales bioeléctricas, como EEG y electromiografía
(EMG), con el �n de mejorar la detección de segmentos relevantes en el estudio de la epi-
lepsia. Validó el rendimiento de estos algoritmos mediante análisis estadístico y actualizó
la interfaz de la herramienta para abordar tiempos computacionales de�cientes. Resaltó
la importancia de una muestra equitativa de datos para evitar sesgos en los algoritmos
de clasi�cación. Además, determinó que los algoritmos que emplean transformadas wavelets
tiempo-frecuencia ofrecen mejores resultados tanto en clasi�cación como tiempo computacio-
nal. Como resultado, la última versión de la herramienta ha sido optimizada en términos
de tiempo computacional y algoritmos de detección de segmentos de interés en señales. Se
sugiere explorar el algoritmo Chamaleon y continuar la recopilación de datos de HUMANA
para el entrenamiento de los algoritmos.

El algoritmo Chamaleon, como indica Shehadeh [11], es un algoritmo que se basa en el
comportamiento de los camaleones cuando buscan a su presa y por ello su nombre comple-
to es Chameleon Swarm Algorithm (CSA). Este busca resolver problemas de optimización
numérica global con bajo costo computacional, lo cual es posible pues se emplea una pobla-
ción de agentes (camaleones) distribuidos para recorrer el plano del problema y conforme se
acerca alguno de estos a un dato �presa�, este permanece cerca de la región del plano para
agrupar de manera óptima por cercanía. Por lo que, la exploración de este algoritmo puede
resultar adecuada para la segmentación de las señales bioeléctricas por su estabilidad, bajos
tiempos computacionales y adaptabilidad a distintos problemas de agrupamiento.

5


Méndez [12] se enfocó en validar y migrar la herramienta para su implementación en HU-
MANA. De�nió los requerimientos mínimos de hardware y validó el funcionamiento de esta
en distintos ordenadores. En conjunto con las mejoras de [10], implementó algoritmos más
e�cientes para el control de la base de datos y el despliegue de resultados en la herramienta.
Estas acciones en conjunto, permitieron la validación de la herramienta para su migración
segura y funcional a HUMANA. Se recomendó la exploración de algoritmos que permitan
reducir aún más tiempos computacionales y proporcionar más información al usuario, a la
vez que se sugiere evaluar posibles mejoras basándose en el programa BWAnalysis.

El programa BWAnalysis es de los programas más avanzados disponibles para el análisis
de EEG. Este permite segmentar las señales en ventanas de tiempo de�nido por el usuario,
obtener características básicas (i.e., amplitud, frecuencia, etc.) y complejas (i.e. FFT, espec-
tro de frecuencias, etc.) de las señales, sincronización del video del estudio con las señales
y trazado de los segmentos de interés para la elaboración de informes [13]. Por lo que, re-
sulta importante tener en cuenta la funcionalidad y características de este programa, pues
la herramienta que se desarrolla dentro de esta línea de investigación busca optimizar los
procesos ya familiarizados con los doctores.

La última actualización de la herramienta Epileptic EEG Analysis Toolbox para el estu-
dio de la epilepsia mostró avances signi�cativos haciéndola más intuitiva y optimizada para
un menor consumo de recursos computacionales (ver Figura 1). Esto se logró mediante la
validación y mejora de los algoritmos de aprendizaje automático, junto con las optimiza-
ciones en la interfaz, tanto para el despliegue de resultados como para el uso de recursos.
Esta iteración acerca la herramienta a su implementación formal en HUMANA, aunque to-
davía existen limitaciones por abordar antes de su adopción de�nitiva. Se requiere un mayor
equilibrio en los datos, con una proporción equitativa entre pacientes sanos y con epilepsia,
para un entrenamiento e�caz de los algoritmos. También es importante explorar algoritmos
de aprendizaje automático innovadores, optimizar aún más los tiempos computacionales y
mejorar el despliegue de resultados. Por último, validar la herramienta en un entorno médico
real es crucial para comprobar su e�cacia en la práctica.

Figura 1. Última iteración de herramienta - Anotaciones
Nota. Obtenida de: [10].

6


CAPÍTULO 3

Justi�cación

Según datos de HUMANA [4], alrededor de 325,000 personas en Guatemala padecen
epilepsia, y aproximadamente el 30% de estos casos son de difícil control. El impacto de la
epilepsia va más allá de la salud, afectando la vida social y profesional de quienes la padecen.
Se han reportado casos de niños expulsados de escuelas tras sufrir un ataque epiléptico y
trabajadores despedidos por la misma razón [2]. Además, el de�ciente acceso a la salud en el
país implica que no hay su�cientes herramientas para facilitar el diagnóstico de la epilepsia,
lo que obliga a los pacientes a afrontar altos costos para obtener tratamientos adecuados
(e.g., EEG ∼ US$100 [14]). Ante este escenario, es fundamental la investigación sobre la
epilepsia y el desarrollo de herramientas en el país, tanto para su estudio como para su
tratamiento, con el �n de mejorar la calidad de vida de quienes la padecen y reducir el
estigma asociado a la enfermedad.

El trabajo reciente en la herramienta Epileptic EEG Analysis Toolbox ha demostrado
avances signi�cativos en términos de mejora de algoritmos de aprendizaje automático, opti-
mización de tiempos computacionales y actualización de la interfaz de usuario. Sin embargo,
estas deben ser continuadas para lograr una implementación efectiva de la herramienta.

Para avanzar en esta línea de investigación, se requiere una muestra de datos mayor y
equitativa para el entrenamiento de los algoritmos de aprendizaje automático, asegurando
una representación equilibrada entre pacientes sanos y aquellos con epilepsia. Por ello, parte
de este trabajo de graduación consistió en la recolección de más datos de HUMANA, bases de
datos médicas e investigación de otros centros especializados en el estudio de la epilepsia. Este
enfoque permitió reunir un conjunto de datos más amplio y diverso, lo cual fue fundamental
para entrenar y validar los algoritmos de aprendizaje automático de manera efectiva.

Además, este trabajo buscó optimizar los procesos de análisis y detección de eventos en
las señales EEG mediante la implementación de aprendizaje profundo con las redes LSTM
y TCN, adaptadas para clasi�car eventos de convulsión y no convulsión. Estas mejoras,
junto con la actualización de la herramienta Epileptic EEG Analysis Toolbox, buscan no sólo
avanzar en el análisis automatizado de señales EEG, sino también facilitar su adopción en
entornos médicos, contribuyendo a un diagnóstico más accesible y e�ciente.

7


CAPÍTULO 4

Objetivos

4.1. Objetivo general

Identi�car y categorizar segmentos de interés en señales bioeléctricas para el estudio de la
epilepsia, mediante la implementación de algoritmos de aprendizaje automático, con énfasis
en técnicas de aprendizaje supervisado.

4.2. Objetivos especí�cos

Obtener señales bioeléctricas adicionales a las de fases anteriores, de pacientes con
epilepsia en centros de estudios especializados como HUMANA.

Investigar y evaluar características de las señales bioeléctricas, así como algoritmos
de aprendizaje automático, con un enfoque en técnicas de aprendizaje supervisado,
para mejorar el rendimiento de los clasi�cadores en la identi�cación y categorización
de dichas señales.

Optimizar el proceso de detección de segmentos de interés en las señales y la generación
automática de anotaciones relevantes, según los parámetros de HUMANA.

Realizar análisis estadísticos para evaluar el rendimiento de los algoritmos y determinar
las características más efectivas para describir las señales bioeléctricas.

Actualizar la herramienta de software para el estudio de la epilepsia desarrollada en
fases anteriores, incorporando las mejoras en los algoritmos de clasi�cación y detección
de segmentos de interés en las señales bioeléctricas.

8


CAPÍTULO 5

Alcance

El presente trabajo de graduación abarcó la mejora y optimización de la herramienta
Epileptic EEG Analysis Toolbox para el análisis de señales EEG en el contexto del estudio
de la epilepsia. Esto incluyó la recolección y procesamiento de señales EEG provenientes de
múltiples fuentes, con un énfasis particular en la base de datos de The Temple University
Hospital (TUH), trabajada bajo los estándares establecidos por HUMANA.

El enfoque principal se centró en la implementación de algoritmos de aprendizaje profun-
do, representando una desviación signi�cativa de las metodologías tradicionales utilizadas
en fases anteriores. Las redes neuronales profundas, especí�camente las arquitecturas LSTM
y TCN, se entrenaron directamente con señales EEG crudas, eliminando la necesidad de
procesos manuales de extracción de características. Este enfoque permitió explorar nuevas
posibilidades para la detección y clasi�cación de eventos de convulsión y no convulsión,
demostrando la viabilidad de estas técnicas en el análisis de señales EEG.

Asimismo, se realizaron actualizaciones en la herramienta enfocadas en mejorar su fun-
cionalidad y usabilidad para los médicos. Entre las mejoras destacan la incorporación de
elementos grá�cos que facilitan la interacción, la visualización de señales mediante monta-
jes automatizados, y la generación de anotaciones basadas en redes neuronales. Además,
se migró la herramienta a las últimas recomendaciones de MATLAB en su versión 2024B,
garantizando su compatibilidad y continuidad futura.

El alcance de este trabajo no incluyó la implementación de un sistema completamente
integrado en entornos clínicos reales, pero avanzó signi�cativamente en la preparación de
la herramienta para futuras aplicaciones. Aunque se lograron avances importantes en la
clasi�cación de eventos epilépticos y en la optimización mediante aprendizaje profundo,
los recursos computacionales representaron una de las principales limitantes para alcanzar
mayores niveles de precisión en los modelos.

9


CAPÍTULO 6

Marco teórico

6.1. Cerebro humano

El cerebro humano es el órgano rector y más complejo del cuerpo humano, permitiendo
la realización de movimientos motores y el procesamiento del entorno para la adquisición
de aprendizajes o la respuesta a estímulos [15]. Se compone de dos hemisferios, derecho e
izquierdo, que trabajan en conjunto en procesos como la memoria, el cálculo y el procesa-
miento sensorial. Sin embargo, cada hemisferio también desempeña funciones especí�cas:

Hemisferio izquierdo: en general, se ocupa del aprendizaje y procesamiento de infor-
mación.

� Pensamiento numérico, verbal y simbólico.

� Expresión hablada y escrita.

� Lectura.

Hemisferio derecho:

� Imaginación y creatividad, inclusive habilidades musicales.

� Control de las emociones y sentimientos.

� Pensamiento intuitivo.

� Funciones espaciales.

Además, el cerebro humano está dividido en diferentes regiones llamadas lóbulos (ver
Figura 2), cada uno de los cuales desempeña funciones especí�cas. Estos lóbulos incluyen el
frontal, parietal, temporal y occipital, cada uno de los cuales tiene características y funciones
distintas. A continuación, se explorará en detalle la función de cada lóbulo [15].

10


Figura 2. Lóbulos del cerebro y su ubicación
Nota. Obtenida de [15].

Lóbulo frontal: responsable del control motor, la plani�cación, la toma de decisiones
y la personalidad.

Lóbulo parietal: se encarga del procesamiento sensorial, la percepción espacial y la
integración de información.

Lóbulo temporal: relacionado con la audición, la memoria y el procesamiento del len-
guaje.

Lóbulo occipital: principalmente asociado con la visión y el procesamiento visual.

6.1.1. Actividad eléctrica del cerebro

En 1929, Hans Berger acuñó por primera vez el término �electroencefalograma (EEG)�
para referirse al registro de la actividad eléctrica del cerebro captada a través de electrodos
colocados en el cuero cabelludo [16]. Estas señales eléctricas son generadas por las células pi-
ramidales de la corteza cerebral, conocidas como neuronas, las cuales actúan como diminutos
dipolos eléctricos con polaridad dependiente de su estado (inhibitorio o excitatorio).

Dado el interés en comprender el funcionamiento del cerebro, los EEG se han vuelto
indispensables para la evaluación de pacientes con trastornos del sistema nervioso, como
epilepsias y convulsiones. Para estandarizar el procedimiento y facilitar la comparación de
resultados entre diferentes pacientes, se ha desarrollado un sistema de colocación de elec-
trodos conocido como el estándar IS 10-20 (ver Figura 3). Este estándar, ampliamente
utilizado en la práctica clínica, de�ne la ubicación de los electrodos en relación con puntos
anatómicos especí�cos en el cuero cabelludo, lo que permite una interpretación más precisa
de los registros de EEG [17].

11


Figura 3. A) Vista lateral IS 10-20 y B) Vista superior IS 10-20
Nota. F = Frontal, C = Central, P = Parietal, T = Temporal, O = Occipital, A =

Auricular, Z = plano sagital, Impares = hemisferio izquierdo y Pares = hemisferio derecho.
Obtenida de [18].

6.1.2. Ritmos normales

Debido a la estandarización, se ha podido determinar artefactos �siológicos en los EEG
(como el ruido debido al latido del corazón, la respiración y el movimiento muscular) y,
en especial, se han identi�cado los ritmos normales en un EEG (ver Figura 4) [2]. Estos,
también conocidos como actividad base, se clasi�can de la siguiente manera:

Delta (δ): señal en el rango de frecuencias de 0.5 a 4 Hz y una amplitud alta entre
100 a 200 µV [17]. Es dominante durante el sueño profundo (etapas 3 y 4) y debe
de prestarse atención a la región en que se identi�que pues movimientos musculares
pueden producir este tipo de ritmo. En un adulto no debe de presentarse este ritmo
estando despierto, en niños es aceptable ya que re�eja madurez de la corteza cerebral.

Theta (θ): señal en el rango de frecuencias de 4 a 8 Hz y una amplitud >30 µV [17].
Este es predominante cuando el sujeto se encuentra dormido, en especial si presenta
sueño con movimiento ocular rápido (MOR). Es identi�cable en la región de los lóbulos
temporales, se puede clasi�car como θ baja (4 a 6 Hz), asociada con vigilia disminuida
con somnolencia alta, y theta alta (6 a 8 Hz), relacionada con la memoria de trabajo
activa. En adultos, este ritmo no debe de presentarse estando despierto, en niños es
aceptable la presencia hasta la adolescencia.

Alpha (α): señal en el rango de frecuencias de 8 a 13 Hz y una amplitud baja entre 30
a 50 µV (mayor en el hemisferio derecho) [17]. Este es dominante durante la relajación
en estado de vigilia con los ojos cerrados y es atenuado al abrir los ojos o por esfuerzo
mental. Indica la activación cortical y se observa en las regiones occipitales y frontales,
pudiéndose propagar a la región parietal y temporal posterior.

12


Beta (β): señal en el rango de frecuencias de 13 a 30 Hz y una amplitud >30 µV [17].
Este es dominante en un estado de vigilia con los ojos abiertos y es notorio en actividad
mental. Se localiza principalmente en la región frontal (fronto-central) y puede verse
afectada por sedantes o drogas hipnóticas.

Gamma (γ): señal en el rango de frecuencias de 30 a 50 Hz [17]. Es predominante
durante la actividad mental superior, como la interpretación de objetos para formar
una imagen coherente. Indica la percepción y la conciencia del individuo, y no está
presente en sujetos sedados.

Figura 4. Ejemplos de actividad base en EGG con su espectro de frecuencia
Nota. Obtenida de [19].

6.2. Epilepsia

La epilepsia, una condición crónica con múltiples causas, se mani�esta comúnmente a
través de crisis recurrentes, desencadenadas por descargas excesivas de las neuronas cerebra-
les, que pueden presentarse con síntomas físicos o conductuales (manifestaciones clínicas)
o ser identi�cadas mediante estudios (paraclínicas) [2]. Esta enfermedad neurológica es al-
tamente prevalente a nivel mundial, afectando a más de cincuenta millones de personas
para el año 2019 y, a nivel Guatemala, alrededor de 325,000 personas la padecen, siendo
aproximadamente el 30% de estos casos de difícil control [1][4].

13


Según indica [20], el término �epilepsia� no se re�ere a una sola condición, sino a múl-
tiples patologías que pueden manifestarse con crisis epilépticas. Estos síndromes epilépticos
se clasi�can según el grupo etario del paciente, que incluye neonatal-lactante, preescolar
y escolar, así como epilepsias generalizadas idiopáticas y de edad variable. Hasta el año
2022, se habían identi�cado 41 patologías epilépticas distintas, cada una con sus propias
características epileptiformes durante las diferentes fases de una crisis epiléptica.

Entonces, las epilepsias conllevan una predisposición a experimentar crisis epilépticas
recurrentes, y se diagnostican cuando una persona ha experimentado dos o más de estas
crisis. Estas crisis pueden manifestarse con una variedad de síntomas, desde sensaciones
subjetivas extrañas o difíciles de describir hasta fenómenos auditivos, visuales, motores o
sensaciones de hormigueo. Dichos síntomas pueden aparecer de forma aislada y autolimitada,
lo que signi�ca que pueden presentarse de manera independiente y limitarse a un período
breve de tiempo sin progresar a una crisis completa. Además, las crisis pueden presentarse
con sacudidas de una (o más) extremidad o de la mitad de la cara sin que haya pérdida de la
conciencia, o con una pérdida brusca de la misma, seguida de caída al suelo y contracciones
musculares seguidas de sacudidas rítmicas [2].

6.2.1. Anomalías epileptiformes

Las descargas eléctricas características de las crisis epilépticas siguen patrones identi�-
cables por su frecuencias y evolución en el espacio-tiempo [19]. Por lo que, es importante
de�nir cómo estas se cuanti�can e identi�can por su forma.

Para la cuanti�cación de las descargas eléctricas se emplea el siguiente criterio, según su
aparición:

Abundantes: ≥ 1/10 s

Frecuentes: < 1/10 s a ≥ 1/min

Ocasionales: < 1/min a ≥ 1/h

Raras: < 1/h

Mientras que, para la clasi�cación por su forma, se sigue el glosario de la IFCN 2017
(ver Figura 5) [19]. En este se establecen las siguientes formas y sus características:

Onda aguda (Spike): onda transitoria con pico puntiagudo, es distinguible de la ac-
tividad de fondo y con una duración de 20 a 70 ms. La amplitud es variable, pero
típicamente es de 50 µV. Esta puede ser monofásica o multifásica, con un componente
negativo dominante.

Polipunta (Polyspike complex ): secuencia de dos o más ondas agudas.

Punta-onda (Sharp Wave): transitorio epiléptico claramente distinguible de la activi-
dad de fondo, con pico puntiagudo y una duración de 70 a 200 ms. Por lo general,
tiene una amplitud variable (100-200 µV) y un componente negativo dominante.

14


Onda aguda - onda lenta (Spike and Slow Wave complex ): patrón epiléptico claramente
distinguible de la actividad de fondo. Este puede ser único o múltiple, consiste en una
onda aguda y una onda lenta asociada.

Polipunta - onda lenta (Polyspikes and slow wave complex ): patrón epiléptico que
consiste en dos o más ondas agudas asociadas con una o más ondas lentas.

Punta-onda - onda lenta (Sharp and slow wave complex ): patrón epiléptico claramente
distinguible de la actividad de fondo. Este puede ser único o múltiple, consiste en una
punta-onda y una onda lenta asociada.

Figura 5. Ejemplos de EEG reales de anomalías epileptiformes
Nota. a) Onda aguda. b) Polipunta. c) Punta-onda. d) Onda aguda - onda lenta.

e) Polipunta - onda lenta. f) Punta-onda - onda lenta. Obtenida de [19].

15


6.2.2. Fases de una crisis epiléptica

Una crisis epiléptica se caracteriza por una serie de fases distintas, cada una con sus
propias características y síntomas. Comprender estas fases es crucial tanto para quienes
padecen epilepsia como para el estudio del paciente, ya que puede ayudar a reconocer los
signos de una crisis [2]. Las fases de una crisis epiléptica son:

Fase aura: es la primera etapa de una crisis epiléptica, también conocida como fase
preictal. Ocurre justo antes de la fase ictal y puede durar desde unos segundos hasta
una hora. Durante esta fase, el paciente puede experimentar síntomas como fatiga,
cambios visuales, sensación de desconexión de la realidad y alucinaciones sensoriales.
Los movimientos involuntarios breves, como los espasmos musculares, pueden ocurrir.
Esta fase es causada por una alteración en la actividad cerebral que comienza poco
antes de la fase más notable de la crisis, siendo esto notorio en el EEG al tenerse
anomalías epileptiformes mezcladas con los ritmos normales [2].

Fase ictal: es la fase más evidente de una crisis epiléptica. Durante esta fase, puede
experimentar alteraciones en la conciencia, movimientos involuntarios o ambos. Los
movimientos involuntarios pueden implicar todo el cuerpo o una parte del mismo. La
fase ictal generalmente dura desde unos segundos hasta unos minutos y puede ser
convulsiva o no convulsiva. Estos síntomas se corresponden con los patrones vistos en
el electroencefalograma (EEG) durante esta fase, que muestran una actividad eléctrica
errática con anomalías epileptiformes continuas [2].

Fase postictal: ocurre después de la fase ictal de una crisis. Durante esta etapa, puede
experimentar una variedad de síntomas, como fatiga extrema, confusión y parálisis
temporal de una extremidad. La duración y la intensidad de los síntomas postictales
pueden variar. Estos síntomas pueden correlacionarse con los cambios en el EEG du-
rante la fase ictal y pueden durar desde varias horas hasta días, siendo notorias ciertas
anomalías epileptiformes ocasionales mezcladas con los ritmos normales [2].

6.2.3. Tipos de crisis epilépticas

Las crisis epilépticas se clasi�can según su origen, presencia de síntomas motores y afec-
tación de la consciencia. Por ello, en el año 2017, la Liga Internacional Contra La Epilepsia
(ILAE, por sus siglas en inglés) publica su última revisión para la clasi�cación operacional de
los tipos de crisis [21]. En la cual establecieron (ver Figura 6 para conocer sus subdivisiones):

Crisis focales: estas comienzan en una región especí�ca del cerebro y pueden perma-
necer focalizadas o propagarse para afectar otras áreas (bilateral Tónico-Clónica). Su
clasi�cación depende de síntomas motores y alteraciones a la conciencia, dependiendo
de la ubicación y extensión de la actividad epiléptica.

Crisis generalizadas: estas involucran ambos hemisferios cerebrales simultáneamente
desde el inicio y su clasi�cación depende únicamente de síntomas motores, pues gene-
ralmente estas presentan conciencia alterada.

16


Crisis de inicio desconocido: en este tipo de crisis, no se puede determinar si la actividad
epiléptica comienza focal o generalizada debido a la falta de información sobre el inicio
del evento. Su clasi�cación se basa en síntomas motores, pero es importante determinar
la naturaleza de la crisis para una adecuada clasi�cación

Figura 6. Clasi�cación de crisis epilépticas ILAE 2017
Nota. Obtenida de [21].

6.3. Análisis de señales EEG

El análisis de los distintos canales de un EEG es fundamental para obtener información
relevante de cada momento registrado durante el estudio. Para lograrlo, es crucial contar
con una visualización adecuada de los valores, que puede lograrse mediante los montajes.
Posteriormente, al explorar diversas técnicas de análisis disponibles, podemos identi�car
segmentos de interés para detectar crisis epilépticas. Esta detección permite a los médicos
no solo de�nir el tipo de epilepsia, sino también el síndrome asociado a la epilepsia en
cuestión.

17


6.3.1. Montajes

Los montajes se re�eren al registro grá�co de varios canales en una secuencia establecida,
siendo los de 16 canales los más comunes, aunque también se utilizan montajes de 8 o hasta 32
canales, estos últimos principalmente en investigaciones médicas debido a su costo [2]. Entre
los montajes disponibles se encuentran la referencia común (activa o inactiva), la referencia
común promedio, la derivación de fuente y la derivación bipolar. Destacan especialmente
dos tipos de montajes: el montaje de referencia común, también conocido como montaje
monopolar, y el montaje bipolar [19].

El montaje monopolar, o de referencia común, utiliza un electrodo de referencia para los
canales de interés (ver Figura 7a). Generalmente, este electrodo de referencia se coloca en el
oído del hemisferio que se está analizando. Esto permite una comparación relativa entre la
actividad eléctrica de diferentes áreas del cerebro. Sin embargo, puede introducir artefactos
(ruido) debido a la actividad eléctrica muscular o a interferencias externas, lo que puede
di�cultar la interpretación precisa de los datos.

Por otro lado, el montaje bipolar utiliza dos electrodos adyacentes para cada canal de
registro, lo que permite una medición más directa de la diferencia de potencial entre dos
áreas especí�cas del cerebro (ver Figura 7b). Esto reduce la sensibilidad a artefactos comunes
en el montaje monopolar y puede proporcionar una mayor resolución espacial. Sin embargo,
el montaje bipolar puede requerir una mayor cantidad de electrodos y puede ser más difícil
de interpretar para algunos tipos de análisis.

(a) Montaje monopolar. (b) Montaje bipolar.

Figura 7. Ejemplos de tipos de montajes
Nota. R - referencia, A - electrodo activo (active), G - tierra (ground). Obtenida de [22].

18


6.3.2. Análisis en el dominio de la frecuencia

El análisis de señales en el dominio de la frecuencia, o análisis espectral, es una técnica
ampliamente utilizada en diversos campos cientí�cos y es la base de muchos procesos comu-
nes como la resonancia magnética. Esta técnica implica una transformación del EEG desde
el dominio del tiempo (muestras en el tiempo) al dominio de la frecuencia (muestras para
cada frecuencia). La mayor ventaja de esta técnica es resumir la información contenida en
grandes tiempos a unos pocos valores. Sin embargo, al ser un análisis estadístico, el resulta-
do será una información promedio sobre la estructura de la señal del EEG y no evidenciará
patrones de señal muy cortos o señales de baja potencia [19].

Para llevar a cabo este tipo de análisis, resulta necesario obtener el espectro de frecuencias
de uno o más canales (ver Figura 4). Con este espectro, es posible resumir características
interesantes del dominio de frecuencia, tales como la potencia absoluta y relativa en las
diferentes bandas, la frecuencia de potencia máxima, la frecuencia mediana, la frecuencia de
borde espectral y la frecuencia dominante principal. Estas características pueden utilizarse
por sí solas o en combinación entre sí para de�nir nuevas variables, a menudo llamadas
índices. Una ventaja de estos índices es que representan características complejas de la señal
de una manera comprensible y son menos sensibles al ruido que contamina los electrodos
[19].

6.3.3. Análisis en el dominio del tiempo

El análisis de señales en el dominio del tiempo implica realizar mediciones y/o cálculos
directamente sobre la señal original del EEG, sin ninguna transformación como en el caso
del análisis espectral.

Existen varios parámetros de los EEG en el dominio del tiempo, y en este contexto se
menciona uno de los parámetros que es más utilizado:

Cruces por cero: este parámetro se de�ne como el número de veces que la señal de EEG
cruza la línea base. Sin embargo, es importante tener en cuenta que este parámetro no
siempre representa el ritmo de la señal del EEG, ya que a menudo el ritmo de interés
está enmascarado por el ritmo normal [19].

En cuanto a la visualización de la evolución de los datos en el tiempo, existen varias
técnicas, entre las que se incluyen los histogramas y tendencias, así como el análisis de
wavelet. Los histogramas y tendencias son métodos simples y e�cientes para mostrar la
evolución temporal de un parámetro de interés (e.g., amplitud), mientras que el análisis de
wavelet ofrece una representación tiempo-frecuencia más detallada, aunque a menudo pierde
la visión general global que proporcionan los histogramas y tendencias [19].

Además de estos parámetros, otros aspectos relevantes del análisis en el dominio del
tiempo incluyen las estadísticas básicas: valor medio, la mediana, la varianza, la desviación
estándar, la asimetría y la curtosis de la señal de EEG [19].

19


6.4. Algoritmos de aprendizaje automático

El aprendizaje automático (ML) es un campo interdisciplinario de la inteligencia arti�cial
(IA) que busca desarrollar algoritmos que permitan a las computadoras aprender y mejorar
automáticamente a partir de la experiencia. A diferencia de los métodos tradicionales de pro-
gramación, donde se especi�can todas las reglas, el aprendizaje automático permite que los
sistemas informáticos descubran patrones en los datos para realizar tareas especí�cas. Este
enfoque es especialmente útil en situaciones donde los datos son complejos o cambian con
el tiempo, ya que los algoritmos pueden adaptarse y mejorar continuamente su rendimiento
en función de la retroalimentación recibida [23].

Por lo anterior, los algoritmos de aprendizaje automático han emergido como herra-
mientas poderosas en el análisis de EEG, especialmente cuando se combinan con técnicas
de análisis en dominio de la frecuencia y tiempo. En el análisis de EEG en el dominio de la
frecuencia, estos algoritmos pueden identi�car patrones complejos y características relevan-
tes en las señales EEG, lo que permite una mejor comprensión de las diferentes frecuencias
presentes y su relación con los estados mentales [3].

Por otro lado, en el análisis en el dominio del tiempo, los algoritmos de aprendizaje au-
tomático pueden extraer características temporales de las señales EEG, como la duración de
los eventos, la amplitud de los picos, y la frecuencia (cantidad) de aparición de ciertos patro-
nes. Estas características temporales son cruciales para la detección de eventos especí�cos,
como las convulsiones epilépticas [3].

Para llevar a cabo estas tareas en el análisis de EEG, se utilizan diversos algoritmos de
aprendizaje automático, cada uno diseñado para abordar diferentes aspectos de la señales
[3]. Estos algoritmos se clasi�can en tres categorías principales: aprendizaje supervisado,
aprendizaje no supervisado y aprendizaje reforzado (ver Figura 8).

Figura 8. Tipos de aprendizaje automático
Nota. Obtenida de [24].

20


6.4.1. Aprendizaje supervisado

En este tipo de aprendizaje, el algoritmo recibe un conjunto de datos etiquetados que
incluyen entradas y sus salidas deseadas. Su objetivo es aprender una función que mapee las
entradas a las salidas correctas. Básicamente, como se detalla en la Ecuación (1), este tipo
de algoritmos desarrollan una función (f) que permita realizar inferencias de la salida (y)
debido a su entrada (x) esto mediante el aprendizaje de parámetros (ϕ) [25].

y = f [x, ϕ] (1)

Estos algoritmos son capaces de realizar tareas de regresión y de clasi�cación, donde
la principal diferencia recae en que la salida (y) es continua (e.g., 10.5) para las tareas de
regresión y discreta para las de clasi�cación (e.g., �bueno�). Según el tipo de tarea que se
desea realizar, así se debe de seleccionar el algoritmo.

Algunos algoritmos de aprendizaje supervisado son:

De clasi�cación

� Máquinas de vectores de soporte (SVM): utiliza un hiperplano que separa los da-
tos de cada una de las clases. Cuando los datos no presentan un comportamiento
lineal, permiten la utilización de kernels (funciones no lineales) para transformar
los datos a un espacio de mayor dimensión y así presenten un comportamiento
lineal [24].

� Árboles de decisión: tal como su nombre lo indica, estos replican la estructura de
un árbol, donde los datos ingresan por el tronco y luego pasan a ser clasi�cados
por las condiciones de cada rama que lleva a cada categoría. Estos pueden llegar
a tener tantas rami�caciones como categorías que se busque clasi�car [24].

� Redes neuronales: estas se inspiran en el funcionamiento de las neuronas del
cerebro humano, las cuales cuentan con una unidad básica llamada perceptrón que
cumple con la Ecuación (1). Cada unidad básica, se interconecta con el resto que se
tengan y es así que forman la red neuronal. Luego, cada unidad básica y conexión
entre ellas contiene sus parámetros, los cuales mediante un entrenamiento se
ajustan para lograr la clasi�cación en cada una de las categorías (salidas de la
red) [25].

De regresión [24]

� Regresión lineal: ajuste estadístico mediante una función lineal de la siguiente
forma y = ϕ0 + ϕ1x.

� Regresión no lineal: ajuste estadístico mediante una función no lineal de la forma
y = ϕ0 + ϕ1x+ ϕ2x

2 + · · ·+ ϕnx
n.

� Máquinas de vectores de soporte (SVM): funcionan de la misma manera que
las de clasi�cación, con la diferencia que ahora el hiperplano busca ajustarse al
comportamiento de los datos.

21


6.4.2. Aprendizaje no supervisado

En este tipo de aprendizaje, el algoritmo recibe un conjunto de datos sin etiquetar y debe
encontrar patrones o estructuras interesantes en los datos [3]. No se le proporciona ninguna
retroalimentación correcta o incorrecta. Algunos ejemplos de algoritmos de aprendizaje no
supervisado incluyen:

K-Means clustering

Análisis de componentes principales (PCA)

Algoritmos de agrupamiento jerárquico

Mapas autoorganizados (SOM)

6.4.3. Aprendizaje reforzado

En este tipo de aprendizaje, el algoritmo aprende a través de la interacción con un
entorno. Recibe retroalimentación en forma de recompensas o penalizaciones en función de
las acciones que toma. El objetivo es aprender una política que maximice la recompensa
acumulada a lo largo del tiempo [3]. Algunos algoritmos de aprendizaje reforzado son, los
siguientes:

Q-Learning

Aprendizaje profundo Q

Política de gradiente suave (PG)

Actor-Critic

6.5. Aprendizaje profundo

En los últimos años, el campo del aprendizaje automático ha experimentado un notable
auge, impulsado por avances en el procesamiento de grandes volúmenes de datos, capacidades
computacionales y el desarrollo de nuevas técnicas (aprendizaje profundo/Deep Learning).
Esto ha permitido un progreso signi�cativo en diversas áreas, donde la capacidad de estos
algoritmos para adaptarse y mejorar con el tiempo ha resultado particularmente útil [25].

El aprendizaje profundo es una evolución del aprendizaje automático que integra las
tres áreas principales de este campo (supervisado, no supervisado y por refuerzo) en un
solo enfoque (ver Figura 9). Esto se logra mediante la implementación de redes neuronales
profundas, que se adaptan según la funcionalidad buscada (i.e., clasi�cación o regresión) y
el tipo de datos disponibles (e.g., imágenes, señales o texto).

22


Figura 9. Aprendizaje profundo y sus áreas
Nota. Obtenida de [25].

El concepto de red neuronal profunda se basa en la de�nición dada anteriormente en la
sección de aprendizaje supervisado (6.4.1), y en el teorema de aproximación universal. El
cual, establece que cualquier función continua es aproximable por una red neuronal de una
capa (perceptrón multicapa, MLP), siempre y cuando esta tenga las su�cientes neuronas en
su capa oculta para representar la función (ver Figura 10).

x1

Entradas

x2

x3

...

xn

h1

Capa oculta

h2

...

hn

y1

...

Salidas

yn

Figura 10. Perceptrón multicapa básico generalizado

Entonces, una red neuronal profunda es la interconexión lineal de dos o más capas
ocultas con sus neuronas de entrada y salida. Esta interconexión de capas ocultas, permite
que este tipo de redes neuronales interpreten de mejor manera los datos, por lo que han
ganado popularidad pues son capaces de aprender de los datos (aprender de la experiencia)
sin la necesidad de proporcionarle características representativas de estos. A la vez que,
se han optimizado sus algoritmos de entrenamiento para procesar grandes cantidades de
datos, así llegando a superar capacidades humanas (e.g., predicción de enfermedades) y
proporcionando nuevas herramientas (e.g., editores de fotos con IA).

23


6.5.1. Entrenamiento de redes neuronales profundas

El entrenamiento de una red neuronal profunda se puede visualizar desde la perspectiva
de un problema de optimización numérica, donde se busca minimizar la función de pérdida
de la red ajustando sus parámetros (ϕ, Ecuación (1)). A pesar de esta perspectiva simple,
este problema de optimización puede llegar a involucrar de cientos a millones de parámetros,
por consiguiente, plantea retos signi�cativos para los enfoques de resolución tradicionales.

Función de pérdida

La función de pérdida o de costo mide la discrepancia entre las predicciones del modelo
(f [xi, ϕ]) y el valor o clase real (yi). Esta función actúa como una guía para el entrenamiento
del modelo, ajustando los parámetros de la red de manera que las predicciones sean lo más
precisas posible [25].

La elección de la función de pérdida es crucial, ya que debe adaptarse al tipo de proble-
ma1: en particular, si el modelo realiza una tarea de clasi�cación binaria o de clasi�cación
multiclase. En el caso de clasi�cación binaria, donde solo hay dos posibles clases (e.g., ic-
tal/no ictal), se suelen utilizar funciones de pérdida como la entropía cruzada binaria, que
mide la probabilidad de que el modelo clasi�que correctamente en cada caso [25].

Por otro lado, en problemas de clasi�cación multiclase, donde existen múltiples clases
posibles (e.g., clasi�car diferentes tipos de crisis epilépticas), se utiliza una versión gene-
ralizada de la entropía cruzada. Esta función considera todas las clases posibles en cada
predicción y evalúa la probabilidad asignada a la clase correcta [25].

Es importante distinguir entre estos tipos de problemas porque la función de pérdida
debe re�ejar la estructura del conjunto de clases. De esta manera, la función de pérdida
no solo mide el error, sino que también guía al modelo para lograr una clasi�cación precisa
según el tipo de problema.

Algoritmos de optimización

Como se expuso anteriormente, los métodos tradicionales para resolver este problema
de optimización pueden tornarse ine�cientes en redes profundas debido a la gran cantidad
de parámetros. Por ello, se han desarrollado algoritmos de optimización especí�cos que
permiten ajustar los parámetros de la red de manera más efectiva. Entre los más utilizados
se encuentran el descenso de gradiente estocástico (SGD) con momentum y adam, mediante
los cuales se ha alcanzado el estado del arte en múltiples modelos.

1Se omite problema de regresión, pues no se presenta un caso de este tipo en este trabajo. Consulte:
medium.com/analytics-vidhya/a-comprehensive-guide-to-loss-functions-part-1-regression-�8b847675d6

24

https://medium.com/analytics-vidhya/a-comprehensive-guide-to-loss-functions-part-1-regression-ff8b847675d6


Descenso de gradiente estocástico con momentum (SGDM): el descenso de gra-
diente estocástico (SGD) es un método de optimización que ajusta los parámetros de la red
en función de un pequeño subconjunto de datos (minibatch) en cada paso (iteración), en
lugar de utilizar el conjunto completo. Aunque esto acelera el entrenamiento, puede generar
oscilaciones en el proceso de convergencia, di�cultando la llegada a un mínimo global [25].

Para reducir estas oscilaciones, se incorpora el concepto de momentum o momento, que
añade una fracción del gradiente de la iteración anterior al cálculo actual. La actualización
del parámetro en SGDM se de�ne como:

θℓ+1 = θℓ − α∇E(θℓ) + γ(θℓ − θℓ−1), (2)

donde:

α es la tasa de aprendizaje, que controla la magnitud del ajuste en cada paso.

∇E(θℓ) es el gradiente de la función de pérdida respecto a los parámetros de la red en
el paso (θℓ).

γ es el valor de momentum, que determina cuánto del gradiente de la iteración previa
in�uirá en la actualización actual.

El parámetro de momentum ayuda a suavizar el trayecto de optimización, permitiendo
que el modelo progrese más rápido en direcciones donde el gradiente se mantiene consistente
y se reducen las oscilaciones (ver Figura 11).

Figura 11. Efecto del momentum en SGD
Nota. a) SGD sin momentum, b) SGD con momentum. Obtenida de [25].

25


Adam (adaptive moment estimation): adam es una mejora sobre SGD que incorpora
tanto momentum como una adaptación automática de la tasa de aprendizaje para cada
parámetro. Utiliza momentos de primer y segundo orden del gradiente, es decir, el promedio y
la varianza acumulados, respectivamente, para ajustar dinámicamente la función de pérdida
[26].

Adam realiza la siguiente secuencia en cada iteración:

1. Cálculo del promedio acumulado del gradiente:

mℓ = β1mℓ−1 + (1− β1)∇E(θℓ),

donde:

mℓ es el promedio acumulado de los gradientes de los parámetros.

β1 es el factor de decaimiento que controla cuánto in�uye el gradiente actual en
el promedio.

2. Cálculo del promedio acumulado del cuadrado del gradiente:

vℓ = β2vℓ−1 + (1− β2)[∇E(θℓ)]2,

donde:

vℓ es el promedio acumulado del cuadrado de los gradientes de los parámetros.

β2 es el factor de decaimiento que controla cuánto in�uye el gradiente actual en
el promedio.

Finalmente, la actualización de los parámetros en adam se de�ne como:

θℓ+1 = θℓ −
α ·mℓ√
vℓ + ϵ

, (3)

donde:

ϵ es un pequeño valor constante para evitar divisiones por cero.

Adam es especialmente útil en redes profundas, ya que adapta automáticamente la mag-
nitud del ajuste para cada parámetro según la variación de su gradiente, permitiendo una
convergencia más estable y rápida en muchos casos [25].

6.5.2. Tipos de redes neuronales profundas

En el campo del aprendizaje profundo, existen múltiples arquitecturas de redes neuro-
nales diseñadas para abordar problemas especí�cos. Dos tipos de redes son particularmente
relevantes en el análisis de señales temporales y secuenciales, como los electroencefalogra-
mas (EEG): las redes neuronales recurrentes (RNN) y las redes neuronales convolucionales
(CNN).

26


Redes neuronales recurrentes

Las redes neuronales recurrentes (RNN, por sus siglas en inglés) están diseñadas para
procesar datos secuenciales, lo cual las hace ideales para tareas en las que el orden de los
datos y la dependencia temporal son importantes, como el análisis de EEG, la predicción de
series temporales y el procesamiento de lenguaje natural. En una RNN, las conexiones entre
las neuronas forman un ciclo que permite que la información persista a lo largo de las capas
(ver Figura 12), creando una especie de �memoria� de corto plazo. Esta �memoria� permite
que las RNN capten relaciones dependientes en el tiempo, facilitando el reconocimiento de
patrones que evolucionan a lo largo de una secuencia [27].

Las RNN, sin embargo, presentan ciertos desafíos, como el desvanecimiento del gradiente,
que limita su capacidad para capturar dependencias de largo plazo en secuencias largas. Este
problema ha llevado al desarrollo de variantes de RNN que buscan mejorar la retención de
información y mitigar esta di�cultad, como lo son las LSTM, GRU, entre otras.

x1

x2

x3

Entradas

h1

h2

h3

h4

Capa oculta

y1

y2

Salidas

Figura 12. Red neuronal recurrente (RNN) simpli�cada

Redes neuronales convolucionales

Las redes neuronales convolucionales (CNN) son ampliamente utilizadas en el proce-
samiento de imágenes (ver Figura 13), pero también se han adaptado para analizar datos
secuenciales y temporales, como los EEG. Las CNN aplican �ltros (o convoluciones) que
extraen características locales de los datos, lo que permite detectar patrones repetitivos y
estructuras en diferentes segmentos de la secuencia [25]. En el contexto de señales EEG, las
CNN pueden capturar patrones especí�cos en intervalos de tiempo �jos, lo cual resulta útil
para identi�car eventos de interés dentro de la señal.

Una de las ventajas de las CNN es su capacidad para realizar estos análisis de manera
paralela y e�ciente, aprovechando la naturaleza estructurada de las convoluciones. Además,
al no depender de conexiones cíclicas, como en las RNN, las CNN pueden procesar secuencias
más largas con menos problemas de gradientes desvanecidos y tiempo de inferencia.

27


Imagen RGB, x
Convoluciones

Capa oculta, hn

Salidas, y

Figura 13. CNN simpli�cada para imágenes RGB clasi�cación multiclase

Otros tipos de redes neuronales

Además de las RNN y CNN, existen otras arquitecturas de redes neuronales profundas,
como las redes generativas antagónicas (GAN), los transformadores (transformers) y los au-
toencoders [25]. Las GAN han revolucionado el campo de la generación de datos sintéticos,
siendo útiles en aplicaciones como la generación de imágenes realistas. Por su parte, los
transformadores han mostrado gran e�cacia en el procesamiento de secuencias largas, como
en tareas de modelado de lenguaje natural. Finalmente, los autoencoders se utilizan frecuen-
temente para la reducción de dimensionalidad y la extracción de características relevantes
en datos complejos.

Es importante mencionar que este campo está en constante evolución, con mejoras fre-
cuentes a arquitecturas existentes y la introducción de nuevas variantes. Desde el año 2012,
el interés en este enfoque ha experimentado un crecimiento notable, como se muestra en
la Figura 14. Aunque no se profundiza en estas arquitecturas adicionales, representan di-
recciones prometedoras para futuras investigaciones en el análisis de patrones en grandes
conjuntos de datos.

2004 2006 2008 2010 2012 2014 2016 2018 2020 2022 2024

Año

0

10

20

30

40

50

60

70

80

90

100

In
te

ré
s

 (
%

)

Figura 14. Interés en el aprendizaje profundo
Nota. Obtenida de [28].

28


CAPÍTULO 7

Obtención y recolección de datos

En este capítulo se describe el proceso de recolección de electroencefalogramas para este
trabajo de graduación. Se incluyen las bases de datos investigadas, los centros especializados
en epilepsia considerados para colaboración, y otras alternativas evaluadas. Este proceso
representa un avance signi�cativo tanto para este proyecto de graduación como para la línea
de investigación.

7.1. Propuesta de recolección de datos estandarizada

Teniendo en cuenta el equipo disponible en la UVG para la recolección de señales bio-
eléctricas, se evaluó como primer alternativa la implementación de un proceso de recolección
estandarizado. Para ello, se inició con la evaluación de los equipos BIOPAC modelos MP36
y MP41, los cuales son interfaces certi�cadas ISO 9001:2015 para la adquisición de señales
de bioeléctricas para �nes de investigación (ver Figura 15a).

Se determinó que el modelo MP36 era apto para la recolección de electroencefalogramas,
ya que es compatible con el casco de electrodos de la empresa Electro-Cap disponible en
UVG (ver Figura 15b). Este casco cumple con el estándar 10/20, es compatible con los
montajes monopolar y bipolar, dispone los canales que se presentan en el Cuadro 3 y se
ajusta a pacientes mayores de 5 años de edad.

29


(a) Pruebas con BIOPAC MP41 (b) Casco de electrodos en UVG

Figura 15. Equipo disponible para recolección de datos
Nota. Figura 15b obtenida de [29].

Conector blanco Conector rojo Color de cable
Fp1 Fp2 Café
F3 F4 Rojo
C3 C4 Naranja
P3 P4 Amarillo
01 02 Verde
F7 F8 Azul
T3 T4 Violeta
T5 T6 Gris
Gnd Cz Blanco
Fz Pz Negro

Cuadro 3. Electrodos disponibles en casco
Nota. Obtenido de [29].

30


Dado que este proceso de recolección requeriría la participación de personas ajenas a la
investigación, se procedió a elaborar un consentimiento informado con la siguiente estructura:

Sobre la investigación: contexto del estudio, proporcionando el nombre, lugar, fecha y
encargados de la investigación.

Propósito y objetivo del estudio.

Procedimiento para sesiones de medición: detalles sobre la realización del electroence-
falograma básico y el trato que recibirá.

Uso y con�dencialidad de los datos: limitaciones del uso de la información recopilada,
destinada únicamente para �nes académicos y cientí�cos.

Consideraciones asociadas a la participación: indicación de que el estudio no presenta
riesgos para la salud del paciente, más allá de una posible irritación en la piel por la
colocación de los electrodos.

Bene�cios asociados a la participación: información sobre la contribución del partici-
pante al desarrollo de la herramienta Epileptic EEG Analysis Toolbox.

Condiciones de participación voluntaria.

Declaración de consentimiento de participación.

Declaración del encargado de la investigación.

Firma de participante e información de investigadores.

El documento completo de consentimiento informado se encuentra en la documentación
de este trabajo de graduación en la carpeta �Documentos/Consentimiento Informado� (ver
Anexos 15.1). La elaboración de este documento tenía como objetivo informar y solicitar
la autorización de los pacientes para su participación en la investigación. Sin embargo, tras
evaluar la seguridad de realizar mediciones a pacientes con y sin epilepsia, se determinó que
existía un riesgo signi�cativo al hacerlo sin supervisión médica especializada. Este proceso
requeriría el apoyo y/o capacitación de personal médico para monitorear y manejar posibles
complicaciones durante las sesiones de medición, lo cual excedía los alcances de esta inves-
tigación. Por lo tanto, se optó por realizar una investigación exhaustiva de bases de datos
médicas disponibles y de centros especializados en epilepsia, como HUMANA, para obtener
los datos necesarios de manera segura y con�able.

31


7.2. Centros especializados

Con el objetivo de expandir las posibilidades de obtención de datos, se investigaron
centros especializados en neurología y epilepsia que podrían ser considerados en fases futuras
del proyecto. Estos centros, ubicados en diversos países, cuentan con la experiencia clínica
y los recursos necesarios para proporcionar estudios electroencefalográ�cos valiosos.

Sin embargo, no se establecieron colaboraciones formales con estos centros en esta fase
del proyecto, ya que se contó con la disponibilidad de bases de datos accesibles y adecuadas
para el desarrollo de los algoritmos de aprendizaje automático, como se detalla en la siguiente
sección.

Algunos de los centros identi�cados incluyen:

Instituto Nacional de Neurología y Neurocirugía de México �Manuel Velasco Suárez�.

Centro Aura de México.

Consejo Nacional de Investigaciones Cientí�cas y Técnicas - Hospital El Cruce - Uni-
versidad Nacional Arturo Jauretche (Argentina).

La información completa sobre estos centros, incluyendo datos de contacto y detalles adi-
cionales, queda documentada y disponible como un recurso para futuras fases en la carpeta
�Documentos/Información Centros� (ver Anexos 15.1).

7.3. Bases de datos médicas

Como indica Obeid [30], aunque cada año se realizan cientos a miles de electroencefa-
logramas en todo el mundo, las bases de datos disponibles para el desarrollo de algoritmos
especializados en su análisis son limitadas. Ante esta limitación que afectó las fases anterio-
res de esta línea de investigación, se llevó a cabo una búsqueda exhaustiva de bases de datos
estandarizadas.

Esta búsqueda tuvo como objetivo obtener un conjunto de datos más robusto y diverso,
en concordancia con el primer objetivo especí�co de este trabajo. Para la selección de bases de
datos disponibles, se priorizó que estas fueran de libre acceso y que contuvieran anotaciones
de utilidad para el desarrollo de algoritmos de aprendizaje supervisado.

7.3.1. Siena Scalp EEG Database

Esta base de datos consiste en registros de 14 pacientes monitoreados mediante la técnica
de EEG con video (Video-EEG) en la Unidad de Neurología de la Universidad de Siena.
Los pacientes tienen un rango de edad entre 20 y 71 años, de los cuales 9 son hombres y
5 son mujeres. Cada EEG fue recolectado a una frecuencia de muestreo de 512 Hz bajo el
estándar 10/20 [31].

32


En cuanto a las etiquetas que contiene cada señal en forma de región de interés, es
importante resaltar que esta base de datos contiene 6 tipos de etiqueta para identi�car
diferentes tipos de crisis, según la clasi�cación de la ILAE (ver Figura 6):

IAS: crisis de conciencia alterada de inicio focal.

WIAS: crisis de conciencia preservada de inicio focal.

FBTC: crisis focal a bilateral tónica - clónica.

T: crisis en lóbulo temporal 1.

R: crisis en lóbulo derecho 1.

L: crisis en lóbulo izquierdo 1.

Esta base de datos es valiosa, ya que permite profundizar en el desarrollo de algoritmos
de clasi�cación multiclase y algoritmos de procesamiento de video.

Acceso directo a la base de datos: doi.org/10.13026/5d4a-j060

7.3.2. CHB-MIT Scalp EEG Database

Esta base de datos contiene 664 registros de EEG de 22 pacientes pediátricos del Chil-
dren's Hospital Boston, monitoreados durante varios días sin estar bajo medicación anticon-
vulsiva. Los pacientes tienen un rango de edad entre 1.5 y 22 años, de los cuales 17 son
mujeres y 5 son hombres. Cada estudio fue recolectado a una frecuencia de 256 Hz con una
resolución de 16 bits. Los registros incluyen al menos 23 canales que cumplen con el están-
dar 10/20 y contienen etiquetas de tipo región de interés para los estudios que presentan
convulsiones [32].

Esta base de datos es de gran importancia, ya que es una de las pocas que proporciona
estudios de pacientes pediátricos. Esto ha permitido a los investigadores profundizar en
aplicaciones adaptadas a la madurez del cerebro humano, como se menciona en la Sección
6.1.2.

Acceso directo a la base de datos: doi.org/10.13026/C2K01R

7.3.3. The Temple University Hospital EEG Data Corpus (TUH)

Esta es la base de datos más grande disponible públicamente, cuenta con los registros
completos para cada estudio y se estima que contiene más de 60,000 EEG recolectados
en el Temple University Hospital Philadelphia desde el año 2002 [30]. Esta base de datos,
además de proporcionar una gran cantidad de estudios, también proporcionan herramientas
de software para su análisis, e inclusive algunas han sido adoptadas por empresas como
MATLAB con la función edfread().

1Indica el lóbulo de ocurrencia de la crisis, complementa las primeras 3 etiquetas.

33

https://doi.org/10.13026/5d4a-j060
https://doi.org/10.13026/C2K01R


Cuenta con un repositorio (corpus) principal que se divide en 6 repositorios secundarios,
cada uno con un enfoque especí�co:

TUH EEG Corpus (TUEG: v2.0.1): repositorio principal, contiene 69,625 EDF (EEG)
de los cuales el 95% se encuentran bajo el estándar 10/20 y la frecuencia de muestreo
está en el rango de 250 a 1024 Hz. No se encuentra etiquetado.

� TUH Abnormal EEG Corpus (TUAB: v3.0.1): contiene 2,993 EDF clasi�cados
como normales o anormales. Donde según su clasi�cación, se encuentran separa-
dos por carpetas y su objetivo es el entrenamiento de algoritmos tipo secuencia
a etiqueta.

� TUH EEG Artifact Corpus (TUAR: v3.0.1): contiene 310 EDF anotados para
la detección de artefactos relacionados con el movimiento ocular, masticación,
escalofríos, movimiento muscular y ruido debido a electrodos. Su objetivo es el
entrenamiento de algoritmos que identi�quen y/o eliminen este tipo de artefactos.

� TUH EEG Epilepsy Corpus (TUEP: v2.0.1): contiene 100 EDF correspondientes
a pacientes con epilepsia y 100 EDF correspondientes a pacientes sin epilepsia. El
objetivo es el entrenamiento de algoritmos que puedan determinar si un paciente
padece o no de epilepsia.

� TUH EEG Events Corpus (TUEV: v2.0.1): contiene 518 EDF anotados para la
identi�cación de las onda aguda - onda lenta, descargas periódicas epileptiformes
generalizadas o lateralizadas, movimientos oculares, artefactos y ruido de fondo
(ver Sección 6.2.1). Su objetivo es servir para entrenar algoritmos que asocien la
forma de las ondas, que son de interés médico en el diagnóstico de la epilepsia.

� TUH EEG Seizure Corpus (TUSZ: v2.0.3): incluye 7,361 EDF anotados manual-
mente para la detección de períodos de convulsión (fase ictal) y todas las anota-
ciones de los subconjuntos ya mencionados. Cada estudio contiene dos archivos
de etiquetas: uno que indica el fragmento de tiempo y el canal donde se da una
crisis o artefacto, y otro que señala únicamente el período de tiempo donde existe
convulsión aplicable para todos los canales. El objetivo de este repositorio, es
el entrenamiento de algoritmos tipo secuencia a secuencia, capaces de reconocer
períodos de convulsión en un estudio en general o por canales.

� TUH EEG Slowing Corpus (TUSL: v2.0.1): contiene 300 EDF anotados para la
detección de comportamientos lentos, de fondo complejo o de convulsión. Las
etiquetas proporcionadas por estudio aplican para todos los canales y conforman
un conjunto equilibrado de clases (100 estudios por clase). Este subconjunto ha
sido de utilidad para evaluar algoritmos de clasi�cación existentes, para evaluar
la respuesta ante sucesos poco comunes dentro de un EEG.

Con lo expuesto, esta base de datos es un recurso de gran valor para esta línea de inves-
tigación, debido a su gran volumen de datos, la variedad de anotaciones y las herramientas
de software que proporciona. Para gestionar el acceso a esta base de datos y explorar sus
repositorios, consulte: isip.piconepress.com/projects/nedc/html/tuh_eeg/.

34

https://isip.piconepress.com/projects/nedc/html/tuh_eeg/


7.3.4. Otras bases de datos disponibles

El avance en esta línea de investigación depende en gran medida de la cantidad de
electroencefalogramas disponibles para el entrenamiento y la validación de algoritmos de
aprendizaje automático. Como señala Obeid [30]: �grandes cantidades de EEG permitirán
alcanzar el estado del arte en algoritmos de aprendizaje automático para descubrir nuevos
diagnósticos y validar prácticas clínicas�. A continuación, se presenta un listado de otras
bases de datos que pueden ser exploradas para su posible utilidad:

The Bonn EEG Time Series: doi.org/10.34810/data490.

EEG/FMRI Naturalistic Viewing Dataset : doi.org/10.1101/2022.11.23.517540.

Simultaneous EEG-fMRI Dataset : doi.org/10.17632/crhybxpdy6.2

Epileptic EEG Dataset : doi.org/10.17632/5pc2j46cbc.1

EEG Dataset of Epileptic Seizure Patients: dx.doi.org/10.21227/hd6x-jr97

Dataset of neonatal EEG recordings with seizures annotations: zenodo.org/records/4940267

AES Seizure Prediction Challenge database: kaggle.com/c/seizure-prediction/data

OpenNEURO Epilepsy Datasets: doi.org/10.1038/s41597-019-0104-8

7.3.5. Selección base de datos de TUH

Tras evaluar la implementación de un proceso de recolección estandarizado, explorar las
bases de datos disponibles y considerar la posible colaboración con centros especializados en
epilepsia, se decidió gestionar el acceso a la base de datos The Temple University Hospital
(TUH). Esta decisión se basó en la necesidad de contar con un conjunto de datos amplio
y detallado, algo que esta base de datos ofrece gracias a su gran cantidad de estudios y
anotaciones. En los siguientes capítulos, se evidencia el gran valor de la base de datos para
esta línea de investigación.

35

https://doi.org/10.34810/data490
https://doi.org/10.1101/2022.11.23.517540
https://doi.org/10.17632/crhybxpdy6.2
https://doi.org/10.17632/5pc2j46cbc.1
https://dx.doi.org/10.21227/hd6x-jr97
https://zenodo.org/records/4940267
https://www.kaggle.com/c/seizure-prediction/data
https://doi.org/10.1038/s41597-019-0104-8


CAPÍTULO 8

Procesamiento de estudios

Este capítulo describe los estudios utilizados y las técnicas aplicadas para su procesa-
miento. Asimismo, se aborda el tercer objetivo especí�co de este trabajo, con un enfoque
particular en la de�nición de los parámetros establecidos por HUMANA para el procesa-
miento de los estudios.

Para una mejor comprensión de este estudio, consultar Prototipo_Data_TUH.m en el
repositorio de esta fase de investigación (ver Anexo 15.2).

8.1. Selección de estudios

Como se menciona en la Sección 7.3.3, la base de datos de TUH ofrece distintos reposi-
torios para diversas funcionalidades. Teniendo en cuenta el trabajo de las fases anteriores,
se priorizó la clasi�cación de periodos ictales o de convulsión, por lo que se seleccionó el
subconjunto �TUH EEG Seizure Corpus� (SEIZ TUH) [33].

8.1.1. Descripción del conjunto de datos

Este conjunto de estudios se encuentra dividido en dos carpetas principales:

DOCS: proporciona los listados de los electrodos disponibles según el tipo de montaje
utilizado y un cuadro que resume todas las posibles etiquetas que se pueden encontrar
en los estudios.

� Montajes disponibles: todos los estudios son compatibles con el montaje TCP bi-
polar de doble banana (ver Figura 16). Es importante tener en cuenta que algunos

36


estudios fueron registrados con referencia promedio (ar) y otros con referencia de
oídos (le) (ver Sección 8.2).

Figura 16. Montaje bipolar de doble banana
Nota. Obtenida de [34].

� Etiquetas disponibles: cada estudio cuenta con dos archivos. El archivo con ex-
tensión �.csv� incluye etiquetas basadas en eventos, es decir, marca el tiempo de
inicio y �n, así como la etiqueta correspondiente, cuando ocurre algún suceso de
importancia en los canales. En cambio, el archivo con extensión �.csv_bi� registra
eventos de interés en cualquiera de los canales, anotando el tiempo de inicio y �n
junto con una etiqueta aplicable a todos los canales. Tal como se observa en el
Cuadro 4 junto con las etiquetas que se presentan en Anexos 15.3.

Etiquetas �.csv� Etiquetas �.csv_bi�
Canal inicio �n etiqueta Canal inicio �n etiqueta
FP1-F7 0 1.0255 bckg TERM 0 1.0255 bckg
FP1-F7 1.0255 10.0255 cpsz TERM 1.0255 10.0255 seiz

Cuadro 4. Ejemplo de etiquetado en estudios EEG

edf: esta carpeta está organizada en los conjuntos de entrenamiento, validación y eva-
luación. Cada conjunto contiene una cantidad signi�cativa de estudios EEG etique-
tados, como se detalla en el Cuadro 5. En este cuadro, se resumen las características
principales de cada conjunto, incluyendo la cantidad de estudios, rango de duración, el
rango de frecuencia de muestreo y el porcentaje de estudios con eventos convulsivos.

Entrenamiento Validación Evaluación
Cantidad de estudios 3,163 1,539 806

Duración 5 s - 11.5 h 1 s - 1 h 16 s - 1 h

Rango frecuencia de muestreo 250 - 1,000 Hz (común 256 Hz)
Estudios con convulsión 450 (14.23%) 248 (16.11%) 195 (24.19%)

Cuadro 5. Ejemplo de etiquetado en estudios EEG

37


8.1.2. Descarga de estudios de base de datos

Para realizar la descarga de los estudios desde la base de datos, es fundamental haber
gestionado previamente el acceso a esta, como se detalla en la Sección 7.3.3. La base de
datos se encuentra alojada en un servidor Apache, y [30] recomienda utilizar la herramienta
rsync para este procedimiento debido a su capacidad para mantener sincronizadas las copias
locales con las actualizaciones del servidor.

El método preferido para descargar los estudios es el siguiente:

Para usuarios de Linux y MacOS: rsync está disponible de manera nativa en estas
plataformas dentro de su terminal y es ideal para realizar las descargas.

Para usuarios de Windows: se recomienda instalar MobaXterm, que incluye soporte
para rsync, permitiendo realizar las descargas de manera similar a Linux y MacOS.

Además, es necesario contar con:

Las credenciales de acceso al servidor proporcionadas por TUH.

La ruta especí�ca dentro del servidor donde se encuentran los estudios a descargar.

Espacio de almacenamiento su�ciente en el equipo local para las descargas.

En la documentación de esta línea de investigación, en la carpeta �Documentos/Manuales�
(ver Anexos 15.1), se proporciona una guía detallada para con�gurar rsync, instalar MobaX-
term en sistemas Windows y ejecutar los comandos necesarios para descargar y mantener
sincronizada la base de datos con el servidor de TUH.

8.2. De�nición de parámetros de HUMANA

Una vez descargados los estudios y antes de proceder con su procesamiento para la
implementación de los algoritmos, se de�nieron los parámetros utilizados por HUMANA para
el análisis de los estudios electroencefalográ�cos. Este paso fue realizado en concordancia con
el tercer objetivo especí�co de este trabajo, asegurando que el procesamiento de los datos
cumpla con los estándares y criterios establecidos por este centro.

Basándose en los estudios proporcionados por HUMANA y de su libro titulado �Epilep-
sias, Enfoque Multidisciplinario� [2], se identi�caron los siguientes parámetros clave:

Distribución estandarizada de electrodos 10-20: como primer criterio, se estableció que
los estudios debían cumplir con esta distribución de electrodos (ver Sección 6.1.1).

Montaje bipolar para el análisis: HUMANA no realiza un análisis canal por canal, sino
que organiza los estudios como un montaje bipolar. Este enfoque les permite comparar
directamente la actividad entre canales y entre hemisferios del cerebro, facilitando la
identi�cación de patrones relevantes para el diagnóstico.

38


8.3. Migración de estudios a MATLAB

La primera tarea para iniciar la exploración de algoritmos con los nuevos datos consistió
en desarrollar un proceso de lectura e�ciente para manejar la gran cantidad de archivos dis-
ponibles. Este proceso no solo debía optimizar la carga de datos, sino también garantizar que
los estudios cumplieran con los parámetros establecidos por HUMANA y fueran adaptados
para su posterior procesamiento mediante algoritmos de aprendizaje automático.

8.3.1. Selección de tipo de referencia

El punto de partida para esta tarea fue de�nir con qué tipo de referencia se iba a trabajar,
ya que, como se expuso anteriormente, el conjunto de datos SEIZ TUH contiene estudios
con referencia promedio (ar) y referencia de oídos (le). Si bien ambas referencias tienen
sus ventajas particulares, trabajar con ambas mezcladas no era una opción viable, ya que
ello podría introducir inconsistencias en los datos y di�cultar la interpretación mediante los
algoritmos de aprendizaje automático [35].

La referencia promedio (ar) presenta ventajas signi�cativas en estudios electroencefa-
lográ�cos. Distribuye el potencial de referencia entre todos los electrodos, lo cual reduce
posibles sesgos asociados a una única ubicación y minimiza la in�uencia de ruidos locales en
los puntos de referencia [35]. Esto es especialmente relevante para estudios con algoritmos de
aprendizaje automático, ya que asegura una mayor homogeneidad en las señales procesadas.

Por otro lado, la referencia de oídos (le) es más común en con�guraciones clínicas, y
su simplicidad puede ser adecuada para aplicaciones rápidas. Sin embargo, su dependencia
de una ubicación �ja puede hacerla más susceptible a interferencias externas y artefactos,
especialmente si los electrodos de referencia no están correctamente posicionados [35].

Dado que el objetivo principal de este trabajo era maximizar la calidad y consistencia
de los datos para el entrenamiento de los modelos, se optó por utilizar exclusivamente los
estudios con referencia promedio (ar). Esta decisión no solo garantiza una mayor uniformidad
en los datos, sino que también se alinea con los hallazgos de [35], donde se destaca que la
referencia promedio tiende a ser más adecuada para análisis automatizados debido a su
robustez frente al ruido y los artefactos. Además, esta elección no perjudica la cantidad
de estudios a utilizar, ya que el conjunto contiene una mayor proporción de estudios con
referencia ar en comparación con le (ver Figura 17).

8.3.2. Lectura en memoria de estudios

En una primera iteración, se consideró la posibilidad de realizar una lectura conjunta
de todos los estudios en memoria. Esto implicaba leer y procesar más de 5,000 estudios con
referencia ar de manera simultánea. Para implementar este enfoque, se siguió el Algoritmo
1, que emplea la función dir para delimitar los archivos a leer. Posteriormente, mediante un
ciclo for, se realiza el proceso de lectura utilizando las funciones edfinfo y edfread. Para
el procesamiento de etiquetas asociadas, se emplearon funciones especí�cas para la lectura
de tablas.

39


Figura 17. Distribución estudios con referencia ar y le en SEIZ TUH

Entrada: Rutas de acceso a los estudios obtenidas con dir.
Salida: Estudios procesados en montaje bipolar junto a su vector de etiquetas.

1 para cada estudio hacer
2 inicio
3 De�nir chnl_list ← lista de canales de inte