Abstract:
Este trabajo se enfoca en dos importantes contribuciones al campo de las Redes Neuronales y sus
fundamentos teóricos. Por un lado, se analiza en profundidad el Teorema de Aproximación Universal
de Cybenko y su demostración. La demostración de este teorema utiliza herramientas de ramas como
Teoría de la Medida y el Análisis Funcional, más específicamente, el Teorema de Hahn - Banach,
el Teorema de Representación de Riesz y el Teorema de Convergencia Dominada de Lebesgue. No
obstante, se requiere un conocimiento básico de Análisis de Variable Real, Topología y Teoría de
Conjuntos. Asimismo, se presente una breve historia de cómo surge el interés de investigación y
aplicación de las Redes Neuronales, sus orígenes y contexto histórico.
Por otro lado, se presenta la versión extendida del teorema de Cybenko propuesta por Hornik,
White y Stinchcombe. Esta versión extiende el teorema original, ya que permite utilizar funciones
de activación más generales y la extensión de In = [0, 1]n, a un conjunto compacto general. Para
la demostración de este teorema, se utiliza principalmente el teorema Stone-Weierstrass y bastantes
herramientas de Análisis de Variable Real. Esto proporciona los fundamentos matemáticos necesarios
para llevar a cabo la demostración en Redes Neuronales de una sola capa oculta con una función de
activación continua y no constante de un espacio de funciones continuas sobre un compacto.
Finalmente, se implementó un prototipo de aplicación de los resultados anteriormente mencionados, esto con la finalidad de mostrar la utilidad que tienen dichos algoritmos pese a ser las estructuras
de Red Neuronal más básicas. Para ello, se desarrolló dos modelos en el lenguaje de programación
Python, con el apoyo de diversas librerías, como OpenCV, MediaPipe de Google y Keras, para interpretar el alfabeto de LENSEGUA (lenguaje de señas guatemalteco oficial) en tiempo real. Esto
implicó, la recopilación de los datos, el procesamiento de imágenes utilizando algoritmos de visión
computacional, el entrenamiento de los modelos y la implementación de el programa capaz de ejecutarlos en tiempo real. (LA)