Publicación:
Deconvolución acústica basada en métodos de aprendizaje profundo y filtros adaptativos no lineales

dc.contributor.authorMaldonado Alvarez, Pablo Giovanni
dc.contributor.educationalvalidatorZea Arenales, Miguel Enrique
dc.date.accessioned2026-04-06T21:04:26Z
dc.date.issued2025
dc.descriptionFormato PDF digital — 87 páginas — incluye gráficos, tablas y referencias bibliográficas.
dc.description.abstractAcoustic deconvolution aims to recover signals degraded by room re ections in environments without acoustic treatment. This study evaluated three representative approaches to this problem using a unified database of clean and contaminated signals, together with a reproducible work ow for their comparison. The evaluated methods included kernel adaptive filtering (KAF), nonlinear autoregressive models with exogenous inputs (NLARX), and deep neural networks of the temporal convolutional neural network (TCN) type. The evaluation considered both synthetic signals and real recordings of voice and musical instruments. Performance was assessed using root mean square error (RMSE) and signal-tonoise ratio (SNR). The KAF method did not achieve effective reconstruction in real signals, yielding SNR values close to 0 dB. The NLARX model achieved an RMSE close to 0.32 with synthetic signals, but for real recordings it produced SNR values between −9 dB and −24 dB due to a low-pass filtering effect. In contrast, the TCN achieved the most consistent performance, with an RMSE close to 0.17 for synthetic signals and an SNR of −0.08 dB for real recordings, preserving high-frequency components that the other methods failed to recover. These results indicate that deep learning architectures constitute the most promising direction for advancing acoustic deconvolution.eng
dc.description.abstractLa deconvolución acústica busca recuperar señales afectadas por las re flexiones del recinto en entornos sin tratamiento acústico. Este estudio evaluó tres enfoques representativos para esta tarea mediante una base de datos unificada de señales limpias y contaminadas, junto con un flujo de trabajo reproducible para su comparación. Se consideraron filtros adaptativos no lineales basados en kernel, modelos autorregresivos no lineales con entradas exógenas (NLARX) y redes neuronales profundas de tipo red convolucional temporal (temporal convolutional network, TCN). La evaluación incluyó señales sintéticas y grabaciones reales de voz e instrumentos musicales, utilizando el error cuadrático medio (RMSE) y la relación señal-ruido (SNR) como métricas de desempeño. Los métodos basados en kernel no lograron una reconstrucción efectiva en señales reales, presentando valores de SNR cercanos a 0 dB. El modelo NLARX obtuvo un RMSE cercano a 0.32 en señales sintéticas, pero en señales reales produjo valores de SNR entre −9 dB y −24 dB debido a un comportamiento equivalente al de un filtro pasa bajas. En contraste, la TCN presentó el mejor desempeño global, con un RMSE cercano a 0.17 en señales sintéticas y un SNR de −0.08 dB en señales reales, preservando componentes de alta frecuencia que los otros métodos no lograron recuperar. Los resultados posicionan a las arquitecturas profundas como el enfoque más adecuado para avanzar en la deconvolución acústica.
dc.description.degreelevelPregrado
dc.description.degreenameLicenciado en Ingeniería Mecatrónica
dc.format.extent87 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://repositorio.uvg.edu.gt/handle/123456789/6371
dc.language.isospa
dc.publisherUniversidad del Valle de Guatemala
dc.publisher.branchCampus Central
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.placeGuatemala
dc.publisher.programLicenciatura en Ingeniería Mecatrónica
dc.relation.referencesJ. L. M. Cárdenas, Deconvolución acústica para grabación en ambientes no tratados, Trabajo de graduación, Universidad del Valle de Guatemala, Facultad de Ingeniería, Guatemala, 2020. dirección: https://repositorio.uvg.edu.gt/handle/123456789/ 3795.
dc.relation.referencesC. M. L. Flores, Deconvolución acústica basada en filtros adaptativos y redes neuronales regresivas, Trabajo de graduación, Universidad del Valle de Guatemala, Facultad de Ingeniería, Guatemala, 2021. dirección: https://repositorio.uvg.edu.gt/ handle/123456789/3851.
dc.relation.referencesA. Calí, Exploración de métodos de aprendizaje de máquina para mejorar aplicaciones enfocadas en deconvolución acústica en entornos no ideales, Tesis inédita. Universidad del Valle de Guatemala, 2024, 2024.
dc.relation.referencesJ. C. Principe, W. Liu y S. Haykin, Kernel Adaptive Filtering: A Comprehensive Introduction. Hoboken, NJ: John Wiley & Sons, 2010, isbn: 978-0-470-44753-6.
dc.relation.referencesD. S. Reay, Digital Signal Processing Using the ARM Cortex-M4. Wiley, 2015, isbn: 978-1-118-85904-9.
dc.relation.referencesB. Ghojogh, A. Ghodsi, F. Karray y M. Crowley, Reproducing Kernel Hilbert Space, Mercer's Theorem, Eigenfunctions, Nyström Method, and Use of Kernels in Machine Learning: Tutorial and Survey, arXiv preprint arXiv:2106.08443, 2021. arXiv: 2106. 08443 [stat.ML].
dc.relation.referencesOpenAI, ChatGPT (GPT-5 Thinking), https://chat.openai.com/, [Herramienta de IA conversacional], OpenAI, 2025. visitado 28 de sep. de 2025.
dc.relation.referencesS. J. Prince, Understanding Deep Learning. The MIT Press, 2023. dirección: http: //udlbook.com.
dc.relation.referencesG. Cybenko, Approximation by superpositions of a sigmoidal function, Mathematics of Control, Signals and Systems, vol. 2, n.o 4, págs. 303-314, 1989.
dc.relation.referencesK. Hornik, Approximation capabilities of multilayer feedforward networks, Neural Networks, vol. 4, n.o 2, págs. 251-257, 1991.
dc.relation.referencesF. Rosenblatt, The Perceptron: A probabilistic model for information storage and organization in the brain, Psychological Review, vol. 65, n.o 6, págs. 386-408, 1958.
dc.relation.referencesI. Goodfellow, Y. Bengio y A. Courville, Deep Learning. MIT Press, 2016. dirección: https://www.deeplearningbook.org/.
dc.relation.referencesS. Bai, J. Z. Kolter y V. Koltun, An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling, arXiv preprint arXiv:1803.01271, 2018.
dc.relation.referencesA. van den Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves et al., WaveNet: A Generative Model for Raw Audio, arXiv preprint arXiv:1609.03499, 2016.
dc.relation.referencesK. He, X. Zhang, S. Ren y J. Sun, Deep Residual Learning for Image Recognition, en Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, págs. 770-778. doi: 10.1109/CVPR.2016.90
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.armarcInteligencia artificial
dc.subject.armarcComputación flexible
dc.subject.armarcRed neuronal artificial
dc.subject.armarcProcesamiento digital de señales
dc.subject.armarcRedes neuronales (Computadores)
dc.subject.armarcSignal processing -- Digital techniques
dc.subject.armarcNeural networks (Computer science) -- Guatemala
dc.subject.ddc620 - Ingeniería y operaciones afines
dc.subject.ocde2. Ingeniería y Tecnología
dc.subject.odsODS 9: Industria, innovación e infraestructura. Construir infraestructuras resilientes, promover la industrialización inclusiva y sostenible y fomentar la innovación
dc.subject.proposalDeconvolución acústica
dc.subject.proposalAprendizaje automático
dc.subject.proposalFiltros adaptativos
dc.subject.proposalModelos no lineales
dc.subject.proposalRedes neuronales profundas
dc.titleDeconvolución acústica basada en métodos de aprendizaje profundo y filtros adaptativos no lineales
dc.title.translatedAcoustic deconvolution based on deep learning methods and nonlinear adaptive filters
dc.typeTrabajo de grado - Pregrado
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersion
dc.type.visibilityPublic Thesis
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Pablo Giovanni Maldonado Alvarez.pdf
Tamaño:
2.28 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
14.49 KB
Formato:
Item-specific license agreed upon to submission
Descripción: