Abstract:
En la teoría musical, existe el concepto de los patrones, que pueden ser entendidos
como el vocabulario utilizado para leer, escribir, y de cierta forma, hablar a través de
la música. Los patrones en la música también permiten a un alto nivel, una capacidad
de predicción, y como mínimo una capacidad de complementar o continuar una barra
del pentagrama especifica.
Dentro de las capacidades de la computación, en tiempos relativamente recientes se
ha logrado la funcionalidad de predecir comportamientos, muchas veces con un nivel
de exactitud bastante alto, a través de patrones que bajo circunstancias normales no
son visibles al análisis de un humano. Estos patrones se detectan sobre repositorios
de datos cuyo tamaño no solo añade complejidad a la exploración de los datos, sino
también a la detección de dichos patrones. Sin embargo, muchas veces estos datos
no están disponibles de una forma ordenada, centralizada y con acceso fácil para
algoritmos; esto presenta el desafío principal de un Data Engineer, cuya tarea es
preparar un sistema que permita obtener estos datos, ejecutar un proceso de limpieza
sobre ellos, y colocarlos en un repositorio centralizado, ya sea en forma de Data Lake
o Data Warehouse, o algún otro parecido, para que puedan ser utilizados por procesos
de inteligencia o análisis.
Considerando lo anterior, este trabajo profesional explora la posibilidad de crear
un repositorio centralizado, con capacidad de generar un formato accesible, de datos
músicales obtenidos de fuentes MIDI, para facilitar el análisis y determinación de patrones
que comparten varias composiciones que se puedan clasificar bajo un conjunto
de categorías distintas.
(A)