Abstract:
El objetivo de este trabajo de investigación es crear un método que permita la interacción
entre el usuario y la inteligencia artificial mediante un micrófono. Para ello, se desarrolló un
programa en Python utilizando las librerías PyAudio, SpeechRecognition, pyttsx3, pydub y
whisper, siendo esta última fundamental para el reconocimiento de voz y la transcripción del
habla a texto. Se logró implementar este método generando un archivo de tipo Waveform
(WAV), que fue leído por la inteligencia artificial, comprobando así su comprensión del habla
del usuario.
Además, se buscó que la inteligencia artificial accediera a datos relevantes de la Universidad
del Valle de Guatemala y su Departamento de Ingeniería Electrónica, Mecatrónica y
Biomédica. Para ello, se utilizó un programa con las librerías LangChain y OpenAI, destacando
LangChain por su capacidad de leer y vectorizar archivos de texto, permitiendo
que el modelo de lenguaje comprendiera el contenido. Esto facilitó el entrenamiento de la
inteligencia artificial para responder preguntas sobre la información relevante.
Finalmente, se implementó un método de reentrenamiento a través de una interfaz amigable,
desarrollada con la librería TKinter. La interfaz consta de un espacio para que el
usuario introduzca información escrita y un botón "terminar"que genera un archivo de texto,
permitiendo a la inteligencia artificial responder preguntas relacionadas con el contenido
ingresado. (LA)