Publicación:
Recolección de datos para el generador de historias con género literario a partir de imágenes utilizando “Computer Vision” y Natural Language Processing.

dc.contributor.authorRamos Maldonado, Oscar Andres
dc.date.accessioned2024-09-18T17:21:13Z
dc.date.available2024-09-18T17:21:13Z
dc.date.issued2023
dc.descriptionTesis. Licenciatura en Ingeniería en Ciencias de la Computación y Tecnologías de la Información. Facultad de Ingeniería (29 p.).en_US
dc.description.abstractEste trabajo de graduación se enfoca en la generación de una metodología que facilite la recolec ción y procesamiento de datos destinados a entrenar un large language model (LLM) para garantizar la calidad y eficacia del modelo resultante y para optimizar el proceso de entrenamiento. Se dio un enfoque principalmente a la recolección inicial de archivos PDF utilizando un web scraper. Con esto se propone un marco de trabajo para la limpieza de datos que abarca desde la detección y eliminación de valores atípicos hasta la generación de reportes sobre las tendencias encontradas en los archivos, lo que mejora su coherencia y cohesión. Por otro lado, se evaluó la calidad de los datos mediante el entrenamiento de un modelo GPT-2 (generative pre-trained transformer) de pequeña escala y comparando los textos generados por el modelo con los datos limpios y el texto extraído directamente de los archivos. Este proyecto contribuye al avance en inteligencia artificial y el procesamiento del lenguaje natural al establecer tanto pautas como buenas prácticas para la recolección y limpieza de datos destinados a entrenar modelos de lenguaje.(LA)en_US
dc.identifier.urihttps://repositorio.uvg.edu.gt/handle/123456789/5640
dc.language.isoesen_US
dc.publisherUniversidad del Valle de Guatemalaen_US
dc.subjectArtificial intelligence -- Data processingen_US
dc.subjectInformation storage and retrieval systemen_US
dc.subjectSistema de almacenamiento y recuperación de informaciónen_US
dc.subjectLiterature -- Artificial intelligence -- Computer programsen_US
dc.subjectInteligencia artificial -- Creación literaria, artística, etc.en_US
dc.subjectLiteratura -- Innovación tecnológicaen_US
dc.subjectArtificial intelligence in literatureen_US
dc.titleRecolección de datos para el generador de historias con género literario a partir de imágenes utilizando “Computer Vision” y Natural Language Processing.en_US
dc.typeTrabajo de grado - Pregradospa
dc.type.visibilityPublic Thesisen_US
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
FECHAS CORRECTAS.pdf
Tamaño:
1.52 MB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción: