Publicación:
Clasificación de exoplanetas utilizando modelos de machine learning

dc.contributor.authorRascón Calderón, Luis Fernando
dc.contributor.educationalvalidatorAlvarez Massis, Eduardo Martín
dc.date.accessioned2025-11-04T21:31:16Z
dc.date.issued2025
dc.descriptionFormato PDF digital — 38 páginas — incluye gráficos, tablas y referencias bibliográficas.
dc.description.abstractEn el presente trabajo se aborda el entrenamiento de algoritmos de machine learning para la clasificación de exoplanetas en cuatro tipos: Terrestres, Súper Tierras, Neptunianos y Gigantes Gaseosos. Los datos empleados fueron extraídos del NASA Exoplanet Catalog y del NASA Exoplanet Archive. Los algoritmos utilizados fueron XGBoost, Árbol de Decisión, Random Forest y K-Nearest Neighbors. Tras la preparación de la base de datos y el entrenamiento de los modelos, se procedió a su evaluación. Los métodos basados en árboles de decisión mostraron el mejor desempeño, siendo XGBoost el mejor con un F1-score promedio de 0.9822 (desviación estándar: 0.0087) en 10 iteraciones. Todos los modelos presentaron dificultades al distinguir entre Súper Tierras y Neptunianos. El algoritmo K-Nearest Neighbors obtuvo el rendimiento más bajo (f1 − score promedio de 0.8100 y desviación estándar de 0.395), atribuible al desequilibrio de clases en la base de datos, es decir, la proporción de exoplanetas Terrestres es notablemente menor a la del resto de clasificaciones. Los métodos basados en árboles identificaron la masa y el radio planetario como las variables más relevantes, dicho resultado es apoyado por la literatura al buscar caracterizar exoplanetas. Como oportunidades de profundización, se propone explorar una mayor cantidad de hiperparámetros para cada algoritmo e investigar variantes de K-Nearest Neighbors adaptadas a conjuntos de datos desbalanceados.spa
dc.description.abstractThis work addresses the training of machine learning algorithms for the classification of exo planets into four categories: Terrestrial, Super-Earths, Neptunian, and Gas Giants. The data were obtained from the NASA Exoplanet Catalog and the NASA Exoplanet Archive. The algorithms ap plied were XGBoost, Decision Tree, Random Forest, and K-Nearest Neighbors. After preparing the dataset and training the models, their performance was evaluated. Tree-based methods demonstra ted the best results, with XGBoost achieving the highest performance, reaching an average F1-score of 0.9822 (standard deviation: 0.0087) across 10 iterations. All models showed difficulties in distin guishing between Super-Earths and Neptunians. The K-Nearest Neighbors algorithm obtained the lowest performance (average f1-score of 0.8100 and standard deviation of 0.395), mainly due to class imbalance in the dataset, since the proportion of Terrestrial exoplanets is notably smaller than that of the other categories. Tree-based methods identified planetary mass and radius as the most relevant variables, a result consistent with the literature on exoplanet characterization. As future work, it is proposed exploring a wider range of hyperparameters for each algorithm and investigating variants of K-Nearest Neighbors adapted to imbalanced datasetseng
dc.description.degreelevelPregrado
dc.description.degreenameLicenciado en Física
dc.format.extent38 p.
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://repositorio.uvg.edu.gt/handle/123456789/6233
dc.language.isospa
dc.publisherUniversidad del Valle de Guatemala
dc.publisher.branchCampus Central
dc.publisher.facultyFacultad de Ciencias y Humanidades
dc.publisher.placeGuatemala
dc.publisher.programLicenciatura en Física
dc.relation.referencesALMA, Andrews, S., & Dagnello, S. (n.d.). Twenty Protoplanetary Disks Imaged by ALMA. https: //public.nrao.edu/gallery/twenty-protoplanetary-disks-imaged-by-alma/.
dc.relation.referencesBarboza, A., & Ulmer-Moll, S. (2020). Classifying Exoplanets with Machine Learning. h t t p s : //presentations.copernicus.org/EPSC2020/EPSC2020_833_presentation.pdf.
dc.relation.referencesBhuva, L. (2025). Understanding Feature Importance in Machine Learning. understanding-feature importance.
dc.relation.referencesClayton, G., Manry, B., & Rafiqi, S. (2019). Machine Learning Pipeline for Exoplanet Classification. scholar.smu.edu/cgi/viewcontent.cgi?article=1070.
dc.relation.referencesCodecademy. (2025). Feature importance. https://www.codecademy.com/article/fe-feature-i mportance-final.
dc.relation.referencesDalianis, H. (2018). Evaluation Metrics and Evaluation. https://www.researchgate.net/publi cation/325122648_Evaluation_Metrics_and_Evaluation.
dc.relation.referencesEuropean Space Agency. (2019). Exoplanet Detection Methods. sci.esa.int/web/exoplanets/-/60655- detection-methods.
dc.relation.referencesGonzáles, J. (2021). Algoritmos de Aprendizaje Supervisado en la Clasificación de Exoplanetas en Python. http://repositorio.uan.edu.co/handle/123456789/5839
dc.relation.referencesNASA Visualization Studio. (2018). Exoplanet Transit Animation. https://svs.gsfc.nasa.gov/ 13022.
dc.relation.referencesOptical Gravitational Lensing Experiment. (n.d.). First Detection of an Extrasolar Planet with Microlensing. https://ogle.astrouw.edu.pl/cont/4_ma
dc.relation.referencesSeager, S., Kuchner, M., Hier-Majumder, C. A., & Militzer, B. (2007). Mass-Radius relationships for solid exoplanets. https://iopscience.iop.org/article/10.1086/521346/pdf.
dc.relation.referencesThe Planetary Society. (n.d.). Color-Shifting Stars: The Radial-Velocity Method. https://www.pl anetary.org/articles/color-shifting-stars-the-radial-velocity-method.
dc.relation.referencesThe Planetary Society. (n.d.). Space-Warping Planets: The Microlensing Method. https://www.pl anetary.org/articles/space-warping-planets-the-microlensing-method.
dc.relation.referencesThe Planetary Society. (n.d.). Timing Variations. planetary.org/articles/timing-variations.
dc.relation.referencesYang, Y. (2020). Intelligent System and Computing. books.google.com/books?id=RmH9DwAAQBAJ.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.armarcEspacio
dc.subject.armarcPlanets
dc.subject.armarcPlanetas
dc.subject.armarcAstronomía
dc.subject.armarcExtrasolar planets
dc.subject.armarcAlgoritmos (Computadores)
dc.subject.armarcControladores programables
dc.subject.ddc520 - Astronomía y ciencias afines::523 - Cuerpos y fenómenos celestes específicos
dc.subject.ocde1. Ciencias Naturales
dc.subject.odsODS 9: Industria, innovación e infraestructura. Construir infraestructuras resilientes, promover la industrialización inclusiva y sostenible y fomentar la innovación
dc.titleClasificación de exoplanetas utilizando modelos de machine learning
dc.title.translatedClassification of exoplanets using machine learning models
dc.typeTrabajo de grado - Pregrado
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersion
dc.type.visibilityPublic Thesis
dspace.entity.typePublication

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Luis Fernando Rascón Calderón.pdf
Tamaño:
4.26 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
14.49 KB
Formato:
Item-specific license agreed upon to submission
Descripción:

Colecciones