Publicación: Evaluación de modelos de machine learning para pronóstico de precipitación de corto plazo en Guatemala
| dc.contributor.author | Solórzano Quintana, Isaac | |
| dc.contributor.educationalvalidator | Rodríguez Aldana, Jorge Alejandro | |
| dc.date.accessioned | 2025-10-30T18:58:45Z | |
| dc.date.issued | 2025 | |
| dc.description | Formato PDF digital — 100 páginas — incluye gráficos, tablas y referencias bibliográficas. | |
| dc.description.abstract | Esta investigación se centra en la evaluación de diferentes modelos de machine learning para el pronóstico de la precipitación en Guatemala con un día de anticipación. Se desarrollan modelos de clasificación de lluvia binaria para predecir la ocurrencia de lluvia y modelos basados en percentiles para estimar su intensidad en comparación con registros pasados. Además, se construyen modelos de regresión para pronosticar la anomalía absoluta de precipitación respecto del promedio climatológico. El entrenamiento de los modelos se realiza con la base de datos meteorológicos proporcionada por el Instituto Nacional de Sismología, Vulcanología, Meteorología e Hidrología (INSIVUMEH). Cada modelo es sometido a tres evaluaciones: con datos de la época seca, de la época lluviosa y del año completo (evaluación general). El rendimiento de los modelos de machine learning es comparado con el del modelo numérico Weather Research and Forecasting (WRF), utilizado actualmente por INSIVUMEH en el pronóstico de precipitación diaria. Los resultados muestran que la exactitud general se encuentra entre el 26 % y el 65 % para los modelos de percentiles y entre el 55 % y el 75 % para los modelos de lluvia binaria. Los modelos de regresión presentaron un MAE entre 5.14 mm y 6.50 mm al ser evaluados con datos de todo el año. El 23 % de los modelos de lluvia binaria y el 96 % de los modelos de regresión superaron los resultados de evaluación general de WRF, mientras que los modelos de percentiles obtuvieron resultados por debajo del modelo de referencia en esta misma evaluación. Las mejores combinaciones de parámetros para los modelos de clasificación resultaron ser bosque aleatorio y XGBoost con 100 árboles de decisión, y para los modelos de regresión fueron la regresión lineal múltiple y la regresión polinomial. No se observó un cambio relevante al implementar las diferentes combinaciones de variables y número de días en el rango de observación que se utilizan como predictores. En general, el rendimiento durante la época seca fue mejor en comparación con la época lluviosa, debido a la diferencia de la variabilidad de precipitación entre ambas épocas. | spa |
| dc.description.abstract | This research focuses on the evaluation of different machine learning models for forecasting precipitation in Guatemala one day in advance. Binary rainfall classification models were developed to predict the occurrence of rain, and percentile-based models were implemented to estimate its intensity in comparison with past records. In addition, regression models were built to forecast the absolute precipitation anomaly relative to the climatological average. The training of the models was conducted using meteorological data provided by the National Institute of Seismology, Volcanology, Meteorology, and Hydrology (INSIVUMEH). Each model was evaluated under three scenarios: using data from the dry season, the rainy season, and the entire year (general evaluation). The performance of the machine learning models was compared with that of the numerical Weather Research and Forecasting (WRF) model, which is currently used by INSIVUMEH for daily precipitation forecasting. The results show that overall accuracy ranged between 26% and 65% for percentile models and between 55% and 75% for binary rainfall models. The regression models achieved a Mean Absolute Error (MAE) between 5.14 mm and 6.50 mm when evaluated with data from the entire year. Twenty-three percent of the binary rainfall models and ninety-six percent of the regression models outperformed the general evaluation results of the WRF model, while the percentile models performed below the reference model in this same evaluation. The best parameter combinations for the classification models were Random Forest and XGBoost with 100 decision trees, while for regression models, multiple linear regression and polynomial regression performed best. No significant changes were observed when implementing different combinations of variables and numbers of observation days used as predictors. Overall, performance during the dry season was better compared to the rainy season, due to the difference in precipitation variability between both periods. | eng |
| dc.description.degreelevel | Pregrado | |
| dc.description.degreename | Licenciado en Física | |
| dc.format.extent | 100 p. | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.uri | https://repositorio.uvg.edu.gt/handle/123456789/6198 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad del Valle de Guatemala | |
| dc.publisher.branch | Campus Central | |
| dc.publisher.faculty | Facultad de Ciencias y Humanidades | |
| dc.publisher.place | Guatemala | |
| dc.publisher.program | Licenciatura en Física | |
| dc.relation.references | Anderson, D., Sweeney, D., y Williams, T. (2012). Estadística para negocios y economía (11.a ed.). Cengage Learning. | |
| dc.relation.references | Argueta, P. (2024). Climatología [Accedido el 13 de febrero de 2025]. https://insivumeh.gob.gt/?p= 92918 | |
| dc.relation.references | Bochenek, B., y Ustrnul, Z. (2022). Machine Learning in Weather Prediction and Climate Analy ses—Applications and Perspectives. Atmosphere 13(2), 180. https : / / doi . org / 10 . 3390 / atmos13020180 | |
| dc.relation.references | Collins, S., James, R., Ray, P., Chen, K., Lassman, A., y Brownlee, J. (2013). Grids in Numerical Weather and Climate Models. Climate Change and Regional/Local Responses (pp. 125-145). Springer. https://doi.org/10.5772/55922 | |
| dc.relation.references | CONRED. (2024b). Protocolo específico de lluvias en la república de Guatemala 2024. https: / / conred.gob.gt/wp-content/uploads/Protocolo_Operativo_Lluvias_2024234-1.pdf | |
| dc.relation.references | Davis, R., Hayden, B., Gay, D., Phillips, W., y Jones, G. (1997). The North Atlantic Subtropical Anticyclone. Journal of Climate. https:// doi.org/10.1175/1520 - 0442(1997 )010<0728: TNASA>2.0.CO;2 | |
| dc.relation.references | Elbasheer, M. E. E. E., Corzo, G. A., Solomatine, D., y Varouchakis, E. (2023). Machine Learning and Committee Models for Improving ECMWF Subseasonal to Seasonal (S2S) Precipitation | |
| dc.relation.references | Forecast. Hydrol. Earth Syst. Sci. https://doi.org/10.5194/hess-2022-348 | |
| dc.relation.references | Grazzini, F., Dorrington, J., Grams, C., Craig, G., Magnusson, L., y Vitart, F. (2024). Improving forecast of precipitation extremes over northern and central Italy using machine learning. Quarterly Journal of the Royal Meteorological Society, 2024;1–15. https://doi.org/10.1002/ qj.4755 | |
| dc.relation.references | Harrington, P. (2012). Machine learning in action. Manning Publications Co. | |
| dc.relation.references | INSIVUMEH. (2023). Boletín de Aplicaciones Climáticas. Septiembre 2023 [Accedido el 13 de febrero de 2025]. https://insivumeh.gob.gt/wp-content/uploads/2023/09/Aplicaciones-ClimaticasBAC-202309.pdf | |
| dc.relation.references | INSIVUMEH. (2025). Pronóstico Estacional Flexible de Precipitación NextGen (3 meses) [Accedido el 13 de febrero de 2025]. http:// dl.insivumeh.gob.gt/maproom/Cuarto_Mapas_ Climatologia/Pronostico/NextGen_Precip_3m.html | |
| dc.relation.references | Instituto Nacional de Estadística (INE). (2019). Resultados del Censo 2018. Documentación y manuales. https://censo20 | |
| dc.relation.references | Ixcamparij, C. (2025). Pronóstico WRF-BMJ GFS (Extendido A 15 Días) [Accedido el 31 de enero de 2025]. https://insivumeh.gob.gt/?p=5313 | |
| dc.relation.references | Knievel, J. (2006). Numerical Weather Prediction (NWP) and the WRF Model. ATEC Forecasters’ Conference. | |
| dc.relation.references | Ko, C-M, Jeong, YY, Lee, Y-M y Kim, B-S. (2020). The Development of a Quantitative Precipitation Forecast Correction Technique Based on Machine Learning for Hydrological Applications. Atmosphere 2020, 11(1), 111. https://doi.org/10.3390/atmos11010111 | |
| dc.relation.references | Lam, R., Sanchez-Gonzalez, A., Willson, M., Wirnsberger, P., Fortunato, M., Alet, F., Ravuri, S., Ewalds, T., Eaton-Rosen, Z., Hu, W., Merose, A., Hoyer, S., Holland, G., Vinyals, O., Stott, J., Pritzel, A., Mohamed, S., y Battaglia, P. (2023). GraphCast: learning skillful medium range global weather forecasting. Arxiv. https://doi.org/10.48550/arXiv.2212.12794 | |
| dc.relation.references | Maldonado, T. (2016). Inter-annual variability of rainfall in Central America: Connection with global and regional climate modulators. Uppsala University. Marroquín, P. (2023). Análisis de predictibilidad en el sistema dinámico caótico del péndulo magné tico mediante la aplicación de modelos de aprendizaje automático. Universidad del Valle de Guatemala. | |
| dc.relation.references | Pu, Z., y Kalnay, E. (2018). Numerical Weather Prediction Basics: Models, Numerical Methods, and Data Assimilation. In: Duan, Q., Pappenberger, F., Thielen, J., Wood, A., Cloke, H., Schaake, J. (eds) Handbook of Hydrometeorological Ensemble Forecasting. Springer. https: //doi.org/10.1007/978-3-642-40457-3_11-1 | |
| dc.relation.references | Raschka, S., Liu, Y., y Mirjalili, V. (2022). Machine learning with pytorch and scikit-learn: develop machine learning and deep learning models with python. Packt Publishing. | |
| dc.relation.references | Rebala, G., Ravi, A., y Churiwala, S. (2019). An Introduction to Machine Learning (1.a ed.). Springer Nature. | |
| dc.relation.references | The COMET Program. (2015). NWP Essentials: Structure and Dynamics. Media Gallery [Accedido el 12 de febrero de 2025]. https://lyqx.sinaapp.com/wfiles/mstructure_dynamics/media_ gallery.php.htm | |
| dc.relation.references | Turner, J. (2021). Colombia, Guatemala adopt ENACTS Climate Data Initiative [Accedido el 13 de febrero de 2025]. https://iri.columbia.edu/news/colombia-guatemala-adopt-enacts-climate data-initiative/ Vaidya, S., y Singh, S. (1999). Applying the Betts-Miller-Janjic Scheme of Convection in Prediction of the Inidian Monsoon. Weather and Forecasting 15(3):349-356. https://doi.org/10.1175/ 1520-0434(2000)015<0349:ATBMJS>2.0.CO;2 | |
| dc.relation.references | Vaidya, S., y Singh, S. (1999). Applying the Betts-Miller-Janjic Scheme of Convection in Prediction of the Inidian Monsoon. Weather and Forecasting 15(3):349-356. https://doi.org/10.1175/ 1520-0434(2000)015<0349:ATBMJS>2.0.CO;2 | |
| dc.relation.references | Wallace, J., y Hobbs, P. (2006). Atmospheric science: an introduction survey (2.a ed.). Elsevier Inc. | |
| dc.relation.references | Wang, C., y Enfield, D. (2006). Influences of the Atlantic Warm Pool on Western Hemisphere Summer Rainfall and Atlantic Hurricanes. Journal of Climate. https://doi.org/10.1175/JCLI3770.1 | |
| dc.relation.references | Waqas, M., Wannasingha, U., Chueasa, B., y Wangwongchai, A. (2024). Artificial intelligence and numerical weather prediction models: A technical survey. Natural Hazards Research. https: //doi.org/10.1016/j.nhres.2024.11.004 | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.armarc | Hidrometría | |
| dc.subject.armarc | Machine learning | |
| dc.subject.armarc | Precipitación pluvial | |
| dc.subject.armarc | Pronóstico del tiempo | |
| dc.subject.armarc | Precipitation (Meteorology) | |
| dc.subject.armarc | Weather forecasting -- Guatemala | |
| dc.subject.ddc | 550 - Ciencias de la tierra::551 - Geología, hidrología, meteorología | |
| dc.subject.ocde | 1. Ciencias Naturales | |
| dc.subject.ods | ODS 13: Acción por el Clima. Adoptar medidas urgentes para combatir el cambio climático y sus efectos | |
| dc.title | Evaluación de modelos de machine learning para pronóstico de precipitación de corto plazo en Guatemala | |
| dc.title.translated | Evaluation of machine learning models for short-term precipitation forecasting in Guatemala | |
| dc.type | Trabajo de grado - Pregrado | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.version | info:eu-repo/semantics/publishedVersion | |
| dc.type.visibility | Public Thesis | |
| dspace.entity.type | Publication |
