Detección de posible fraude por proveedores en reclamos de salud.

Jo Escobar, José Javier

Universidad del Valle de Guatemala
→
Campus Central
→
Facultad de Ingeniería
→
Licenciatura en Ingeniería en Ciencia de la Computación y Tecnologías de la Información
→
Tesis - Ingeniería en Ciencia de la Computación y Tecnologías de la información
→
View Item

dc.contributor.author	Jo Escobar, José Javier
dc.date.accessioned	2021-04-05T14:51:11Z
dc.date.available	2021-04-05T14:51:11Z
dc.date.issued	2020
dc.identifier.uri	https://repositorio.uvg.edu.gt/handle/123456789/3884
dc.description	Tesis. Licenciatura en Ingeniería en Ciencia de la Computación y Tecnologías de la Información. Facultad de Ingeniería (61 p.).	en_US
dc.description.abstract	Conforme pasa el tiempo, en EE.UU. los avances en tecnología y ciencias médicas mejoran la calidad de vida de la población. Esto implica la necesidad de programas como Medicare que ayuden en la administración de los altos costos asociados a la atención médica de calidad. Su problemática es la existencia de personas que cometen fraude para beneficio personal, lo que reduce la cobertura de Medicare para satisfacer de manera efectiva las necesidades de atención médica de la población que califica. En busca de reducir el fraude, los Centros de Servicios de Medicare y Medicaid (CMS) compartieron conjuntos de datos que abarcan diferentes partes del programa Medicare. En esta investigación, nos enfocamos en la implementación de machine learning para la detección de posible fraude por proveedores en reclamos de salud de Medicare. Para ello se utilizó el conjunto de datos DE-SynPUF de CMS que contiene: (1) Listado de beneficiarios del 2008 de Medicare, (2) Reclamos realizados por beneficiarios hospitalizados de 2008 al 2010, (3) Reclamos realizados por beneficiarios ambulatorios de 2008 al 2010. Además, se creó un cuarto conjunto de datos que es la combinación de los tres conjuntos de datos mencionados. Se realizó minería de datos en los cuatro conjuntos y el etiquetado de fraude de proveedores del mundo real utilizando la Lista de Personas y Entidades Excluidas (LEIE) de la Oficina de Inspectoría General. El resultado de la preparación de los datos fue utilizado para la creación y evaluación de cuatro algoritmos de machine learning. Estos fueron evaluados con base a la exactitud, puntuación f1 y puntuación AUROC. Los algoritmos supervisados utilizaron cómo entrenamiento el conjunto de datos combinado con su etiquetado de fraude a diferencia de los no supervisados que utilizaron únicamente reclamos no fraudulentos. Los resultados finales de la investigación muestran que el algoritmo de regresión logística (LR) tuvo un desempeño consistente en la detección de posible fraude con una exactitud de 0.90, una puntuación AUROC 0.80 y una puntuación F1 0.59. Por lo tanto, dados los resultados se sugiere utilizar el conjunto de datos combinado para detectar comportamientos fraudulentos por proveedores de Medicare. También se recomienda agregar más registros fraudulentos en el entrenamiento para mejorar la precisión de predicción.	en_US
dc.language.iso	es	en_US
dc.publisher	Universidad del Valle de Guatemala	en_US
dc.title	Detección de posible fraude por proveedores en reclamos de salud.	en_US
dc.type	Thesis	en_US