dc.description.abstract |
Conforme pasa el tiempo, en EE.UU. los avances en tecnología y ciencias médicas mejoran la calidad de vida de la población. Esto implica la necesidad de programas como
Medicare que ayuden en la administración de los altos costos asociados a la atención médica de calidad. Su problemática es la existencia de personas que cometen fraude para beneficio personal, lo que reduce la cobertura de Medicare para satisfacer de manera efectiva las necesidades de atención médica de la población que califica. En busca de reducir el fraude, los Centros de Servicios de Medicare y Medicaid (CMS) compartieron conjuntos de datos que abarcan diferentes partes del programa Medicare. En esta investigación, nos enfocamos en la implementación de machine learning para la detección de posible fraude por proveedores en reclamos de salud de Medicare. Para ello se utilizó el conjunto de datos DE-SynPUF de CMS que contiene: (1) Listado de beneficiarios del 2008 de Medicare, (2) Reclamos realizados por beneficiarios hospitalizados de 2008 al 2010, (3) Reclamos realizados por beneficiarios ambulatorios de 2008 al 2010. Además, se creó un cuarto conjunto de datos que es la combinación de los tres conjuntos de datos mencionados. Se realizó minería de datos en los cuatro conjuntos y el etiquetado de fraude de proveedores del mundo real utilizando la Lista de
Personas y Entidades Excluidas (LEIE) de la Oficina de Inspectoría General. El resultado de la preparación de los datos fue utilizado para la creación y evaluación de cuatro algoritmos de machine learning. Estos fueron evaluados con base a la exactitud, puntuación f1 y puntuación AUROC. Los algoritmos supervisados utilizaron cómo entrenamiento el conjunto de datos combinado con su etiquetado de fraude a diferencia de los no supervisados que utilizaron únicamente reclamos no fraudulentos. Los resultados finales de la investigación muestran que el algoritmo de regresión logística (LR) tuvo un desempeño consistente en la detección de posible fraude con una exactitud de 0.90, una puntuación AUROC 0.80 y una puntuación F1 0.59. Por lo tanto, dados los resultados se sugiere utilizar el conjunto de datos combinado para detectar comportamientos fraudulentos por proveedores de Medicare.
También se recomienda agregar más registros fraudulentos en el entrenamiento para mejorar la precisión de predicción. |
en_US |