Por favor, use este identificador para citar o enlazar este ítem: https://rinacional.tecnm.mx/jspui/handle/TecNM/7429
Título : Modelo de predicción en el dominio del cuidado de la salud pública
Autor : Barrientos Martinez, Armando
metadata.dc.subject.other: minería de datos
salud
SARS-CoV-2
características recursivas
predicción de mortalidad
COVID-19
Fecha de publicación : 2023-08-01
Editorial : Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Instituto Tecnológico Superior de Teziutlán
Descripción : Tradicionalmente, la minería de datos en salud pública no integra el conocimiento del dominio, ya que se centra en procesos impulsados por datos. En el contexto de la infección por SARS-CoV-2, se emplean modelos de aprendizaje automático para tareas como la predicción de mortalidad o la predicción de la necesidad de ventilación. Estos modelos utilizan variables relacionadas con los resultados de pruebas, comorbilidades, entre otros. Los trabajos previos sobre selección de características apenas incorporan fuentes complementarias y heterogéneas de conocimiento del dominio, como ontologías y grafos, para guiar procesos de toma de decisiones basados en el conocimiento experto. No obstante, esta integración sería intuitiva y potencialmente beneficiosa, dado que la selección de características influye significativamente en el rendimiento de los modelos predictivos (Gao et al., 2022), (Kuhn & Johnson, 2013). El objetivo de este trabajo de tesis es proponer una alternativa para la selección de características utilizando la Eliminación de Características Recursivas (RFE, por sus siglas en inglés) en la construcción de modelos de predicción de mortalidad basados en datos históricos abiertos del Gobierno Mexicano sobre casos de COVID-19. A diferencia de trabajos anteriores, esta propuesta se basa en una métrica ampliamente validada para la similitud semántica taxonómica basada en ontologías (Blanco-Fernández et al., 2007) y en un proceso de anotación semántica manual que no requiere la implementación de técnicas de procesamiento de lenguaje natural. Se implementó una metodología para el enriquecimiento semántico de conjuntos de datos, que consta de cuatro etapas: (1) selección de ontología del dominio, (2) anotación semántica de variables, (3) cálculo de similitudes semánticas y (4) refinamiento de la selección de características basada en RFE. La principal contribución consiste en dos estrategias que permiten ampliar o filtrar las características seleccionadas inicialmente al considerar la relación semántica entre 10 las variables predictoras y la variable objetivo, basada en un umbral establecido por el analista de datos.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Aparece en las colecciones: Maestría en Sistemas Computacionales

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis de Maestría#Aguilar Tirado Adrián.pdfTesis3.98 MBAdobe PDFVisualizar/Abrir
Licencia de Uso#Aguilar Tirado Adrián.pdf
  Until 9999-03-15
Licencia404.85 kBAdobe PDFVisualizar/Abrir  Request a copy


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons