Tesis Validadas: 2,591

Tesis de Posgrado: 2650

Número de Visitas: contador visitas

Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/7429
Title: Modelo de predicción en el dominio del cuidado de la salud pública
Authors: Barrientos Martinez, Armando
metadata.dc.subject.other: minería de datos
salud
SARS-CoV-2
características recursivas
predicción de mortalidad
COVID-19
Issue Date: 2023-08-01
Publisher: Tecnológico Nacional de México
metadata.dc.publisher.tecnm: Instituto Tecnológico Superior de Teziutlán
Description: Tradicionalmente, la minería de datos en salud pública no integra el conocimiento del dominio, ya que se centra en procesos impulsados por datos. En el contexto de la infección por SARS-CoV-2, se emplean modelos de aprendizaje automático para tareas como la predicción de mortalidad o la predicción de la necesidad de ventilación. Estos modelos utilizan variables relacionadas con los resultados de pruebas, comorbilidades, entre otros. Los trabajos previos sobre selección de características apenas incorporan fuentes complementarias y heterogéneas de conocimiento del dominio, como ontologías y grafos, para guiar procesos de toma de decisiones basados en el conocimiento experto. No obstante, esta integración sería intuitiva y potencialmente beneficiosa, dado que la selección de características influye significativamente en el rendimiento de los modelos predictivos (Gao et al., 2022), (Kuhn & Johnson, 2013). El objetivo de este trabajo de tesis es proponer una alternativa para la selección de características utilizando la Eliminación de Características Recursivas (RFE, por sus siglas en inglés) en la construcción de modelos de predicción de mortalidad basados en datos históricos abiertos del Gobierno Mexicano sobre casos de COVID-19. A diferencia de trabajos anteriores, esta propuesta se basa en una métrica ampliamente validada para la similitud semántica taxonómica basada en ontologías (Blanco-Fernández et al., 2007) y en un proceso de anotación semántica manual que no requiere la implementación de técnicas de procesamiento de lenguaje natural. Se implementó una metodología para el enriquecimiento semántico de conjuntos de datos, que consta de cuatro etapas: (1) selección de ontología del dominio, (2) anotación semántica de variables, (3) cálculo de similitudes semánticas y (4) refinamiento de la selección de características basada en RFE. La principal contribución consiste en dos estrategias que permiten ampliar o filtrar las características seleccionadas inicialmente al considerar la relación semántica entre 10 las variables predictoras y la variable objetivo, basada en un umbral establecido por el analista de datos.
metadata.dc.type: info:eu-repo/semantics/masterThesis
Appears in Collections:Maestría en Sistemas Computacionales

Files in This Item:
File Description SizeFormat 
Tesis de Maestría#Aguilar Tirado Adrián.pdfTesis3.98 MBAdobe PDFView/Open
Licencia de Uso#Aguilar Tirado Adrián.pdf
  Until 9999-03-15
Licencia404.85 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons