Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/7429
Full metadata record
DC FieldValueLanguage
dc.contributor.authorBarrientos Martinez, Armando-
dc.creatorBarrientos Martinez, Armando%1190151-
dc.date.accessioned2024-04-08T21:29:10Z-
dc.date.available2024-04-08T21:29:10Z-
dc.date.issued2023-08-01-
dc.identifier.urihttps://rinacional.tecnm.mx/jspui/handle/TecNM/7429-
dc.descriptionTradicionalmente, la minería de datos en salud pública no integra el conocimiento del dominio, ya que se centra en procesos impulsados por datos. En el contexto de la infección por SARS-CoV-2, se emplean modelos de aprendizaje automático para tareas como la predicción de mortalidad o la predicción de la necesidad de ventilación. Estos modelos utilizan variables relacionadas con los resultados de pruebas, comorbilidades, entre otros. Los trabajos previos sobre selección de características apenas incorporan fuentes complementarias y heterogéneas de conocimiento del dominio, como ontologías y grafos, para guiar procesos de toma de decisiones basados en el conocimiento experto. No obstante, esta integración sería intuitiva y potencialmente beneficiosa, dado que la selección de características influye significativamente en el rendimiento de los modelos predictivos (Gao et al., 2022), (Kuhn & Johnson, 2013). El objetivo de este trabajo de tesis es proponer una alternativa para la selección de características utilizando la Eliminación de Características Recursivas (RFE, por sus siglas en inglés) en la construcción de modelos de predicción de mortalidad basados en datos históricos abiertos del Gobierno Mexicano sobre casos de COVID-19. A diferencia de trabajos anteriores, esta propuesta se basa en una métrica ampliamente validada para la similitud semántica taxonómica basada en ontologías (Blanco-Fernández et al., 2007) y en un proceso de anotación semántica manual que no requiere la implementación de técnicas de procesamiento de lenguaje natural. Se implementó una metodología para el enriquecimiento semántico de conjuntos de datos, que consta de cuatro etapas: (1) selección de ontología del dominio, (2) anotación semántica de variables, (3) cálculo de similitudes semánticas y (4) refinamiento de la selección de características basada en RFE. La principal contribución consiste en dos estrategias que permiten ampliar o filtrar las características seleccionadas inicialmente al considerar la relación semántica entre 10 las variables predictoras y la variable objetivo, basada en un umbral establecido por el analista de datos.es_MX
dc.language.isospaes_MX
dc.publisherTecnológico Nacional de Méxicoes_MX
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.subjectinfo:eu-repo/classification/cti/7es_MX
dc.subject.otherminería de datoses_MX
dc.subject.othersaludes_MX
dc.subject.otherSARS-CoV-2es_MX
dc.subject.othercaracterísticas recursivases_MX
dc.subject.otherpredicción de mortalidades_MX
dc.subject.otherCOVID-19es_MX
dc.titleModelo de predicción en el dominio del cuidado de la salud públicaes_MX
dc.typeinfo:eu-repo/semantics/masterThesises_MX
dc.contributor.directorColombo Mendoza, Luis Omar%376959-
dc.folioMSC-TSI-21TE0020Pes_MX
dc.rights.accessinfo:eu-repo/semantics/openAccesses_MX
dc.publisher.tecnmInstituto Tecnológico Superior de Teziutlánes_MX
Appears in Collections:Maestría en Sistemas Computacionales

Files in This Item:
File Description SizeFormat 
Tesis de Maestría#Aguilar Tirado Adrián.pdfTesis3.98 MBAdobe PDFView/Open
Licencia de Uso#Aguilar Tirado Adrián.pdf
  Until 9999-03-15
Licencia404.85 kBAdobe PDFView/Open Request a copy


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons