Modelo de predicción en el dominio del cuidado de la salud pública basados en conjuntos de datos de acceso abierto enriquecidos semánticamente

Barrientos Martinez, Armando

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Puebla

Instituto Tecnológico Superior de Teziutlán

Maestría en Sistemas Computacionales

Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/7429

Title:	Modelo de predicción en el dominio del cuidado de la salud pública basados en conjuntos de datos de acceso abierto enriquecidos semánticamente
Authors:	Barrientos Martinez, Armando
metadata.dc.subject.other:	minería de datos salud SARS-CoV-2 características recursivas predicción de mortalidad COVID-19
Issue Date:	2023-08-01
Publisher:	Tecnológico Nacional de México
metadata.dc.publisher.tecnm:	Instituto Tecnológico Superior de Teziutlán
Description:	Tradicionalmente, la minería de datos en salud pública no integra el conocimiento del dominio, ya que se centra en procesos impulsados por datos. En el contexto de la infección por SARS-CoV-2, se emplean modelos de aprendizaje automático para tareas como la predicción de mortalidad o la predicción de la necesidad de ventilación. Estos modelos utilizan variables relacionadas con los resultados de pruebas, comorbilidades, entre otros. Los trabajos previos sobre selección de características apenas incorporan fuentes complementarias y heterogéneas de conocimiento del dominio, como ontologías y grafos, para guiar procesos de toma de decisiones basados en el conocimiento experto. No obstante, esta integración sería intuitiva y potencialmente beneficiosa, dado que la selección de características influye significativamente en el rendimiento de los modelos predictivos (Gao et al., 2022), (Kuhn & Johnson, 2013). El objetivo de este trabajo de tesis es proponer una alternativa para la selección de características utilizando la Eliminación de Características Recursivas (RFE, por sus siglas en inglés) en la construcción de modelos de predicción de mortalidad basados en datos históricos abiertos del Gobierno Mexicano sobre casos de COVID-19. A diferencia de trabajos anteriores, esta propuesta se basa en una métrica ampliamente validada para la similitud semántica taxonómica basada en ontologías (Blanco-Fernández et al., 2007) y en un proceso de anotación semántica manual que no requiere la implementación de técnicas de procesamiento de lenguaje natural. Se implementó una metodología para el enriquecimiento semántico de conjuntos de datos, que consta de cuatro etapas: (1) selección de ontología del dominio, (2) anotación semántica de variables, (3) cálculo de similitudes semánticas y (4) refinamiento de la selección de características basada en RFE. La principal contribución consiste en dos estrategias que permiten ampliar o filtrar las características seleccionadas inicialmente al considerar la relación semántica entre 10 las variables predictoras y la variable objetivo, basada en un umbral establecido por el analista de datos.
metadata.dc.type:	info:eu-repo/semantics/masterThesis
Appears in Collections:	Maestría en Sistemas Computacionales

Files in This Item:

File	Description	Size	Format
Tesis de Maestría#Barrientos Martínez Armando.pdf		2.28 MB	Adobe PDF	View/Open
Licencia de Uso#Barrientos Martínez Armando.pdf		412.09 kB	Adobe PDF	View/Open

This item is protected by original copyright

Show full item record

This item is licensed under a Creative Commons License

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM) Tesis de Posgrado Puebla Instituto Tecnológico Superior de Teziutlán Maestría en Sistemas Computacionales

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Puebla

Instituto Tecnológico Superior de Teziutlán

Maestría en Sistemas Computacionales