Modelo de predicción en el dominio del cuidado de la salud pública basados en conjuntos de datos de acceso abierto enriquecidos semánticamente

Barrientos Martinez, Armando

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Puebla

Instituto Tecnológico Superior de Teziutlán

Maestría en Sistemas Computacionales

Please use this identifier to cite or link to this item: https://rinacional.tecnm.mx/jspui/handle/TecNM/7429

Full metadata record

DC Field	Value	Language
dc.contributor.author	Barrientos Martinez, Armando	-
dc.creator	Barrientos Martinez, Armando%1190151	-
dc.date.accessioned	2024-04-08T21:29:10Z	-
dc.date.available	2024-04-08T21:29:10Z	-
dc.date.issued	2023-08-01	-
dc.identifier.uri	https://rinacional.tecnm.mx/jspui/handle/TecNM/7429	-
dc.description	Tradicionalmente, la minería de datos en salud pública no integra el conocimiento del dominio, ya que se centra en procesos impulsados por datos. En el contexto de la infección por SARS-CoV-2, se emplean modelos de aprendizaje automático para tareas como la predicción de mortalidad o la predicción de la necesidad de ventilación. Estos modelos utilizan variables relacionadas con los resultados de pruebas, comorbilidades, entre otros. Los trabajos previos sobre selección de características apenas incorporan fuentes complementarias y heterogéneas de conocimiento del dominio, como ontologías y grafos, para guiar procesos de toma de decisiones basados en el conocimiento experto. No obstante, esta integración sería intuitiva y potencialmente beneficiosa, dado que la selección de características influye significativamente en el rendimiento de los modelos predictivos (Gao et al., 2022), (Kuhn & Johnson, 2013). El objetivo de este trabajo de tesis es proponer una alternativa para la selección de características utilizando la Eliminación de Características Recursivas (RFE, por sus siglas en inglés) en la construcción de modelos de predicción de mortalidad basados en datos históricos abiertos del Gobierno Mexicano sobre casos de COVID-19. A diferencia de trabajos anteriores, esta propuesta se basa en una métrica ampliamente validada para la similitud semántica taxonómica basada en ontologías (Blanco-Fernández et al., 2007) y en un proceso de anotación semántica manual que no requiere la implementación de técnicas de procesamiento de lenguaje natural. Se implementó una metodología para el enriquecimiento semántico de conjuntos de datos, que consta de cuatro etapas: (1) selección de ontología del dominio, (2) anotación semántica de variables, (3) cálculo de similitudes semánticas y (4) refinamiento de la selección de características basada en RFE. La principal contribución consiste en dos estrategias que permiten ampliar o filtrar las características seleccionadas inicialmente al considerar la relación semántica entre 10 las variables predictoras y la variable objetivo, basada en un umbral establecido por el analista de datos.	es_MX
dc.language.iso	spa	es_MX
dc.publisher	Tecnológico Nacional de México	es_MX
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0	es_MX
dc.subject	info:eu-repo/classification/cti/7	es_MX
dc.subject.other	minería de datos	es_MX
dc.subject.other	salud	es_MX
dc.subject.other	SARS-CoV-2	es_MX
dc.subject.other	características recursivas	es_MX
dc.subject.other	predicción de mortalidad	es_MX
dc.subject.other	COVID-19	es_MX
dc.title	Modelo de predicción en el dominio del cuidado de la salud pública basados en conjuntos de datos de acceso abierto enriquecidos semánticamente	es_MX
dc.type	info:eu-repo/semantics/masterThesis	es_MX
dc.contributor.director	Colombo Mendoza, Luis Omar%376959	-
dc.folio	MSC-TSI-21TE0020P	es_MX
dc.rights.access	info:eu-repo/semantics/openAccess	es_MX
dc.publisher.tecnm	Instituto Tecnológico Superior de Teziutlán	es_MX
Appears in Collections:	Maestría en Sistemas Computacionales

Files in This Item:

File	Description	Size	Format
Tesis de Maestría#Barrientos Martínez Armando.pdf		2.28 MB	Adobe PDF	View/Open
Licencia de Uso#Barrientos Martínez Armando.pdf		412.09 kB	Adobe PDF	View/Open

This item is protected by original copyright

Show simple item record

This item is licensed under a Creative Commons License

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM) Tesis de Posgrado Puebla Instituto Tecnológico Superior de Teziutlán Maestría en Sistemas Computacionales

Repositorio Institucional del Tecnológico Nacional de México (RI - TecNM)

Tesis de Posgrado

Puebla

Instituto Tecnológico Superior de Teziutlán

Maestría en Sistemas Computacionales